Gemini 1.5 Pro گوگل یک مدل هوش مصنوعی جدید و کارآمدتر است
این شرکت آن را به عنوان یک پیشرفت برای درک زمینه طولانی در مدلهای هوش مصنوعی توصیف میکند.
به گزارش اپست به نقل از اینجگت، روز پنجشنبه، گوگل از Gemini 1.5 Pro رونمایی کرد که این شرکت توصیف میکند که عملکردی فوقالعاده بهبود یافته را نسبت به مدل قبلی ارائه میکند. خط سیر هوش مصنوعی این شرکت – که از نظر داخلی به طور فزاینده ای برای آینده آن حیاتی تلقی می شود – پس از رونمایی از Gemini 1.0 Ultra در هفته گذشته، در کنار تغییر نام ربات چت Bard (به Gemini) برای هماهنگی با قابلیت های قدرتمندتر و همه کاره مدل جدید، دنبال می شود.
در یک پست بلاگ اعلامی، ساندار پیچای، مدیرعامل گوگل و دمیس حسابیس، مدیر عامل گوگل دیپمایند، سعی میکنند در حین تبلیغ از قابلیتهای در حال پیشرفت سریع مدلهای خود، تعادلی بین اطمینان مخاطبان خود در مورد ایمنی اخلاقی هوش مصنوعی برقرار کنند. پیچای خلاصه میکند: «تیمهای ما به پیشبردن مرزهای جدیدترین مدلهایمان ادامه میدهند و ایمنی در هسته اصلی آن است.
این شرکت باید بر ایمنی افراد بدبین به هوش مصنوعی (از جمله یکی از مدیران سابق گوگل) و تنظیم کننده های دولتی تاکید کند. اما همچنین باید بر عملکرد شتابدهنده مدلهای خود برای توسعهدهندگان هوش مصنوعی، مشتریان بالقوه و سرمایهگذارانی که نگران هستند شرکت برای واکنش به موفقیتهای OpenAI با ChatGPT بسیار کند باشد، تأکید کند.
Pichai و Hassabis می گویند که Gemini 1.5 Pro نتایج قابل مقایسه با Gemini 1.0 Ultra ارائه می دهد. با این حال، Gemini 1.5 با کاهش نیازهای محاسباتی در آن سطح کارآمدتر عمل می کند. قابلیت های چندوجهی شامل پردازش متن، تصاویر، فیلم ها، صدا یا کد می باشد. با پیشرفت مدلهای هوش مصنوعی، آنها به ارائه مجموعهای از قابلیتهای متنوعتر در یک جعبه سریع ادامه میدهند (نمونه اخیر OpenAI ادغام تولید تصویر DALL-E 3 در ChatGPT بود).
![Gemini 1.5 Pro گوگل یک مدل هوش مصنوعی جدید و کارآمدتر است 1 Gemini 1.5 Pro گوگل یک مدل هوش مصنوعی جدید و کارآمدتر است](https://dl.appest.ir/meta/2024/02/36c40f30-cc2c-11ee-ad5d-f90c2ccc7590.webp)
Google CEO Sundar Pichai
Gemini 1.5 Pro همچنین میتواند تا یک میلیون توکن را مدیریت کند یا واحدهای مدلهای هوش مصنوعی دادهها میتوانند در یک درخواست پردازش شوند. گوگل می گوید Gemini 1.5 Pro می تواند بیش از ۷۰۰۰۰۰ کلمه، یک ساعت ویدئو، ۱۱ ساعت صدا و پایگاه های کد را با بیش از ۳۰۰۰۰ خط کد پردازش کند. این شرکت میگوید حتی نسخهای را با موفقیت آزمایش کرده است که تا ۱۰ میلیون توکن را پشتیبانی میکند.
این شرکت میگوید که Gemini 1.5 Pro زمانی که دادههای جدید بیشتری برای یادگیری داشته باشد، دقت بالایی در پرسوجوها با تعداد توکنهای بزرگتر حفظ میکند. می گوید مدل در ارزیابی Needle In a Haystack تحت تاثیر قرار گرفته است. در این آزمایش، توسعهدهندگان بخش کوچکی از اطلاعات را در یک بلوک متنی طولانی قرار میدهند تا ببینند آیا مدل هوش مصنوعی میتواند آن را انتخاب کند یا خیر. گوگل گفت Gemini 1.5 Pro می تواند متن جاسازی شده را در ۹۹ درصد مواقع در بلوک های داده تا یک میلیون توکن پیدا کند.
گوگل می گوید Gemini 1.5 Pro می تواند درباره جزئیات مختلف از رونوشت های ۴۰۲ صفحه ای ماموریت ماه Apollo 11 استدلال کند. علاوه بر این، میتواند نقاط طرح و رویدادهای یک فیلم صامت آپلود شده ۴۴ دقیقهای با بازی باستر کیتون را تحلیل کند. Hassabis نوشت: “از آنجایی که پنجره زمینه طولانی ۱٫۵ Pro اولین نوع خود در بین مدل های بزرگ است، ما به طور مداوم در حال توسعه ارزیابی ها و معیارهای جدید برای آزمایش قابلیت های جدید آن هستیم.”
گوگل Gemini 1.5 Pro را با قابلیتهای ۱۲۸۰۰۰ توکن راهاندازی میکند، همان عددی که مدلهای GPT-4 OpenAI (اعلام شده عمومی) حداکثر میشوند. Hassabis می گوید گوگل در نهایت سطوح قیمت گذاری جدیدی را معرفی خواهد کرد که حداکثر یک میلیون توکن پرس و جو را پشتیبانی می کنند.
![Gemini 1.5 Pro گوگل یک مدل هوش مصنوعی جدید و کارآمدتر است 2 Gemini 1.5 Pro گوگل یک مدل هوش مصنوعی جدید و کارآمدتر است](https://dl.appest.ir/meta/2024/02/5d2c3670-cc2c-11ee-bfbb-efe52d0b76e4.webp)
Google DeepMind CEO Demis Hassabis
Gemini 1.5 Pro همچنین در یادگیری مهارتهای جدید از اطلاعات در اعلانهای طولانی – بدون تنظیم دقیق اضافی (“یادگیری در زمینه”) ماهر است. در معیاری به نام ترجمه ماشینی از یک کتاب، این مدل یک کتابچه راهنمای دستور زبان را برای Kalamang یاد گرفت، زبانی با کمتر از ۲۰۰ سخنران در سراسر جهان که قبلاً در مورد آن آموزش ندیده بود. این شرکت میگوید که Gemini 1.5 Pro یاد گرفته است که در هنگام ترجمه انگلیسی به کالامنگ، در سطحی مشابه با یک انسان که همان محتوا را یاد میگیرد، عمل کند.
در بخشی از اعلامیه ای که توجه توسعه دهندگان را به خود جلب می کند، گوگل می گوید Gemini 1.5 Pro می تواند وظایف حل مشکل را در بلوک های کد طولانی تر انجام دهد. Hassabis مینویسد: «هنگامی که درخواستی با بیش از ۱۰۰۰۰۰ خط کد به شما داده میشود، بهتر میتواند بین مثالها استدلال کند، تغییرات مفیدی را پیشنهاد کند و توضیحاتی در مورد نحوه عملکرد بخشهای مختلف کد ارائه دهد.
در جنبه اخلاقی و ایمنی، گوگل میگوید که «همان رویکردی را برای استقرار مسئولانه» در نظر میگیرد که در مدلهای Gemini 1.0 اتخاذ کرد. این شامل توسعه و به کارگیری تکنیکهای تیم قرمز است، که در آن گروهی از توسعهدهندگان اخلاقی اساساً به عنوان مدافع شیطان عمل میکنند و «تعدادی از آسیبهای احتمالی» را آزمایش میکنند. علاوه بر این، این شرکت می گوید که به شدت حوزه هایی مانند ایمنی محتوا و آسیب های نمایندگی را مورد بررسی قرار می دهد. این شرکت می گوید که همچنان به توسعه تست های اخلاقی و ایمنی جدید برای ابزارهای هوش مصنوعی خود ادامه می دهد.
گوگل Gemini 1.5 را برای دسترسی زودهنگام برای توسعه دهندگان و مشتریان سازمانی راه اندازی می کند. این شرکت قصد دارد در نهایت آن را به طور گستردهتری در دسترس قرار دهد. Gemini 1.0 در حال حاضر برای مصرف کنندگان در دسترس است، همراه با یک نسخه Pro که هزینه ماهیانه ۲۰ دلار دارد.