پاسخ گوگل به GPT-4 جمینی است: «تواناترین مدلی که تا به حال ساخته ایم»
این شرکت قصد دارد از هوش مصنوعی در پلتفرمهای محصول خود استفاده کند، که از Bard شروع میشود.
به گزارش اپست به نقل از انجگت، جایگاه OpenAI در بالای انبوه هوش مصنوعی مولد ممکن است به پایان برسد زیرا گوگل رسماً در روز چهارشنبه توانمندترین مدل زبان بزرگ خود را با نام Gemini 1.0 معرفی کرد. ساندار پیچای، مدیرعامل این شرکت در یک پست وبلاگ گوگل نوشت: این اولین مدل از «نسل جدیدی از مدلهای هوش مصنوعی است که از نحوه درک و تعامل مردم با جهان الهام گرفته شده است».
از زمان برنامهنویسی هوش مصنوعی برای بازیهای رایانهای در دوران نوجوانی و در طول سالهایی که به عنوان محقق علوم اعصاب تلاش میکردم عملکرد مغز را درک کنم، همیشه بر این باور بودم که اگر بتوانیم ماشینهای هوشمندتر بسازیم، میتوانیم از آنها برای سودمندی بشریت استفاده کنیم. پیچای ادامه داد: راه های باورنکردنی.
نتیجه همکاری گسترده بین بخشهای DeepMind و تحقیقات گوگل، جمینی دارای تمامی زنگها و سوتهایی است که ژنراتورهای پیشرفته ارائه میدهند. پیچای اعلام کرد: «قابلیت های آن تقریباً در هر حوزه ای پیشرفته است.
این سیستم از ابتدا به عنوان یک هوش مصنوعی چندوجهی یکپارچه توسعه یافته است. بسیاری از مدلهای پایه میتوانند اساساً شامل گروههایی از مدلهای کوچکتر باشند که همگی در یک پوشش سنگی چیده شدهاند، با هر مدل جداگانه برای انجام عملکرد خاص خود به عنوان بخشی از کل بزرگتر. همه اینها برای عملکردهای کم عمق مانند توصیف تصاویر خوب و خوب است، اما برای کارهای استدلالی پیچیده چندان خوب نیست.
پیچای گفت، گوگل، برعکس، Gemini را از قبل آموزش داده و به دقت تنظیم کرده است، “از ابتدا بر روی روش های مختلف” به آن اجازه می دهد “به طور یکپارچه انواع ورودی ها را از ابتدا درک کند و درباره آنها استدلال کند، بسیار بهتر از مدل های چندوجهی موجود”. توانایی دریافت همه این اشکال دادهها بهطور همزمان باید به Gemini کمک کند تا در موضوعات چالشبرانگیزتر، مانند فیزیک، پاسخهای بهتری ارائه دهد.
Gemini همچنین می تواند کدنویسی کند. گزارش شده است که در زبان های برنامه نویسی محبوب از جمله Python، Java، C++ و Go مهارت دارد. گوگل حتی از یک نسخه تخصصی Gemini برای ایجاد AlphaCode 2 استفاده کرده است، که جانشینی برنده رقابت های GenerativeAI در سال گذشته است. به گفته این شرکت، AlphaCode 2 دو برابر سوالات چالشی قبلی خود را حل کرده است، که عملکرد آن را بالاتر از ۸۵ درصد شرکت کنندگان در مسابقه قبلی قرار می دهد.
در حالی که گوگل فوراً تعداد پارامترهایی را که Gemini میتواند استفاده کند به اشتراک نمیگذارد، این شرکت انعطافپذیری عملیاتی و توانایی این مدل را برای کار در فاکتورهای شکلی از مراکز داده بزرگ تا دستگاههای تلفن همراه محلی به نمایش گذاشت. برای به انجام رساندن این شاهکار تحول آفرین، Gemini در سه اندازه در دسترس است: Nano، Pro و Ultra.
جای تعجب نیست که نانو کوچکترین در میان سه گانه است و عمدتاً برای کارهای روی دستگاه طراحی شده است. Pro گام بعدی است، یک پیشنهاد همه کاره تر از Nano، و به زودی در بسیاری از محصولات موجود Google، از جمله Bard، ادغام خواهد شد.
از روز چهارشنبه، Bard شروع به استفاده از یک نسخه خاص از Pro می کند که گوگل قول داده است «استدلال، برنامه ریزی، درک و بیشتر پیشرفته تر» را ارائه دهد. چت بات بهبودیافته Bard در همان ۱۷۰ کشور و منطقه ای که Bard معمولی در حال حاضر موجود است در دسترس خواهد بود و طبق گزارش ها، این شرکت قصد دارد در سال ۲۰۲۴ در دسترس بودن نسخه جدید را افزایش دهد. سال آینده با ورود Gemini Ultra، گوگل نیز این کار را انجام خواهد داد. Bard Advanced را معرفی کنید، هوش مصنوعی حتی قوی تر با ویژگی های اضافه شده.
قابلیتهای Pro همچنین از طریق تماسهای API از طریق Google AI Studio یا Google Cloud Vertex AI قابل دسترسی خواهند بود. جستجو (مخصوصاً SGE)، تبلیغات، کروم و هوش مصنوعی Duet همچنین عملکرد Gemini را در ماههای آینده در ویژگیهای خود ادغام خواهند کرد.
حداقل تا سال ۲۰۲۴ در دسترس نخواهد بود، زیرا طبق گزارشها قبل از انتشار برای «مشتریان، توسعهدهندگان، شرکا و کارشناسان ایمنی و مسئولیت» برای آزمایش و بازخورد، به آزمایشهای تیم قرمز اضافی نیاز دارد. اما زمانی که Ultra وارد شد، قول می دهد که برای توسعه بیشتر هوش مصنوعی بسیار قدرتمند باشد.