پاسخ گوگل به GPT-4 جمینی است: «تواناترین مدلی که تا به حال ساخته ایم»

دسامبر 7, 2023

0 1 خواندن این مطلب 3 دقیقه زمان میبرد

پاسخ گوگل به GPT-4 جمینی است: «تواناترین مدلی که تا به حال ساخته ایم»

این شرکت قصد دارد از هوش مصنوعی در پلتفرم‌های محصول خود استفاده کند، که از Bard شروع می‌شود.

به گزارش اپست به نقل از انجگت، جایگاه OpenAI در بالای انبوه هوش مصنوعی مولد ممکن است به پایان برسد زیرا گوگل رسماً در روز چهارشنبه توانمندترین مدل زبان بزرگ خود را با نام Gemini 1.0 معرفی کرد. ساندار پیچای، مدیرعامل این شرکت در یک پست وبلاگ گوگل نوشت: این اولین مدل از «نسل جدیدی از مدل‌های هوش مصنوعی است که از نحوه درک و تعامل مردم با جهان الهام گرفته شده است».

از زمان برنامه‌نویسی هوش مصنوعی برای بازی‌های رایانه‌ای در دوران نوجوانی و در طول سال‌هایی که به عنوان محقق علوم اعصاب تلاش می‌کردم عملکرد مغز را درک کنم، همیشه بر این باور بودم که اگر بتوانیم ماشین‌های هوشمندتر بسازیم، می‌توانیم از آنها برای سودمندی بشریت استفاده کنیم. پیچای ادامه داد: راه های باورنکردنی.

نتیجه همکاری گسترده بین بخش‌های DeepMind و تحقیقات گوگل، جمینی دارای تمامی زنگ‌ها و سوت‌هایی است که ژنراتورهای پیشرفته ارائه می‌دهند. پیچای اعلام کرد: «قابلیت های آن تقریباً در هر حوزه ای پیشرفته است.

این سیستم از ابتدا به عنوان یک هوش مصنوعی چندوجهی یکپارچه توسعه یافته است. بسیاری از مدل‌های پایه می‌توانند اساساً شامل گروه‌هایی از مدل‌های کوچک‌تر باشند که همگی در یک پوشش سنگی چیده شده‌اند، با هر مدل جداگانه برای انجام عملکرد خاص خود به عنوان بخشی از کل بزرگ‌تر. همه اینها برای عملکردهای کم عمق مانند توصیف تصاویر خوب و خوب است، اما برای کارهای استدلالی پیچیده چندان خوب نیست.

پیچای گفت، گوگل، برعکس، Gemini را از قبل آموزش داده و به دقت تنظیم کرده است، “از ابتدا بر روی روش های مختلف” به آن اجازه می دهد “به طور یکپارچه انواع ورودی ها را از ابتدا درک کند و درباره آنها استدلال کند، بسیار بهتر از مدل های چندوجهی موجود”. توانایی دریافت همه این اشکال داده‌ها به‌طور هم‌زمان باید به Gemini کمک کند تا در موضوعات چالش‌برانگیزتر، مانند فیزیک، پاسخ‌های بهتری ارائه دهد.

Gemini همچنین می تواند کدنویسی کند. گزارش شده است که در زبان های برنامه نویسی محبوب از جمله Python، Java، C++ و Go مهارت دارد. گوگل حتی از یک نسخه تخصصی Gemini برای ایجاد AlphaCode 2 استفاده کرده است، که جانشینی برنده رقابت های GenerativeAI در سال گذشته است. به گفته این شرکت، AlphaCode 2 دو برابر سوالات چالشی قبلی خود را حل کرده است، که عملکرد آن را بالاتر از 85 درصد شرکت کنندگان در مسابقه قبلی قرار می دهد.

در حالی که گوگل فوراً تعداد پارامترهایی را که Gemini می‌تواند استفاده کند به اشتراک نمی‌گذارد، این شرکت انعطاف‌پذیری عملیاتی و توانایی این مدل را برای کار در فاکتورهای شکلی از مراکز داده بزرگ تا دستگاه‌های تلفن همراه محلی به نمایش گذاشت. برای به انجام رساندن این شاهکار تحول آفرین، Gemini در سه اندازه در دسترس است: Nano، Pro و Ultra.

جای تعجب نیست که نانو کوچکترین در میان سه گانه است و عمدتاً برای کارهای روی دستگاه طراحی شده است. Pro گام بعدی است، یک پیشنهاد همه کاره تر از Nano، و به زودی در بسیاری از محصولات موجود Google، از جمله Bard، ادغام خواهد شد.

از روز چهارشنبه، Bard شروع به استفاده از یک نسخه خاص از Pro می کند که گوگل قول داده است «استدلال، برنامه ریزی، درک و بیشتر پیشرفته تر» را ارائه دهد. چت بات بهبودیافته Bard در همان 170 کشور و منطقه ای که Bard معمولی در حال حاضر موجود است در دسترس خواهد بود و طبق گزارش ها، این شرکت قصد دارد در سال 2024 در دسترس بودن نسخه جدید را افزایش دهد. سال آینده با ورود Gemini Ultra، گوگل نیز این کار را انجام خواهد داد. Bard Advanced را معرفی کنید، هوش مصنوعی حتی قوی تر با ویژگی های اضافه شده.

قابلیت‌های Pro همچنین از طریق تماس‌های API از طریق Google AI Studio یا Google Cloud Vertex AI قابل دسترسی خواهند بود. جستجو (مخصوصاً SGE)، تبلیغات، کروم و هوش مصنوعی Duet همچنین عملکرد Gemini را در ماه‌های آینده در ویژگی‌های خود ادغام خواهند کرد.

حداقل تا سال 2024 در دسترس نخواهد بود، زیرا طبق گزارش‌ها قبل از انتشار برای «مشتریان، توسعه‌دهندگان، شرکا و کارشناسان ایمنی و مسئولیت» برای آزمایش و بازخورد، به آزمایش‌های تیم قرمز اضافی نیاز دارد. اما زمانی که Ultra وارد شد، قول می دهد که برای توسعه بیشتر هوش مصنوعی بسیار قدرتمند باشد.