همه چیزهایی که در Google I/O 2024 اعلام شد از جمله هوش مصنوعی Gemini، Project Astra، Android 15 و موارد دیگر
به گزارش اپست به نقل از انجگت ، در پایان I/O، کنفرانس سالانه توسعه دهندگان گوگل در Shoreline Amphitheatre در Mountain View، مدیرعامل گوگل، Sundar Pichai فاش کرد که این شرکت ۱۲۱ بار “AI” گفته است.
به روز رسانی شده ۱۴۰۳/۰۲/۲۷ : این، اساسا، نقطه اصلی سخنرانی دو ساعته گوگل بود – پر کردن هوش مصنوعی در هر برنامه و سرویس گوگل که توسط بیش از دو میلیارد نفر در سراسر جهان استفاده می شود. در اینجا تمام بهروزرسانیهای اصلی که گوگل در این رویداد اعلام کرد، آورده شده است.
فلش Gemini 1.5 و به روز رسانی به Gemini 1.5 Pro
گوگل یک مدل کاملاً جدید هوش مصنوعی به نام Gemini 1.5 Flash را معرفی کرد که می گوید برای سرعت و کارایی بهینه شده است. فلش بین Gemini 1.5 Pro و Gemini 1.5 Nano قرار دارد که کوچکترین مدل این شرکت است که به صورت محلی روی دستگاه اجرا می شود. گوگل گفت که فلش را ایجاد کرده است زیرا توسعه دهندگان مدلی سبک تر و ارزان تر از Gemini Pro برای ساخت اپلیکیشن ها و سرویس های مبتنی بر هوش مصنوعی می خواهند و در عین حال برخی از موارد مانند پنجره زمینه طولانی از یک میلیون توکن را که Gemini Pro را از مدل های رقیب متمایز می کند، حفظ می کند. اواخر امسال، گوگل پنجره زمینه Gemini را دو برابر میکند و به دو میلیون توکن میرساند، به این معنی که میتواند همزمان دو ساعت ویدیو، ۲۲ ساعت صدا، بیش از ۶۰۰۰۰ خط کد یا بیش از ۱٫۴ میلیون کلمه پردازش کند. .
پروژه آسترا
گوگل Project Astra را به نمایش گذاشت، نسخه اولیه یک دستیار جهانی مجهز به هوش مصنوعی که دمیس حسابیس، مدیرعامل DeepMind گوگل گفت نسخه گوگل از یک عامل هوش مصنوعی است که می تواند در زندگی روزمره مفید باشد.
در ویدیویی که گوگل میگوید در یک عکس گرفته شده است، یک کاربر Astra در حالی که تلفن خود را بالا گرفته و دوربین را به سمت چیزهای مختلف – یک بلندگو، مقداری کد روی تخته سفید و بیرون از پنجره – در دفتر گوگل در لندن حرکت میکند و یک گفتگوی طبیعی با برنامه در مورد آنچه به نظر می رسد. در یکی از تاثیرگذارترین لحظات ویدیو، به درستی به کاربر میگوید که قبلاً عینک خود را کجا گذاشته است بدون اینکه کاربر عینک را بالا آورده باشد.
ویدئو با پیچ و تاب به پایان می رسد – وقتی کاربر عینک گم شده را پیدا کرده و به چشم می زند، متوجه می شویم که آنها یک سیستم دوربین داخلی دارند و می توانند از Project Astra برای انجام یکپارچه مکالمه با کاربر استفاده کنند، که شاید نشان دهنده این باشد که گوگل ممکن است کار کند. در رقیب عینک هوشمند Ray Ban متا.
از Google Photos بپرسید
Google Photos قبلاً در جستجوی تصاویر یا ویدیوهای خاص هوشمند بود، اما با هوش مصنوعی، Google همه چیز را به سطح بعدی می برد. اگر مشترک Google One در ایالات متحده هستید، میتوانید از Google Photos سؤال پیچیدهای بپرسید: «بهترین عکس را از هر پارک ملی که بازدید کردهام به من نشان بده» زمانی که این ویژگی در چند ماه آینده ارائه شود. Google Photos از اطلاعات GPS و همچنین قضاوت خود در مورد «بهترین» استفاده میکند تا گزینههایی را به شما ارائه دهد.
Veo و Imagen 3
موتورهای جدید ایجاد رسانه مبتنی بر هوش مصنوعی گوگل Veo و Imagen 3 نامیده می شوند. Veo پاسخ گوگل به Sora OpenAI است. گوگل گفت که میتواند ویدیوهای ۱۰۸۰p با کیفیت بالا تولید کند که میتواند «بیش از یک دقیقه» دوام بیاورد و میتواند مفاهیم سینمایی مانند یک تایم لپس را درک کند.
در همین حال، Imagen 3 یک تولیدکننده متن به تصویر است که گوگل ادعا می کند متن را بهتر از نسخه قبلی خود Imagen 2 مدیریت می کند. تصاویر واقعی و واقعی» و مصنوعات کمتر – اساساً آن را در مقابل DALLE-3 OpenAI قرار می دهد.
به روز رسانی های بزرگ در جستجوی گوگل
گوگل در حال ایجاد تغییرات اساسی در نحوه عملکرد جستجو است. اکثر بهروزرسانیهایی که امروز اعلام شدهاند، مانند توانایی پرسیدن سؤالات واقعاً پیچیده («بهترین استودیوهای یوگا یا پیلاتس را در بوستون بیابید و جزئیات پیشنهادات مقدماتی و زمان پیادهروی از بیکن هیل را نشان دهید.») و استفاده از جستجو برای برنامهریزی وعدههای غذایی و تعطیلات برنده شد. در دسترس نخواهد بود مگر اینکه در «آزمایشگاههای جستجو» شرکت کنید، پلتفرم این شرکت که به افراد امکان میدهد ویژگیهای آزمایشی را امتحان کنند.
اما یک ویژگی جدید بزرگ که گوگل آن را AI Overviews می نامد و این شرکت اکنون یک سال است در حال آزمایش آن بوده است، سرانجام در اختیار میلیون ها نفر در ایالات متحده قرار گرفت. اکنون جستجوی گوگل به صورت پیشفرض پاسخهای تولید شده توسط هوش مصنوعی را در بالای نتایج ارائه میکند و این شرکت میگوید که این ویژگی را تا پایان سال به بیش از یک میلیارد کاربر در سراسر جهان خواهد رساند.
جمینی در اندروید
گوگل جمینی را مستقیماً در اندروید ادغام می کند. هنگامی که اندروید ۱۵ در اواخر امسال منتشر شود، Gemini از برنامه، تصویر یا ویدیویی که در حال اجرا هستید آگاه خواهد شد و میتوانید آن را به عنوان یک همپوشانی بالا بکشید و سوالات مربوط به زمینه را از آن بپرسید. از کجا میرود دستیار Google که قبلاً این کار را انجام میدهد؟ چه کسی می داند! گوگل در سخنرانی امروز اصلاً آن را مطرح نکرد.
بهبود عمر باتری WearOS 5
گوگل کاملاً آماده نیست که آخرین نسخه از سیستم عامل ساعت هوشمند خود را عرضه کند، اما نویدبخش بهبودهای عمده عمر باتری در زمان عرضه است. این شرکت گفت که اگر کاربر در یک ماراتن شرکت کند، Wear OS 5 20 درصد کمتر از Wear OS 4 انرژی مصرف می کند. Wear OS 4 قبلاً بهبود عمر باتری را برای ساعتهای هوشمندی که از آن پشتیبانی میکنند به ارمغان آورده است، اما همچنان میتواند در مدیریت قدرت دستگاه بسیار بهتر باشد. گوگل همچنین راهنمای جدیدی در مورد نحوه صرفه جویی در مصرف انرژی و باتری به توسعه دهندگان ارائه کرد تا بتوانند برنامه های کارآمدتری ایجاد کنند.
ویژگی های ضد سرقت اندروید ۱۵
پیشنمایش توسعهدهندگان اندروید ۱۵ ممکن است برای ماهها در حال انتشار باشد، اما هنوز ویژگیهایی در راه است. قفل تشخیص سرقت یک ویژگی جدید اندروید ۱۵ است که از هوش مصنوعی برای پیشبینی سرقت تلفن و قفل کردن موارد بر اساس آن استفاده میکند. گوگل میگوید الگوریتمهایش میتوانند حرکات مرتبط با دزدی را تشخیص دهند، مانند حرکات مرتبط با گرفتن گوشی و پیچشدن، دوچرخهسواری یا رانندگی. اگر یک گوشی اندروید ۱۵ یکی از این موقعیت ها را مشخص کند، صفحه نمایش گوشی به سرعت قفل می شود و دسترسی به داده های شما را برای قاپنده گوشی بسیار سخت تر می کند.
تعداد زیادی به روز رسانی دیگر نیز وجود داشت. گوگل اعلام کرد که واترمارک های دیجیتالی را به ویدیوها و متن های تولید شده توسط هوش مصنوعی اضافه می کند، Gemini را در پانل کناری Gmail و Docs قابل دسترسی می کند، به یک هم تیمی مجازی هوش مصنوعی در Workspace قدرت می دهد، به تماس های تلفنی گوش می دهد و تشخیص می دهد که آیا واقعاً از شما کلاهبرداری شده است یا خیر. زمان، و خیلی بیشتر.