بهروزرسانیهای زنده Google I/O 2024: هوش مصنوعی جِمینی، اندروید ۱۵ و موارد دیگر
به گزارش اپست به نقل از انجگت ، کمپانی گوگل در حال آماده شدن برای به اشتراک گذاشتن انبوهی از اخبار در مورد هوش مصنوعی و جستجو در کنفرانس توسعه دهندگان I/O در تاریخ ۱۴ می است و ما انتظار انبوهی از اعلامیهها در مورد جミニ، اندروید، جستجو و موارد دیگر را داریم. این شرکت حتی نمی توانست تا سخنرانی اصلی خود صبر کند تا ما را در جریان آنچه که در حال پخت و پز بوده است قرار دهد و قبلاً با یک ویدیو از یک ویژگی هوش مصنوعی مبتنی بر دوربین در حساب های اجتماعی خود ما را اذیت کرده است.
بر اساس آنچه تاکنون می دانیم، به نظر می رسد این رویدادی با چندین ساعت رونمایی و اعلامیه های فراوان باشد. اگر نمی توانید سخنرانی اصلی Google I/O 2024 را برای مدت طولانی تماشا کنید، یا رویکرد مبتنی بر متن و تصویر را ترجیح می دهید، ما وبلاگ زنده را برای شما در نظر گرفته ایم. خبرنگاران ما، کریسا بل و سام روترفورد، در آمفی تئاتر شورلین حضور خواهند داشت تا اخبار را به صورت زنده برای شما به ارمغان بیاورند، با پشتیبانی کل تیم انگجت. برای پوشش همه بهروزرسانیهای Google I/O 2024، حدود ساعت ۱۲ ظهر به وقت شرقی در تاریخ ۱۴ مه برگردید!
Gemini در پانل کناری برنامههای Google مانند Gmail و Docs قابل دسترسی خواهد بود
گوگل اتوماسیون هوش مصنوعی مبتنی بر Gemini را به وظایف بیشتری در Workspace اضافه می کند. این شرکت در سخنرانی سهشنبه Google I/O خود گفت که Gemini 1.5 Pro پیشرفتهاش بهزودی در پانل جانبی Workspace بهعنوان «بافت همبند در چندین برنامه با جریانهای کاری مبتنی بر هوش مصنوعی» در دسترس خواهد بود، زیرا هوش مصنوعی هوشمندتر میشود، و اطلاعات بیشتری درباره آن میآموزد. شما و بیشتر گردش کار شما را خودکار می کند.
از اینکه به ما پیوستید متشکریم. ما تلاش می کنیم تا نگاه دقیق تری به برخی از چیزهایی که گوگل امروز در I/O اعلام کرد داشته باشیم.
اوه، و آن ساندار آخرین شمارش هوش مصنوعی را یک بار دیگر به ۱۲۱ رساند.
چه کسی می خواهد شرط بندی کند که آیا گوگل در سال آینده بالاتر از آن قرار خواهد گرفت؟
راستش من خوشحالم که بیشتر از این دوام نیاورد. در حالی که سم و کاریسا می روند و دمویی که ممکن است در I/O 2024 در دسترس باشد را بررسی کنند، بیایید و به من و داور ارشد Devindra Hardawar در کانال YouTube Engadget بپیوندید. من مطمئن هستم که افکار و احساساتی برای به اشتراک گذاشتن در مورد همه چیزهایی که Google اخیراً اعلام کرده است دارید!
و این خلاصه ای از سخنرانی اصلی است، *فقط* کمتر از ۲ ساعت از همه چیزهای Gemini و AI بود.
حتی گوگل در مورد اینکه چند بار مردم هوش مصنوعی گفته اند جوک می کند
طبق گفته ساندار (که به تازگی روی صحنه برگشته) و جمینی، ۱۲۰ ذکر از “AI” در این سخنرانی کلیدی. من واقعاً کمی بالاتر حدس می زدم.
Gems از مدل جدید LearnLM استفاده خواهد کرد که بر اساس Gemini ساخته شده است.
گوگل، مانند بسیاری از همتایان خود با هوش مصنوعی، قصد دارد از واترمارک برای افزایش شفافیت در مورد محتوای تولید شده توسط هوش مصنوعی با SynthID استفاده کند. این واترمارکها به ویدیوهای تولید شده توسط هوش مصنوعی (آن نسخههای نمایشی Veo از قبل را به خاطر دارید؟) و متن گسترش خواهند یافت، که به ویژه جالب است زیرا متن تولید شده توسط هوش مصنوعی بسیار رایجتر است (و از جهاتی تشخیص آن سختتر از تصاویر یا ویدیوها است).
SynthID ابزاری است که گوگل در حال ساخت آن است تا به راحتی محتوای تولید شده توسط هوش مصنوعی را شناسایی کند. اما به نظر می رسد چیزی از جهان Blade Runner است که مردم می توانند از آن برای تشخیص replicants استفاده کنند.
ما در حال وارد شدن به بخش “ساختن مسئولانه هوش مصنوعی” هستیم، با نگاهی به رویکرد Google برای تیم قرمز، فرآیند جستجوی تهدیدها، خروجی های “مشکل” و سایر مسائلی که ممکن است برای گوگل (و شاید بقیه ما) مشکل ایجاد کند. ). پس از شکست در تولید کننده تصویر Gemini در اوایل سال جاری، من واقعاً متعجبم که آنها این مدت طولانی منتظر ماندند تا همه اینها را مطرح کنند.
جیمز مانیکا در Google I/O 2024 درباره اخلاق و مسئولیتپذیری هوش مصنوعی صحبت میکند.
بنابراین به نظر میرسد که به بخش برنامهنویس محور اصلی I/O رسیدهایم. من و کاریسا فقط در مورد این صحبت کردیم که چگونه برای افراد غیر توسعهدهنده، تنظیم کردن مقادیر توکنهای موجود در طرحهای مختلف Gemini دشوار است.
ما در حال بررسی عمیق تر Gemini Flash هستیم که اولین بار در بالای سخنرانی اصلی درباره آن شنیدیم. فلاش مدل Gemini “سبک تر” است که تاخیر کمتری دارد و کارایی بیشتری دارد. به نظر می رسد که این برای توسعه دهندگان و سازمان هایی است که به قدرت کامل Gemini 1.5 Pro نیاز ندارند اما همچنان می خواهند از قابلیت های چند وجهی استفاده کنند.
بله، من فکر میکنم ویژگی هشدار کلاهبرداری واقعاً خوب است، زیرا میتواند در زمان واقعی به شما یک بررسی دقیق بدهد، زمانی که ممکن است احساس کنید که تماس کمی ناراحتکننده است.
Google Gemini می تواند با حساب Workspace خود به یک هم تیمی مجازی هوش مصنوعی قدرت دهد
سیستمهای هوش مصنوعی Gemini گوگل میتوانند کارهای زیادی انجام دهند، با توجه به سخنرانی امروزی I/O. این شامل گزینه ای برای راه اندازی یک هم تیمی مجازی با حساب Workspace خودش است. شما می توانید هم تیمی را برای انجام وظایف خاص، مانند نظارت و پیگیری پروژه ها، سازماندهی اطلاعات، ارائه زمینه، مشخص کردن روندها پس از تجزیه و تحلیل داده ها و ایفای نقش در همکاری تیمی، پیکربندی کنید.
جاش وودوارد بازگشته است تا در مورد مدل های مختلف Gemini که در دسترس توسعه دهندگان است صحبت کند.
گوگل راه حل دیگری برای تماس های کلاهبرداری بی پایان دارد. اگر تماس را دریافت کنید، و متوجه شد که تماس “مشکوک” یا کلاهبرداری احتمالی است، می تواند یک هشدار بزرگ را مستقیماً روی تلفن شما نشان دهد و به طور بالقوه شما را از خرید هزاران دلار کارت هدیه یا انتقال وجه به یک حساب سرکش نجات دهد. بسیاری از این کلاهبرداریها آشکار به نظر میرسند، اما مردم همچنان به آنها علاقه دارند و این ممکن است کمک کند.
بهروزرسانیهای TalkBack
مثلاً آیا روزی را خواهیم دید که به شما اجازه میدهند برای شرکت در آزمونهای SAT گوشی بیاورید؟ زیرا در غیر این صورت، به طور بالقوه به دانشآموزان کمکی میدهید که ممکن است نتوانند در طول ارزیابیهای مهم از آن استفاده کنند، که ممکن است به یک نقطه ضعف تبدیل شود.
کاریسا، من فکر میکنم فرمولهای پشتیبانی Circle to Search عجیب و غریب است، زیرا برای افراد مسنتری مانند ما (یا حداقل من)، شبیه تقلب است.
من از جستجو برای چیزی و در نتیجه گرفتن یک ویدیوی ۵ دقیقهای YouTube متنفرم، بنابراین این که بتوانم به جای آن «از این ویدیو بپرسم» چیزی است که قطعاً میتوانم ببینم که از آن استفاده میکنم. نمیدانم که آیا هنوز هم باید پیشبازی را تماشا کنید؟
دیو برک در Google I/O درباره ادغام عمیق تر Gemini در اندروید صحبت می کند.
حلقه برای جستجو به زودی از فرمول ها پشتیبانی می کند.
من میدانم که چرا کمک کردن به سؤالات تکالیف برای Google میتواند مفید باشد، اما چیزی وجود دارد که در مورد تشویق دانشآموزان و والدین به استفاده از کمکهای تکالیف به هوش مصنوعی Google هنوز کمی احساس میکند.
خوب، حاشیه: آنها عکسی از شخصی نشان دادند که در حال جستجوی سس Fly by Jing بود. این چیزها عالی است.
ما بالاخره بخش Android از سخنرانی اصلی را شروع کردیم. وای، Gemini در حال تبدیل شدن به دستیار هوش مصنوعی جدید در اندروید است، بنابراین حدس میزنم دستیار گوگل مرده است؟
در نهایت، وقت آن است که در مورد اندروید با سمیر سمت صحبت کنیم.
اوه نه، ما به بخش موسیقی Google I/O رسیده ایم.
ابزارهای جدید تشخیص کلاهبرداری گوگل هشدارهای بلادرنگ را در طول تماس های تلفنی ارائه می دهند
گوگل به تازگی ابزارهای تشخیص کلاهبرداری آتی را که اواخر امسال به گوشیهای اندرویدی عرضه میشود، معرفی کرد، که این یک چیز خوب است زیرا این کلاهبرداران در جدا کردن افراد از پول خود بهتر و بهتر میشوند. این مجموعه ابزار که در Google I/O 2024 فاش شد، هنوز در مراحل آزمایشی است اما از هوش مصنوعی برای سرکوب کلاهبرداران در میانه مکالمه استفاده می کند.
موافقم. من با استفاده از chatGPT و سایر ابزارهای هوش مصنوعی برای برنامه ریزی یک برنامه سفر تابستان گذشته آزمایش کردم و کمی سخت بود. در هر صورت، این بیشتر یک نقطه شروع بود تا یک راه حل واقعی، به خصوص به این دلیل که چندین پیشنهاد آن توهمات مستقیم بودند! شاید جوزا بهتر عمل کند،
برنامه ریزی سفر با جمینی
اکنون سیسی در مورد برنامه ریزی سفر با جمینی صحبت می کند، و من احساس می کنم تعطیلات بسیار گران است که نمی توان به یک هوش مصنوعی برنامه ریزی کرد. مدتی طول می کشد تا مردم با اجازه دادن به هوش مصنوعی اینگونه فرمان را به دست بگیرند، احساس راحتی کنند.
برنامه Gemini در حال دریافت یک ویژگی جدید “Live” است که فناوری Project Astra را که در ابتدای سخنرانی شاهد بودیم به ارمغان می آورد. می تواند صحبت کند و به دستورات صوتی پاسخ دهد و از دوربین تلفن شما برای ورودی استفاده کند.
فناوری ممکن است وجود داشته باشد، اما من واقعاً فکر نمیکنم که انسانها برای همکاران هوش مصنوعی آماده باشند. آیا حتی می توانید تصور کنید افرادی که با ایمیل ها مشکل دارند سعی می کنند با چت ربات های هوشمند در Slack صحبت کنند؟
Gemini Nano گوگل هوشمندی های بهتری برای توصیف تصویر به ابزار دید TalkBack خود می آورد
رویداد Google I/O اینجاست و این شرکت بهروزرسانیهای عالی زیادی را برای دستگاه اندرویدی شما اعلام میکند. همانطور که قبلا شنیدیم، Gemini Nano پشتیبانی چندوجهی دریافت میکند، به این معنی که اندروید شما همچنان متن را پردازش میکند، اما با درک بهتر عوامل دیگر مانند مناظر، صداها و زبان گفتاری. اکنون گوگل به اشتراک گذاشته است که ابزار جدید به ویژگی TalkBack آن نیز می آید.
TalkBack یک ابزار موجود است که توصیف یک تصویر را با صدای بلند می خواند، خواه تصویری که شما گرفته اید یا از طریق اینترنت. پشتیبانی چندوجهی Gemini Nano باید درک دقیق تری از تصویر ارائه دهد.
Sissie Hsiao در Google I/O 2024
چیپ در اصل یک همکار هوش مصنوعی است. می تواند اسناد مشترک را تجزیه و تحلیل کند، جلسات را برنامه ریزی کند و پروژه ها را در فضای کاری شرکت شما ردیابی کند. به نظر می رسد که سازمان ها می توانند نسخه های تراشه خود را مطابق با نیازهای خود سفارشی کنند.
Google Gemini را مستقیماً در Android ایجاد می کند و آگاهی متنی را در برنامه ها اضافه می کند
گوگل اخیراً بهعنوان بخشی از رویداد I/O 2024، بهبودهای بسیار خوبی را در چت ربات هوش مصنوعی Gemini خود برای دستگاههای اندرویدی اعلام کرد. هوش مصنوعی اکنون بخشی از سیستم عامل اندروید است و به آن اجازه می دهد تا به روشی جامع تر ادغام شود.
جالب ترین ویژگی جدید بدون آن ادغام با سیستم عامل اصلی امکان پذیر نخواهد بود. Gemini اکنون در درک زمینه بسیار بهتر است زیرا شما برنامه ها را در تلفن هوشمند کنترل می کنید. این دقیقا به چه معنی است؟ هنگامی که این ابزار بهعنوان بخشی از اندروید ۱۵ بهطور رسمی راهاندازی شد، میتوانید یک پوشش Gemini که در بالای برنامهای که استفاده میکنید قرار دارد، ایجاد کنید. این امکان اعمال و پرس و جوهای مربوط به زمینه را فراهم می کند.
تونی وینسنت در Google I/O 2024
Circle to Search اندروید اکنون میتواند به دانشآموزان در حل تکالیف ریاضی و فیزیک کمک کند
گوگل قابلیت دیگری را برای ویژگی Circle to Search خود در کنفرانس سالانه توسعه دهندگان I/O این شرکت معرفی کرده است و این چیزی است که می تواند به دانش آموزان کمک کند تا موضوعات کلاسی بالقوه دشوار را بهتر درک کنند. این ویژگی اکنون میتواند دستورالعملهای گام به گام را برای «مسائل کلمات فیزیک و ریاضی» به آنها نشان دهد. آنها فقط باید این ویژگی را با فشار طولانی دکمه هوم یا نوار ناوبری فعال کنند و سپس دور مشکلی که باعث سرگردانی آنها شده است را بچرخانند، اگرچه برخی از مشکلات ریاضی نیاز به ثبت نام کاربران در ویژگی آزمایشی آزمایشگاه های جستجوی گوگل دارند.
به هر حال، ما رسماً یک ساعت به این سخنرانی اصلی رسیده ایم، و هنوز هیچ علاقه ای به اندروید نداریم. می دانم که بعداً زمان زیادی برای به روز رسانی اندروید وجود خواهد داشت، اما در مورد اینکه تا چه حد اولویت های گوگل تغییر کرده اند، چیزهای زیادی می گوید، چندی پیش بود که اندروید ستاره I/O بود. اکنون، تقریباً مانند یک فکر بعدی به نظر می رسد.
اگرچه من حدس میزنم که این به نوعی جلوتر از جایی است که هوش مصنوعی در حال حاضر در آن قرار دارد.
اما من باید فکر کنم که آیا این نقش ممکن است توسط یک عامل هوش مصنوعی که همین کارها را با ورودی دستی بالقوه کمتر انجام دهد، بهتر انجام شود.
بله، من قصد ندارم دروغ بگویم، توانایی هوش مصنوعی برای خلاصه کردن چیزها خوب است، اما به نظر می رسد پایین ترین درجه از قابلیت های آن است. بنابراین خوب است که ببینیم با پاسخهای متنی و انتقال دادهها بین برنامههای مختلف مانند Gmail، Calendar و غیره، اوضاع چگونه در حال تکامل است.
Gemini قصد دارد برخی از ویژگیهای جدید جالب را در برنامه Gmail تقویت کند، از جمله خلاصهای از رشتههای ایمیل طولانی. همچنین میتوانید مستقیماً با Gemini چت کنید تا جزئیات را از صندوق ورودی خود بیابید. همچنین پیشنهادات پاسخ جدیدی وجود دارد که می تواند زمینه ایمیل های شما را برای پیشنهادات متنی مفیدتر (امیدوارم) درک کند. من هرگز تحت تاثیر پیشنهادات خودکار جیمیل قرار نگرفته ام، اما شاید Gemini آنها را واقعا مفید کند.
آپارنا پاپو در Google I/O
بله، ساختن همه اینها در دنیای واقعی چیزی نیست که فقط بتوانید انگشتانتان را بشکنید. اما در ادامه، تقریباً من را به این فکر میاندازد که آیا نقش بشریت در آینده ممکن است این باشد که هر ارتشی از عوامل هوش مصنوعی را که در اختیار دارید بررسی کنید.
خوب، این در واقع بسیار مفید به نظر می رسد. جستجو قابلیتهای تشخیص ویدیو را دریافت میکند، بنابراین میتوانید براساس محتویات یک ویدیو جستجو کنید، که میتواند به ویژه زمانی که نیاز به اصلاح چیزی یا پاسخ به سؤالی دارید که به راحتی نمیتوانید توضیح دهید، مفید باشد. Google قادر خواهد بود آنچه در کلیپ است را بفهمد و (امیدواریم) نتایج مرتبط را نشان دهد.
Gemini گوگل ویدیوهای شما را جستجو می کند تا به شما در حل مشکلات کمک کند
گوگل به عنوان بخشی از تلاش خود برای افزودن هوش مصنوعی مولد به جستجو، یک پیچ جدید را معرفی کرده است: ویدیو. Gemini به شما اجازه میدهد ویدیویی را آپلود کنید که نشان میدهد مشکلی را که میخواهید حل کنید، سپس انجمنهای کاربران و سایر مناطق اینترنت را برای یافتن راهحل جستجو کنید.
به عنوان مثال، رز یائو از گوگل روی صحنه در I/O 2024 در مورد صفحه گردان دست دومی که خریده بود صحبت کرد و اینکه چطور نتوانست سوزن را روی صفحه ضبط کند.
رز یائو در Google I/O 2024
به نظر می رسد این آینده ای است که گوگل در حال حاضر به ما وعده می دهد. دیگر فقط یافتن اطلاعات مورد نیاز نیست، بلکه به «نمایندگان» گوگل اجازه میدهد تا کارهایی مانند اضافه کردن به لیست خرید شما را انجام دهند. من هنوز سوالات زیادی در مورد اینکه همه اینها در دنیای واقعی چقدر خوب عمل می کند، دارم.
اکنون جستجوی گوگل به طور پیشفرض به میلیونها نفر پاسخهای تولید شده توسط هوش مصنوعی را نشان میدهد
گوگل
گوگل جستجو را تکان می دهد. روز سهشنبه، این شرکت در کنفرانس سالانه Google برای توسعهدهندگان، تغییرات بزرگ جدید مبتنی بر هوش مصنوعی را در موتور جستجوی غالب جهان اعلام کرد. با ویژگی های جدید، گوگل جستجو را به عنوان چیزی بیش از راهی برای یافتن وب سایت ها قرار می دهد. در عوض، این شرکت از مردم میخواهد که از موتور جستجوی آن برای دریافت مستقیم پاسخها و کمک به آنها در برنامهریزی رویدادها و ایدههای طوفان فکری استفاده کنند.
نکته خوب کاریسا من فکر میکنم زاک نبرد سختتری دارد، زیرا فیسبوک/متا مانند گوگل یا اپل تأثیری روی سختافزار ندارند. اما میتوانید مشاهده کنید که متا تلاش میکند تا آن را با دستگاههایی مانند عینک هوشمند Ray-Ban تغییر دهد.
در حالی که هنوز خیلی زود است، به نظر می رسد که از Star Trek به رایانه نزدیک می شویم، یک موجودیت واقعی هوش مصنوعی فردی که رفتار خود را برای هر فرد تنظیم می کند.
این فقط گوگل نیست. مارک زاکربرگ نیز در مورد وعده “عوامل AI” صحبت کرده است، اگرچه من فکر می کنم مسیر گوگل برای رسیدن به آنجا بسیار ساده تر است، همانطور که اکنون با این بررسی عمیق در بررسی های AI در جستجو می بینیم.
آیا «عامل» داغترین کلمه در Google I/O امسال خواهد بود؟
مطمئناً به نظر میرسد که قبل از اینکه کسی عمیقتر به Android یا ChromeOS بپردازد، یک ساعت کامل درباره هوش مصنوعی خواهیم داشت.
لیز رید در Google I/O 2024
تقریباً ۴۵ دقیقه به این سخنرانی اصلی رسیدهایم و ذکر مختصری از Circle to Search یکی از اولین بارهایی است که ساندار در تمام طول روز «Android» را گفت. نشانه دیگری از اینکه امروز همه چیز در مورد هوش مصنوعی است.
ظاهراً ابر رایانه ها دیگر به اندازه کافی خوب نیستند.
واحد پردازش تنسور (TPU) نسل ششم گوگل Trillium نام دارد و اواخر امسال برای مشتریان Cloud خود عرضه می شود. ممکن است TPU ها در بین بسیاری از به روز رسانی های هوش مصنوعی گوگل امروزی جذاب ترین نباشند، اما بخش مهمی از کار هوش مصنوعی آن است.
گوگل از Veo و Imagen 3، جدیدترین مدل های ایجاد رسانه هوش مصنوعی خود رونمایی کرد
در Google I/O همیشه هوش مصنوعی است! امروز، گوگل موتورهای جدید ایجاد رسانه هوش مصنوعی خود را معرفی کرد: Veo، که می تواند ویدیوهای ۱۰۸۰p با کیفیت بالا تولید کند. و Imagen 3، آخرین چارچوب متن به تصویر آن. هیچکدام بهخصوص انقلابی به نظر نمیرسند، اما راهی برای Google برای ادامه مبارزه با مدل ویدیویی Sora OpenAI و Dall-E 3 است، ابزاری که عملاً مترادف با تصاویر تولید شده توسط هوش مصنوعی شده است.
گوگل ادعا می کند که Veo “درکی پیشرفته از زبان طبیعی و معنای بصری” دارد تا هر ویدیویی را که در ذهن دارید ایجاد کند. ویدئوهای تولید شده توسط هوش مصنوعی می توانند «بیش از یک دقیقه» دوام بیاورند. Veo همچنین قادر به درک تکنیک های سینمایی و بصری مانند مفهوم تایم لپس است. اما واقعاً، این باید برای مدل تولید ویدیوی هوش مصنوعی باشد، درست است؟
یک چیز جالب این است که گوگل بیشتر در مورد AGI یا هوش عمومی مصنوعی صحبت می کند.
ایده هوش مصنوعی دارای هوش در سطح انسانی زمانی به عنوان موضوعی کاملاً علمی تخیلی به نظر می رسید، بنابراین شنیدن صحبت های شرکت هایی مانند گوگل در مورد آن در طول یک کنفرانس توسعه دهنده کمی سورئال به نظر می رسد.
با حفظ این موضوع، گوگل یک تولید کننده ویدیوی جدید به نام Veo را به نمایش می گذارد. به نظر می رسد دونالد گلاور آزمایش کننده اولیه این فناوری بوده است. تا اینجای کار، این کلیپ ها به طرز شگفت انگیزی صاف و واقعی به نظر می رسند. Veo در هفتههای آینده به «انتخاب سازندگان» در VideoFX میآید.
دونالد گلاور از Veo برای ساخت یک فیلم کوتاه استفاده می کند.
Wyclef Jean در حال آزمایش هوش مصنوعی مولد برای کمک به ساخت موسیقی است.
Google I/O یک کنفرانس توسعه دهندگان است، اما جالب است که ما شاهد تاکید زیادی برای موارد استفاده خلاقانه از نسل هوش مصنوعی، مانند تولید تصویر و موسیقی هستیم.
گوگل به تازگی یک جفت عینک واقعیت افزوده را در نسخه نمایشی Project Astra در I/O فرو برده است
در ویدئویی که نشاندهنده مهارت برنامه جدید Project Astra بود، فردی که نمایش میداد از Gemini پرسید: “یادت هست عینک من را کجا دیدی؟” هوش مصنوعی به طرز چشمگیری پاسخ داد: “بله، دارم. عینک شما روی میز نزدیک یک سیب قرمز قرار داشت”، علیرغم اینکه شیء گفته شده در هنگام پرسیدن سوال واقعا در معرض دید نبود. اما اینها کمک بصری استاندارد باتلاقی شما نبودند. این عینک دارای دوربین و نوعی رابط بصری بود!
Imagen 3 جدیدترین تولیدکننده متن به تصویر گوگل است و ظاهراً در ایجاد متن در تصاویر بسیار بهتر است، که برای بسیاری از تولیدکنندگان تصویر ترفند بوده است.
داگ اک در Google I/O 2024
Google’s Project Astra از دوربین و هوش مصنوعی گوشی شما برای یافتن سازندگان نویز، موارد نابجا و موارد دیگر استفاده می کند.
هنگامی که گوگل برای اولین بار فناوری دستیار صوتی Duplex خود را در کنفرانس توسعه دهندگان خود در سال ۲۰۱۸ به نمایش گذاشت، هم چشمگیر و هم نگران کننده بود. امروز، در I/O 2024، این شرکت ممکن است دوباره همان واکنشها را مطرح کند، این بار با نشان دادن کاربرد دیگری از هوش مصنوعی خود با چیزی به نام Project Astra.
این شرکت حتی نمیتوانست تا سخنرانی امروز خود صبر کند تا پروژه Astra را مورد آزار و اذیت قرار دهد و دیروز ویدیویی را از یک برنامه هوش مصنوعی مبتنی بر دوربین در رسانههای اجتماعی خود منتشر کرد. با این حال، دمیس حسابیس، مدیرعامل DeepMind گوگل در سخنرانی امروز خود به اشتراک گذاشت که تیم او “همیشه می خواستند عوامل هوش مصنوعی جهانی را توسعه دهند که می توانند در زندگی روزمره مفید باشند.” پروژه آسترا نتیجه پیشرفت در این زمینه است.
جزئیات زیادی در مورد Astra فراتر از آن ویدیو وجود ندارد، اما ظاهراً امروز یک نسخه ی نمایشی زنده از آن در اینجا وجود خواهد داشت، بنابراین امیدواریم که ما بعد از این ویدیو نگاه دقیق تری داشته باشیم.
ما در حال بررسی چیزی به نام Project Astra هستیم که بخشی از ماموریت گوگل برای ایجاد «عوامل هوش مصنوعی جهانی» است. به نظر می رسد این همان چیزی است که گوگل دیروز به طور مختصر در X به آن اشاره کرد – این شبیه یک نسخه لنز گوگل با هوش مصنوعی است، می تواند آنچه را در کادر دوربین در زمان واقعی وجود دارد تشخیص دهد و حتی در مورد اشیاء خارج از کادر به سوالات پاسخ دهد. همچنین به نظر می رسد که نوعی جزء عینک وجود دارد.
پروژه آسترا
مدل جدید Gemini 1.5 Flash AI گوگل سبک تر از Gemini Pro است و در دسترس تر است
گوگل روز سهشنبه در کنفرانس سالانه توسعهدهندگان، I/O، بهروزرسانیهای مدلهای هوش مصنوعی جمینی خود را اعلام کرد. این شرکت در حال عرضه یک مدل جدید به نام Gemini 1.5 Flash است که می گوید برای سرعت و کارایی بهینه شده است.
Demis Hassabis، مدیرعامل Google DeepMind گفت: «۱٫۵ Flash در خلاصهسازی، برنامههای چت، شرح تصاویر و ویدیوها، استخراج دادهها از اسناد و جداول طولانی و موارد دیگر برتری دارد.
Gemini 1.5 Flash یک مدل جدید جمینی با وزن سبک تر است که دارای قابلیت های چندوجهی است اما کارآمدتر از Gemini 1.5 Pro است.
دمیس حسابیس در Google I/O 2024
استفاده از هوش مصنوعی برای خودکار کردن فرآیند بازگرداندن چیزی که خریداری کرده اید.
ساندار بازگشته است و در مورد وعده “عوامل هوش مصنوعی” صحبت می کند، که در واقع می توانند وظایف را از طرف ما انجام دهند. او میگوید که آنها باید بتوانند «از قبل فکر کنند و استدلال کنند» تا به ما در انجام کارها کمک کنند.
استفاده از هوش مصنوعی برای زمینه سازی آموزش
ما نگاهی به Gemini 1.5 Pro در NotebookLM و نحوه فعال کردن ویژگیهای صوتی مانند دستیار صوتی داریم. اساساً مجموعه ای از مطالب منبع را تجزیه و تحلیل می کند و می تواند آن را به طور طبیعی توضیح دهد و حتی به سؤالات پاسخ دهد.
Josh Woodward at Google I/O 2024
Gemini 1.5 Pro
از Google Photos بخواهید که برای درک گالری شما راهنمایی دریافت کند
گوگل بیشتر از هوش مصنوعی Gemini خود را در هر محصولی که دارد وارد می کند و هدف بعدی در نظرش Photos است. در کنفرانس توسعه دهندگان I/O امروز، ساندار پیچای، مدیرعامل این شرکت، قابلیتی به نام Ask Photos را اعلام کرد که برای کمک به شما در یافتن تصاویر خاص در گالری خود با صحبت با Gemini طراحی شده است.
جستجو در حال حاضر یکی از بهترین ویژگیهای Google Photos است، اما به نظر میرسد Gemini آن را قدرتمندتر میکند. Sundar نشان داد که چگونه نه تنها میتواند جزئیات را در عکسهای خاص جستجو کند، بلکه میتواند زمینه وسیعتر چندین عکس را در طول زمان درک کند، مانند ردیابی مهارتهای شنای کودک شما در طول تابستان.
Ask Photos یک ویژگی کوچک ساده به نظر می رسد، اما می تواند واقعا مفید باشد. من دائماً چیزهایی را در Photos جستجو میکنم و معمولاً باید به یاد بیاورم که چه زمانی عکس را گرفتهام و سپس فقط در جدول زمانی خود پیمایش کنم تا آن را پیدا کنم.
نسخه نمایشی Google Ask Photos
اول Google Photos است، Gemini در قالب یک چت ربات مفید به Google Photos می آید که می تواند به سؤالات مربوط به آنچه در گالری شما وجود دارد پاسخ دهد. «عکس بپرس» تابستان امسال می آید.
مروری بر هوش مصنوعی
فکر میکنم همه میدانستند که گوگل با صحبت کردن درباره جمینی کارها را آغاز میکند. اما من کنجکاو هستم که چگونه دستیار گوگل و جمینی در آینده در کنار یکدیگر (یا شاید هم) کار کنند.
ساندار پیچای در Google I/O 2024
ساندار روی صحنه است، او به شوخی می گوید که I/O “نسخه گوگل از تور Eras” است و می گوید که گوگل در “عصر جمینی” خود است، بنابراین انتظار یک سخنرانی کلیدی را داشته باشید که همه چیز هوش مصنوعی باشد.
حالا مارک درخواست های موسیقی را از جمعیت دریافت می کند و می خواهد کار Loop Daddy خود را انجام دهد و آن را به یک آهنگ کامل تبدیل کند.
Marc Rebillet در حال آزمایش برخی از نمونههای موسیقی هوش مصنوعی در Google I/O 2024 است
او به تازگی برخی از ابزارهای موسیقی مولد هوش مصنوعی گوگل را به نمایش گذاشته است، به نظر می رسد از شنیده هایش تحت تاثیر قرار گرفته است، می گوید که چیزهای بیشتری در راه است.
اکنون مارک در حال ورود به موسیقی مولد ساخته شده توسط هوش مصنوعی است.
Marc Rebillet در Google I/O
مارک ریبیلت به تازگی از یک لیوان ورودی/خروجی در اندازه واقعی بیرون آمده و وظایف را بر عهده گرفته است.
سالن در حال پر شدن است!
ما در حال معاشرت هستیم ، خیلی خنک است. سالن آمفی تئاتر در حال پر شدن است.
نمای نزدیک Google I/O
و ما رسما یک ساعت بیرون هستیم!
ما وارد شدیم
ریویان R1S در Google I/O
گوگل یک ریوین را در خارج از چادر مطبوعات قرار داده است، بنابراین به احتمال زیاد امروز بعد از ظهر برخی بهروزرسانیهای Android Automotive را دریافت خواهیم کرد.
فقط شنیدم که گوگل لیست بلندبالایی از موضوعات را برای امروز در نظر گرفته است، بنابراین برای یک ارائه طولانیتر آماده شوید. حدس میزنم نزدیک به دو ساعت طول بکشد تا یک ساعت.
بر اساس تحولات دو سال گذشته، به نظر میرسد که I/O امسال کاملاً در مورد هوش مصنوعی (AI) باشد. گوگل محصولات زیادی در بخشهای جستجو، دستیار، اندروید، Workspace، کروم، نقشه و موارد دیگر دارد که همگی با هوش مصنوعی Gemini خود پر شدهاند یا میتوان آنها را با این هوش مصنوعی تجهیز کرد. بیایید یک بازی انجام دهیم: امروز چند بار کلمه «Gemini» را خواهیم شنید؟ باشه، شاید این خیلی ساده باشد. به نظر شما چند بار کلمه «هوش مصنوعی مسئولانه» را خواهیم شنید؟
هنوز منتظر هستیم تا وارد خود آمفی تئاتر شویم، به نظر می رسد طی ۱۰ تا ۲۵ دقیقه آینده باز شود.
از آنجایی که Google I/O یک کنفرانس توسعهدهندگان است، بعید است به هر حال سکویی برای معرفی دستگاههای جدید باشد. اما این بدان معنا نیست که گوگل در گذشته چنین نکرده است. ما شاهد معرفی Pixel Tablet و Pixel Fold در نمایشگاه سال گذشته بودیم. گوگل همچنین در I/O سال ۲۰۲۲ عینکهای AR جدیدی را معرفی کرد، اگرچه این پوشیدنی هرگز در دسترس منتقدان یا عموم مردم قرار نگرفت. با تشکر از اینکه به من در این گذر کوتاه در خاطرات I/O های گذشته پیوستید. دلم برایش تنگ شده و آرزو می کنم آنجا بودم!
در صورتی که کنجکاو بودید که آیا امروز قراره سختافزار جدیدی ببینیم، به احتمال زیاد هیچ پیکسل جدیدی نخواهیم دید. گوگل پیکسل ۸a خودش رو هفته پیش معرفی کرد و میتونید برای دیدن جزئیات، بررسی کامل ما رو روی این گوشی میانرده اندروید بخونید. خلاصه که؟ سام عاشقش شد و هنوزم محبوبترین گوشی زیر ۵۰۰ دلار ماست!
اگر هنوز از انتظارات ما برای کنفرانس توسعهدهندگان گوگل امروز مطلع نیستید، میتوانید برای مرور سریع نگاهی به پست پیشنمایش ما بیندازید. بیشتر آن غیرمنتظره نخواهد بود – البته هوش مصنوعی به احتمال زیاد دستور کار را تحت سلطه خود درمیآورد. برای دریافت اخبار در اپست در اواخر بعد از ظهر امروز منتظر باشید! و اگر دوست داشتید، میتوانید به همراه من و دِویندر هارداوار، بررسیکننده ارشد، امروز بعد از ظهر حدود ساعت ۳ ب برای پخش زنده خلاصه هر آنچه امروز یاد میگیریم، بپیوندید.
سلام به همه به Google I/O 2024 خوش آمدید. من چرلین لو، سردبیر جانشین هستم که بعد از یک بازنشستگی ذهنی کوتاه برگشتم تا امروز اخبار نمایشگاه را برایتان بیاورم. همچنین تصاویر سم روترفورد، منتقد ارشد را خواهید دید که در آمفی تئاتر شورلاین به همراه کریسا بل، گزارشگر ارشد حضور دارد که بیشتر کارهای وبلاگ نویسی زنده را امروز انجام خواهد داد! من خیلی حسادت میکنم که آنها میتوانند از خوراکیهای گوگل در محل نمایشگاه استفاده کنند.