اپلیکیشن انتخاب سردبیر اندروید اینترنت و شبکه تکنولوژی خودرو سیستم عامل موبایل کامپیوتر موبایل هوش مصنوعی

به‌روزرسانی‌های زنده Google I/O 2024: هوش مصنوعی جِمینی، اندروید 15 و موارد دیگر

می 14, 2024

0 4 خواندن این مطلب 20 دقیقه زمان میبرد

فهرست مطالب

به‌روزرسانی‌های زنده Google I/O 2024: هوش مصنوعی جِمینی، اندروید 15 و موارد دیگر

به گزارش اپست به نقل از انجگت ، کمپانی گوگل در حال آماده شدن برای به اشتراک گذاشتن انبوهی از اخبار در مورد هوش مصنوعی و جستجو در کنفرانس توسعه دهندگان I/O در تاریخ ۱۴ می است و ما انتظار انبوهی از اعلامیه‌ها در مورد جミニ، اندروید، جستجو و موارد دیگر را داریم. این شرکت حتی نمی توانست تا سخنرانی اصلی خود صبر کند تا ما را در جریان آنچه که در حال پخت و پز بوده است قرار دهد و قبلاً با یک ویدیو از یک ویژگی هوش مصنوعی مبتنی بر دوربین در حساب های اجتماعی خود ما را اذیت کرده است.

بر اساس آنچه تاکنون می دانیم، به نظر می رسد این رویدادی با چندین ساعت رونمایی و اعلامیه های فراوان باشد. اگر نمی توانید سخنرانی اصلی Google I/O 2024 را برای مدت طولانی تماشا کنید، یا رویکرد مبتنی بر متن و تصویر را ترجیح می دهید، ما وبلاگ زنده را برای شما در نظر گرفته ایم. خبرنگاران ما، کریسا بل و سام روترفورد، در آمفی تئاتر شورلین حضور خواهند داشت تا اخبار را به صورت زنده برای شما به ارمغان بیاورند، با پشتیبانی کل تیم انگجت. برای پوشش همه به‌روزرسانی‌های Google I/O 2024، حدود ساعت ۱۲ ظهر به وقت شرقی در تاریخ ۱۴ مه برگردید!

Gemini در پانل کناری برنامه‌های Google مانند Gmail و Docs قابل دسترسی خواهد بود

گوگل اتوماسیون هوش مصنوعی مبتنی بر Gemini را به وظایف بیشتری در Workspace اضافه می کند. این شرکت در سخنرانی سه‌شنبه Google I/O خود گفت که Gemini 1.5 Pro پیشرفته‌اش به‌زودی در پانل جانبی Workspace به‌عنوان «بافت همبند در چندین برنامه با جریان‌های کاری مبتنی بر هوش مصنوعی» در دسترس خواهد بود، زیرا هوش مصنوعی هوشمندتر می‌شود، و اطلاعات بیشتری درباره آن می‌آموزد. شما و بیشتر گردش کار شما را خودکار می کند.

از اینکه به ما پیوستید متشکریم. ما تلاش می کنیم تا نگاه دقیق تری به برخی از چیزهایی که گوگل امروز در I/O اعلام کرد داشته باشیم.

اوه، و آن ساندار آخرین شمارش هوش مصنوعی را یک بار دیگر به 121 رساند.

چه کسی می خواهد شرط بندی کند که آیا گوگل در سال آینده بالاتر از آن قرار خواهد گرفت؟

راستش من خوشحالم که بیشتر از این دوام نیاورد. در حالی که سم و کاریسا می روند و دمویی که ممکن است در I/O 2024 در دسترس باشد را بررسی کنند، بیایید و به من و داور ارشد Devindra Hardawar در کانال YouTube Engadget بپیوندید. من مطمئن هستم که افکار و احساساتی برای به اشتراک گذاشتن در مورد همه چیزهایی که Google اخیراً اعلام کرده است دارید!

و این خلاصه ای از سخنرانی اصلی است، *فقط* کمتر از 2 ساعت از همه چیزهای Gemini و AI بود.

حتی گوگل در مورد اینکه چند بار مردم هوش مصنوعی گفته اند جوک می کند

طبق گفته ساندار (که به تازگی روی صحنه برگشته) و جمینی، 120 ذکر از “AI” در این سخنرانی کلیدی. من واقعاً کمی بالاتر حدس می زدم.

Gems از مدل جدید LearnLM استفاده خواهد کرد که بر اساس Gemini ساخته شده است.

گوگل، مانند بسیاری از همتایان خود با هوش مصنوعی، قصد دارد از واترمارک برای افزایش شفافیت در مورد محتوای تولید شده توسط هوش مصنوعی با SynthID استفاده کند. این واترمارک‌ها به ویدیوهای تولید شده توسط هوش مصنوعی (آن نسخه‌های نمایشی Veo از قبل را به خاطر دارید؟) و متن گسترش خواهند یافت، که به ویژه جالب است زیرا متن تولید شده توسط هوش مصنوعی بسیار رایج‌تر است (و از جهاتی تشخیص آن سخت‌تر از تصاویر یا ویدیوها است).

SynthID ابزاری است که گوگل در حال ساخت آن است تا به راحتی محتوای تولید شده توسط هوش مصنوعی را شناسایی کند. اما به نظر می رسد چیزی از جهان Blade Runner است که مردم می توانند از آن برای تشخیص replicants استفاده کنند.

ما در حال وارد شدن به بخش “ساختن مسئولانه هوش مصنوعی” هستیم، با نگاهی به رویکرد Google برای تیم قرمز، فرآیند جستجوی تهدیدها، خروجی های “مشکل” و سایر مسائلی که ممکن است برای گوگل (و شاید بقیه ما) مشکل ایجاد کند. ). پس از شکست در تولید کننده تصویر Gemini در اوایل سال جاری، من واقعاً متعجبم که آنها این مدت طولانی منتظر ماندند تا همه اینها را مطرح کنند.

جیمز مانیکا در Google I/O 2024 درباره اخلاق و مسئولیت‌پذیری هوش مصنوعی صحبت می‌کند.

بنابراین به نظر می‌رسد که به بخش برنامه‌نویس محور اصلی I/O رسیده‌ایم. من و کاریسا فقط در مورد این صحبت کردیم که چگونه برای افراد غیر توسعه‌دهنده، تنظیم کردن مقادیر توکن‌های موجود در طرح‌های مختلف Gemini دشوار است.

ما در حال بررسی عمیق تر Gemini Flash هستیم که اولین بار در بالای سخنرانی اصلی درباره آن شنیدیم. فلاش مدل Gemini “سبک تر” است که تاخیر کمتری دارد و کارایی بیشتری دارد. به نظر می رسد که این برای توسعه دهندگان و سازمان هایی است که به قدرت کامل Gemini 1.5 Pro نیاز ندارند اما همچنان می خواهند از قابلیت های چند وجهی استفاده کنند.

بله، من فکر می‌کنم ویژگی هشدار کلاهبرداری واقعاً خوب است، زیرا می‌تواند در زمان واقعی به شما یک بررسی دقیق بدهد، زمانی که ممکن است احساس کنید که تماس کمی ناراحت‌کننده است.

Google Gemini می تواند با حساب Workspace خود به یک هم تیمی مجازی هوش مصنوعی قدرت دهد

سیستم‌های هوش مصنوعی Gemini گوگل می‌توانند کارهای زیادی انجام دهند، با توجه به سخنرانی امروزی I/O. این شامل گزینه ای برای راه اندازی یک هم تیمی مجازی با حساب Workspace خودش است. شما می توانید هم تیمی را برای انجام وظایف خاص، مانند نظارت و پیگیری پروژه ها، سازماندهی اطلاعات، ارائه زمینه، مشخص کردن روندها پس از تجزیه و تحلیل داده ها و ایفای نقش در همکاری تیمی، پیکربندی کنید.

جاش وودوارد بازگشته است تا در مورد مدل های مختلف Gemini که در دسترس توسعه دهندگان است صحبت کند.

گوگل راه حل دیگری برای تماس های کلاهبرداری بی پایان دارد. اگر تماس را دریافت کنید، و متوجه شد که تماس “مشکوک” یا کلاهبرداری احتمالی است، می تواند یک هشدار بزرگ را مستقیماً روی تلفن شما نشان دهد و به طور بالقوه شما را از خرید هزاران دلار کارت هدیه یا انتقال وجه به یک حساب سرکش نجات دهد. بسیاری از این کلاهبرداری‌ها آشکار به نظر می‌رسند، اما مردم همچنان به آنها علاقه دارند و این ممکن است کمک کند.

به‌روزرسانی‌های TalkBack

مثلاً آیا روزی را خواهیم دید که به شما اجازه می‌دهند برای شرکت در آزمون‌های SAT گوشی بیاورید؟ زیرا در غیر این صورت، به طور بالقوه به دانش‌آموزان کمکی می‌دهید که ممکن است نتوانند در طول ارزیابی‌های مهم از آن استفاده کنند، که ممکن است به یک نقطه ضعف تبدیل شود.

کاریسا، من فکر می‌کنم فرمول‌های پشتیبانی Circle to Search عجیب و غریب است، زیرا برای افراد مسن‌تری مانند ما (یا حداقل من)، شبیه تقلب است.

من از جستجو برای چیزی و در نتیجه گرفتن یک ویدیوی 5 دقیقه‌ای YouTube متنفرم، بنابراین این که بتوانم به جای آن «از این ویدیو بپرسم» چیزی است که قطعاً می‌توانم ببینم که از آن استفاده می‌کنم. نمی‌دانم که آیا هنوز هم باید پیش‌بازی را تماشا کنید؟

دیو برک در Google I/O درباره ادغام عمیق تر Gemini در اندروید صحبت می کند.

حلقه برای جستجو به زودی از فرمول ها پشتیبانی می کند.

من می‌دانم که چرا کمک کردن به سؤالات تکالیف برای Google می‌تواند مفید باشد، اما چیزی وجود دارد که در مورد تشویق دانش‌آموزان و والدین به استفاده از کمک‌های تکالیف به هوش مصنوعی Google هنوز کمی احساس می‌کند.

خوب، حاشیه: آنها عکسی از شخصی نشان دادند که در حال جستجوی سس Fly by Jing بود. این چیزها عالی است.

ما بالاخره بخش Android از سخنرانی اصلی را شروع کردیم. وای، Gemini در حال تبدیل شدن به دستیار هوش مصنوعی جدید در اندروید است، بنابراین حدس می‌زنم دستیار گوگل مرده است؟

در نهایت، وقت آن است که در مورد اندروید با سمیر سمت صحبت کنیم.

اوه نه، ما به بخش موسیقی Google I/O رسیده ایم.

ابزارهای جدید تشخیص کلاهبرداری گوگل هشدارهای بلادرنگ را در طول تماس های تلفنی ارائه می دهند

گوگل به تازگی ابزارهای تشخیص کلاهبرداری آتی را که اواخر امسال به گوشی‌های اندرویدی عرضه می‌شود، معرفی کرد، که این یک چیز خوب است زیرا این کلاهبرداران در جدا کردن افراد از پول خود بهتر و بهتر می‌شوند. این مجموعه ابزار که در Google I/O 2024 فاش شد، هنوز در مراحل آزمایشی است اما از هوش مصنوعی برای سرکوب کلاهبرداران در میانه مکالمه استفاده می کند.

موافقم. من با استفاده از chatGPT و سایر ابزارهای هوش مصنوعی برای برنامه ریزی یک برنامه سفر تابستان گذشته آزمایش کردم و کمی سخت بود. در هر صورت، این بیشتر یک نقطه شروع بود تا یک راه حل واقعی، به خصوص به این دلیل که چندین پیشنهاد آن توهمات مستقیم بودند! شاید جوزا بهتر عمل کند،

برنامه ریزی سفر با جمینی

اکنون سیسی در مورد برنامه ریزی سفر با جمینی صحبت می کند، و من احساس می کنم تعطیلات بسیار گران است که نمی توان به یک هوش مصنوعی برنامه ریزی کرد. مدتی طول می کشد تا مردم با اجازه دادن به هوش مصنوعی اینگونه فرمان را به دست بگیرند، احساس راحتی کنند.

برنامه Gemini در حال دریافت یک ویژگی جدید “Live” است که فناوری Project Astra را که در ابتدای سخنرانی شاهد بودیم به ارمغان می آورد. می تواند صحبت کند و به دستورات صوتی پاسخ دهد و از دوربین تلفن شما برای ورودی استفاده کند.

فناوری ممکن است وجود داشته باشد، اما من واقعاً فکر نمی‌کنم که انسان‌ها برای همکاران هوش مصنوعی آماده باشند. آیا حتی می توانید تصور کنید افرادی که با ایمیل ها مشکل دارند سعی می کنند با چت ربات های هوشمند در Slack صحبت کنند؟

Gemini Nano گوگل هوشمندی های بهتری برای توصیف تصویر به ابزار دید TalkBack خود می آورد

رویداد Google I/O اینجاست و این شرکت به‌روزرسانی‌های عالی زیادی را برای دستگاه اندرویدی شما اعلام می‌کند. همانطور که قبلا شنیدیم، Gemini Nano پشتیبانی چندوجهی دریافت می‌کند، به این معنی که اندروید شما همچنان متن را پردازش می‌کند، اما با درک بهتر عوامل دیگر مانند مناظر، صداها و زبان گفتاری. اکنون گوگل به اشتراک گذاشته است که ابزار جدید به ویژگی TalkBack آن نیز می آید.

TalkBack یک ابزار موجود است که توصیف یک تصویر را با صدای بلند می خواند، خواه تصویری که شما گرفته اید یا از طریق اینترنت. پشتیبانی چندوجهی Gemini Nano باید درک دقیق تری از تصویر ارائه دهد.

Sissie Hsiao در Google I/O 2024

چیپ در اصل یک همکار هوش مصنوعی است. می تواند اسناد مشترک را تجزیه و تحلیل کند، جلسات را برنامه ریزی کند و پروژه ها را در فضای کاری شرکت شما ردیابی کند. به نظر می رسد که سازمان ها می توانند نسخه های تراشه خود را مطابق با نیازهای خود سفارشی کنند.

Google Gemini را مستقیماً در Android ایجاد می کند و آگاهی متنی را در برنامه ها اضافه می کند

گوگل اخیراً به‌عنوان بخشی از رویداد I/O 2024، بهبودهای بسیار خوبی را در چت ربات هوش مصنوعی Gemini خود برای دستگاه‌های اندرویدی اعلام کرد. هوش مصنوعی اکنون بخشی از سیستم عامل اندروید است و به آن اجازه می دهد تا به روشی جامع تر ادغام شود.

جالب ترین ویژگی جدید بدون آن ادغام با سیستم عامل اصلی امکان پذیر نخواهد بود. Gemini اکنون در درک زمینه بسیار بهتر است زیرا شما برنامه ها را در تلفن هوشمند کنترل می کنید. این دقیقا به چه معنی است؟ هنگامی که این ابزار به‌عنوان بخشی از اندروید 15 به‌طور رسمی راه‌اندازی شد، می‌توانید یک پوشش Gemini که در بالای برنامه‌ای که استفاده می‌کنید قرار دارد، ایجاد کنید. این امکان اعمال و پرس و جوهای مربوط به زمینه را فراهم می کند.

تونی وینسنت در Google I/O 2024

Circle to Search اندروید اکنون می‌تواند به دانش‌آموزان در حل تکالیف ریاضی و فیزیک کمک کند

گوگل قابلیت دیگری را برای ویژگی Circle to Search خود در کنفرانس سالانه توسعه دهندگان I/O این شرکت معرفی کرده است و این چیزی است که می تواند به دانش آموزان کمک کند تا موضوعات کلاسی بالقوه دشوار را بهتر درک کنند. این ویژگی اکنون می‌تواند دستورالعمل‌های گام به گام را برای «مسائل کلمات فیزیک و ریاضی» به آنها نشان دهد. آنها فقط باید این ویژگی را با فشار طولانی دکمه هوم یا نوار ناوبری فعال کنند و سپس دور مشکلی که باعث سرگردانی آنها شده است را بچرخانند، اگرچه برخی از مشکلات ریاضی نیاز به ثبت نام کاربران در ویژگی آزمایشی آزمایشگاه های جستجوی گوگل دارند.

به هر حال، ما رسماً یک ساعت به این سخنرانی اصلی رسیده ایم، و هنوز هیچ علاقه ای به اندروید نداریم. می دانم که بعداً زمان زیادی برای به روز رسانی اندروید وجود خواهد داشت، اما در مورد اینکه تا چه حد اولویت های گوگل تغییر کرده اند، چیزهای زیادی می گوید، چندی پیش بود که اندروید ستاره I/O بود. اکنون، تقریباً مانند یک فکر بعدی به نظر می رسد.

اگرچه من حدس می‌زنم که این به نوعی جلوتر از جایی است که هوش مصنوعی در حال حاضر در آن قرار دارد.

اما من باید فکر کنم که آیا این نقش ممکن است توسط یک عامل هوش مصنوعی که همین کارها را با ورودی دستی بالقوه کمتر انجام دهد، بهتر انجام شود.

بله، من قصد ندارم دروغ بگویم، توانایی هوش مصنوعی برای خلاصه کردن چیزها خوب است، اما به نظر می رسد پایین ترین درجه از قابلیت های آن است. بنابراین خوب است که ببینیم با پاسخ‌های متنی و انتقال داده‌ها بین برنامه‌های مختلف مانند Gmail، Calendar و غیره، اوضاع چگونه در حال تکامل است.

Gemini قصد دارد برخی از ویژگی‌های جدید جالب را در برنامه Gmail تقویت کند، از جمله خلاصه‌ای از رشته‌های ایمیل طولانی. همچنین می‌توانید مستقیماً با Gemini چت کنید تا جزئیات را از صندوق ورودی خود بیابید. همچنین پیشنهادات پاسخ جدیدی وجود دارد که می تواند زمینه ایمیل های شما را برای پیشنهادات متنی مفیدتر (امیدوارم) درک کند. من هرگز تحت تاثیر پیشنهادات خودکار جیمیل قرار نگرفته ام، اما شاید Gemini آنها را واقعا مفید کند.

آپارنا پاپو در Google I/O

بله، ساختن همه اینها در دنیای واقعی چیزی نیست که فقط بتوانید انگشتانتان را بشکنید. اما در ادامه، تقریباً من را به این فکر می‌اندازد که آیا نقش بشریت در آینده ممکن است این باشد که هر ارتشی از عوامل هوش مصنوعی را که در اختیار دارید بررسی کنید.

خوب، این در واقع بسیار مفید به نظر می رسد. جستجو قابلیت‌های تشخیص ویدیو را دریافت می‌کند، بنابراین می‌توانید براساس محتویات یک ویدیو جستجو کنید، که می‌تواند به ویژه زمانی که نیاز به اصلاح چیزی یا پاسخ به سؤالی دارید که به راحتی نمی‌توانید توضیح دهید، مفید باشد. Google قادر خواهد بود آنچه در کلیپ است را بفهمد و (امیدواریم) نتایج مرتبط را نشان دهد.

Gemini گوگل ویدیوهای شما را جستجو می کند تا به شما در حل مشکلات کمک کند

گوگل به عنوان بخشی از تلاش خود برای افزودن هوش مصنوعی مولد به جستجو، یک پیچ جدید را معرفی کرده است: ویدیو. Gemini به شما اجازه می‌دهد ویدیویی را آپلود کنید که نشان می‌دهد مشکلی را که می‌خواهید حل کنید، سپس انجمن‌های کاربران و سایر مناطق اینترنت را برای یافتن راه‌حل جستجو کنید.

به عنوان مثال، رز یائو از گوگل روی صحنه در I/O 2024 در مورد صفحه گردان دست دومی که خریده بود صحبت کرد و اینکه چطور نتوانست سوزن را روی صفحه ضبط کند.

رز یائو در Google I/O 2024

به نظر می رسد این آینده ای است که گوگل در حال حاضر به ما وعده می دهد. دیگر فقط یافتن اطلاعات مورد نیاز نیست، بلکه به «نمایندگان» گوگل اجازه می‌دهد تا کارهایی مانند اضافه کردن به لیست خرید شما را انجام دهند. من هنوز سوالات زیادی در مورد اینکه همه اینها در دنیای واقعی چقدر خوب عمل می کند، دارم.

اکنون جستجوی گوگل به طور پیش‌فرض به میلیون‌ها نفر پاسخ‌های تولید شده توسط هوش مصنوعی را نشان می‌دهد

گوگل

گوگل جستجو را تکان می دهد. روز سه‌شنبه، این شرکت در کنفرانس سالانه Google برای توسعه‌دهندگان، تغییرات بزرگ جدید مبتنی بر هوش مصنوعی را در موتور جستجوی غالب جهان اعلام کرد. با ویژگی های جدید، گوگل جستجو را به عنوان چیزی بیش از راهی برای یافتن وب سایت ها قرار می دهد. در عوض، این شرکت از مردم می‌خواهد که از موتور جستجوی آن برای دریافت مستقیم پاسخ‌ها و کمک به آنها در برنامه‌ریزی رویدادها و ایده‌های طوفان فکری استفاده کنند.

نکته خوب کاریسا من فکر می‌کنم زاک نبرد سخت‌تری دارد، زیرا فیس‌بوک/متا مانند گوگل یا اپل تأثیری روی سخت‌افزار ندارند. اما می‌توانید مشاهده کنید که متا تلاش می‌کند تا آن را با دستگاه‌هایی مانند عینک هوشمند Ray-Ban تغییر دهد.

در حالی که هنوز خیلی زود است، به نظر می رسد که از Star Trek به رایانه نزدیک می شویم، یک موجودیت واقعی هوش مصنوعی فردی که رفتار خود را برای هر فرد تنظیم می کند.

این فقط گوگل نیست. مارک زاکربرگ نیز در مورد وعده “عوامل AI” صحبت کرده است، اگرچه من فکر می کنم مسیر گوگل برای رسیدن به آنجا بسیار ساده تر است، همانطور که اکنون با این بررسی عمیق در بررسی های AI در جستجو می بینیم.

آیا «عامل» داغ‌ترین کلمه در Google I/O امسال خواهد بود؟

مطمئناً به نظر می‌رسد که قبل از اینکه کسی عمیق‌تر به Android یا ChromeOS بپردازد، یک ساعت کامل درباره هوش مصنوعی خواهیم داشت.

لیز رید در Google I/O 2024

تقریباً 45 دقیقه به این سخنرانی اصلی رسیده‌ایم و ذکر مختصری از Circle to Search یکی از اولین بارهایی است که ساندار در تمام طول روز «Android» را گفت. نشانه دیگری از اینکه امروز همه چیز در مورد هوش مصنوعی است.

ظاهراً ابر رایانه ها دیگر به اندازه کافی خوب نیستند.

واحد پردازش تنسور (TPU) نسل ششم گوگل Trillium نام دارد و اواخر امسال برای مشتریان Cloud خود عرضه می شود. ممکن است TPU ها در بین بسیاری از به روز رسانی های هوش مصنوعی گوگل امروزی جذاب ترین نباشند، اما بخش مهمی از کار هوش مصنوعی آن است.

گوگل از Veo و Imagen 3، جدیدترین مدل های ایجاد رسانه هوش مصنوعی خود رونمایی کرد

در Google I/O همیشه هوش مصنوعی است! امروز، گوگل موتورهای جدید ایجاد رسانه هوش مصنوعی خود را معرفی کرد: Veo، که می تواند ویدیوهای 1080p با کیفیت بالا تولید کند. و Imagen 3، آخرین چارچوب متن به تصویر آن. هیچ‌کدام به‌خصوص انقلابی به نظر نمی‌رسند، اما راهی برای Google برای ادامه مبارزه با مدل ویدیویی Sora OpenAI و Dall-E 3 است، ابزاری که عملاً مترادف با تصاویر تولید شده توسط هوش مصنوعی شده است.

گوگل ادعا می کند که Veo “درکی پیشرفته از زبان طبیعی و معنای بصری” دارد تا هر ویدیویی را که در ذهن دارید ایجاد کند. ویدئوهای تولید شده توسط هوش مصنوعی می توانند «بیش از یک دقیقه» دوام بیاورند. Veo همچنین قادر به درک تکنیک های سینمایی و بصری مانند مفهوم تایم لپس است. اما واقعاً، این باید برای مدل تولید ویدیوی هوش مصنوعی باشد، درست است؟

یک چیز جالب این است که گوگل بیشتر در مورد AGI یا هوش عمومی مصنوعی صحبت می کند.

ایده هوش مصنوعی دارای هوش در سطح انسانی زمانی به عنوان موضوعی کاملاً علمی تخیلی به نظر می رسید، بنابراین شنیدن صحبت های شرکت هایی مانند گوگل در مورد آن در طول یک کنفرانس توسعه دهنده کمی سورئال به نظر می رسد.

با حفظ این موضوع، گوگل یک تولید کننده ویدیوی جدید به نام Veo را به نمایش می گذارد. به نظر می رسد دونالد گلاور آزمایش کننده اولیه این فناوری بوده است. تا اینجای کار، این کلیپ ها به طرز شگفت انگیزی صاف و واقعی به نظر می رسند. Veo در هفته‌های آینده به «انتخاب سازندگان» در VideoFX می‌آید.

دونالد گلاور از Veo برای ساخت یک فیلم کوتاه استفاده می کند.

Wyclef Jean در حال آزمایش هوش مصنوعی مولد برای کمک به ساخت موسیقی است.

Google I/O یک کنفرانس توسعه دهندگان است، اما جالب است که ما شاهد تاکید زیادی برای موارد استفاده خلاقانه از نسل هوش مصنوعی، مانند تولید تصویر و موسیقی هستیم.

گوگل به تازگی یک جفت عینک واقعیت افزوده را در نسخه نمایشی Project Astra در I/O فرو برده است

در ویدئویی که نشان‌دهنده مهارت برنامه جدید Project Astra بود، فردی که نمایش می‌داد از Gemini پرسید: “یادت هست عینک من را کجا دیدی؟” هوش مصنوعی به طرز چشمگیری پاسخ داد: “بله، دارم. عینک شما روی میز نزدیک یک سیب قرمز قرار داشت”، علیرغم اینکه شیء گفته شده در هنگام پرسیدن سوال واقعا در معرض دید نبود. اما اینها کمک بصری استاندارد باتلاقی شما نبودند. این عینک دارای دوربین و نوعی رابط بصری بود!

Imagen 3 جدیدترین تولیدکننده متن به تصویر گوگل است و ظاهراً در ایجاد متن در تصاویر بسیار بهتر است، که برای بسیاری از تولیدکنندگان تصویر ترفند بوده است.

داگ اک در Google I/O 2024

Google’s Project Astra از دوربین و هوش مصنوعی گوشی شما برای یافتن سازندگان نویز، موارد نابجا و موارد دیگر استفاده می کند.

هنگامی که گوگل برای اولین بار فناوری دستیار صوتی Duplex خود را در کنفرانس توسعه دهندگان خود در سال 2018 به نمایش گذاشت، هم چشمگیر و هم نگران کننده بود. امروز، در I/O 2024، این شرکت ممکن است دوباره همان واکنش‌ها را مطرح کند، این بار با نشان دادن کاربرد دیگری از هوش مصنوعی خود با چیزی به نام Project Astra.

این شرکت حتی نمی‌توانست تا سخنرانی امروز خود صبر کند تا پروژه Astra را مورد آزار و اذیت قرار دهد و دیروز ویدیویی را از یک برنامه هوش مصنوعی مبتنی بر دوربین در رسانه‌های اجتماعی خود منتشر کرد. با این حال، دمیس حسابیس، مدیرعامل DeepMind گوگل در سخنرانی امروز خود به اشتراک گذاشت که تیم او “همیشه می خواستند عوامل هوش مصنوعی جهانی را توسعه دهند که می توانند در زندگی روزمره مفید باشند.” پروژه آسترا نتیجه پیشرفت در این زمینه است.

جزئیات زیادی در مورد Astra فراتر از آن ویدیو وجود ندارد، اما ظاهراً امروز یک نسخه ی نمایشی زنده از آن در اینجا وجود خواهد داشت، بنابراین امیدواریم که ما بعد از این ویدیو نگاه دقیق تری داشته باشیم.

ما در حال بررسی چیزی به نام Project Astra هستیم که بخشی از ماموریت گوگل برای ایجاد «عوامل هوش مصنوعی جهانی» است. به نظر می رسد این همان چیزی است که گوگل دیروز به طور مختصر در X به آن اشاره کرد – این شبیه یک نسخه لنز گوگل با هوش مصنوعی است، می تواند آنچه را در کادر دوربین در زمان واقعی وجود دارد تشخیص دهد و حتی در مورد اشیاء خارج از کادر به سوالات پاسخ دهد. همچنین به نظر می رسد که نوعی جزء عینک وجود دارد.

پروژه آسترا

مدل جدید Gemini 1.5 Flash AI گوگل سبک تر از Gemini Pro است و در دسترس تر است

گوگل روز سه‌شنبه در کنفرانس سالانه توسعه‌دهندگان، I/O، به‌روزرسانی‌های مدل‌های هوش مصنوعی جمینی خود را اعلام کرد. این شرکت در حال عرضه یک مدل جدید به نام Gemini 1.5 Flash است که می گوید برای سرعت و کارایی بهینه شده است.

Demis Hassabis، مدیرعامل Google DeepMind گفت: «1.5 Flash در خلاصه‌سازی، برنامه‌های چت، شرح تصاویر و ویدیوها، استخراج داده‌ها از اسناد و جداول طولانی و موارد دیگر برتری دارد.

Gemini 1.5 Flash یک مدل جدید جمینی با وزن سبک تر است که دارای قابلیت های چندوجهی است اما کارآمدتر از Gemini 1.5 Pro است.

دمیس حسابیس در Google I/O 2024

استفاده از هوش مصنوعی برای خودکار کردن فرآیند بازگرداندن چیزی که خریداری کرده اید.

ساندار بازگشته است و در مورد وعده “عوامل هوش مصنوعی” صحبت می کند، که در واقع می توانند وظایف را از طرف ما انجام دهند. او می‌گوید که آنها باید بتوانند «از قبل فکر کنند و استدلال کنند» تا به ما در انجام کارها کمک کنند.

استفاده از هوش مصنوعی برای زمینه سازی آموزش

ما نگاهی به Gemini 1.5 Pro در NotebookLM و نحوه فعال کردن ویژگی‌های صوتی مانند دستیار صوتی داریم. اساساً مجموعه ای از مطالب منبع را تجزیه و تحلیل می کند و می تواند آن را به طور طبیعی توضیح دهد و حتی به سؤالات پاسخ دهد.

Josh Woodward at Google I/O 2024

Gemini 1.5 Pro

از Google Photos بخواهید که برای درک گالری شما راهنمایی دریافت کند

گوگل بیشتر از هوش مصنوعی Gemini خود را در هر محصولی که دارد وارد می کند و هدف بعدی در نظرش Photos است. در کنفرانس توسعه دهندگان I/O امروز، ساندار پیچای، مدیرعامل این شرکت، قابلیتی به نام Ask Photos را اعلام کرد که برای کمک به شما در یافتن تصاویر خاص در گالری خود با صحبت با Gemini طراحی شده است.

جستجو در حال حاضر یکی از بهترین ویژگی‌های Google Photos است، اما به نظر می‌رسد Gemini آن را قدرتمندتر می‌کند. Sundar نشان داد که چگونه نه تنها می‌تواند جزئیات را در عکس‌های خاص جستجو کند، بلکه می‌تواند زمینه وسیع‌تر چندین عکس را در طول زمان درک کند، مانند ردیابی مهارت‌های شنای کودک شما در طول تابستان.

Ask Photos یک ویژگی کوچک ساده به نظر می رسد، اما می تواند واقعا مفید باشد. من دائماً چیزهایی را در Photos جستجو می‌کنم و معمولاً باید به یاد بیاورم که چه زمانی عکس را گرفته‌ام و سپس فقط در جدول زمانی خود پیمایش کنم تا آن را پیدا کنم.

نسخه نمایشی Google Ask Photos

اول Google Photos است، Gemini در قالب یک چت ربات مفید به Google Photos می آید که می تواند به سؤالات مربوط به آنچه در گالری شما وجود دارد پاسخ دهد. «عکس بپرس» تابستان امسال می آید.

مروری بر هوش مصنوعی

فکر می‌کنم همه می‌دانستند که گوگل با صحبت کردن درباره جمینی کارها را آغاز می‌کند. اما من کنجکاو هستم که چگونه دستیار گوگل و جمینی در آینده در کنار یکدیگر (یا شاید هم) کار کنند.

ساندار پیچای در Google I/O 2024

ساندار روی صحنه است، او به شوخی می گوید که I/O “نسخه گوگل از تور Eras” است و می گوید که گوگل در “عصر جمینی” خود است، بنابراین انتظار یک سخنرانی کلیدی را داشته باشید که همه چیز هوش مصنوعی باشد.

حالا مارک درخواست های موسیقی را از جمعیت دریافت می کند و می خواهد کار Loop Daddy خود را انجام دهد و آن را به یک آهنگ کامل تبدیل کند.

Marc Rebillet در حال آزمایش برخی از نمونه‌های موسیقی هوش مصنوعی در Google I/O 2024 است

او به تازگی برخی از ابزارهای موسیقی مولد هوش مصنوعی گوگل را به نمایش گذاشته است، به نظر می رسد از شنیده هایش تحت تاثیر قرار گرفته است، می گوید که چیزهای بیشتری در راه است.

اکنون مارک در حال ورود به موسیقی مولد ساخته شده توسط هوش مصنوعی است.

Marc Rebillet در Google I/O

مارک ریبیلت به تازگی از یک لیوان ورودی/خروجی در اندازه واقعی بیرون آمده و وظایف را بر عهده گرفته است.

سالن در حال پر شدن است!

ما در حال معاشرت هستیم ، خیلی خنک است. سالن آمفی تئاتر در حال پر شدن است.

نمای نزدیک Google I/O

و ما رسما یک ساعت بیرون هستیم!

ما وارد شدیم

ریویان R1S در Google I/O

گوگل یک ریوین را در خارج از چادر مطبوعات قرار داده است، بنابراین به احتمال زیاد امروز بعد از ظهر برخی به‌روزرسانی‌های Android Automotive را دریافت خواهیم کرد.

فقط شنیدم که گوگل لیست بلندبالایی از موضوعات را برای امروز در نظر گرفته است، بنابراین برای یک ارائه طولانی‌تر آماده شوید. حدس می‌زنم نزدیک به دو ساعت طول بکشد تا یک ساعت.

بر اساس تحولات دو سال گذشته، به نظر می‌رسد که I/O امسال کاملاً در مورد هوش مصنوعی (AI) باشد. گوگل محصولات زیادی در بخش‌های جستجو، دستیار، اندروید، Workspace، کروم، نقشه و موارد دیگر دارد که همگی با هوش مصنوعی Gemini خود پر شده‌اند یا می‌توان آن‌ها را با این هوش مصنوعی تجهیز کرد. بیایید یک بازی انجام دهیم: امروز چند بار کلمه «Gemini» را خواهیم شنید؟ باشه، شاید این خیلی ساده باشد. به نظر شما چند بار کلمه «هوش مصنوعی مسئولانه» را خواهیم شنید؟

هنوز منتظر هستیم تا وارد خود آمفی تئاتر شویم، به نظر می رسد طی ۱۰ تا ۲۵ دقیقه آینده باز شود.

از آنجایی که Google I/O یک کنفرانس توسعه‌دهندگان است، بعید است به هر حال سکویی برای معرفی دستگاه‌های جدید باشد. اما این بدان معنا نیست که گوگل در گذشته چنین نکرده است. ما شاهد معرفی Pixel Tablet و Pixel Fold در نمایشگاه سال گذشته بودیم. گوگل همچنین در I/O سال ۲۰۲۲ عینک‌های AR جدیدی را معرفی کرد، اگرچه این پوشیدنی هرگز در دسترس منتقدان یا عموم مردم قرار نگرفت. با تشکر از اینکه به من در این گذر کوتاه در خاطرات I/O های گذشته پیوستید. دلم برایش تنگ شده و آرزو می کنم آنجا بودم!

در صورتی که کنجکاو بودید که آیا امروز قراره سخت‌افزار جدیدی ببینیم، به احتمال زیاد هیچ پیکسل جدیدی نخواهیم دید. گوگل پیکسل ۸a خودش رو هفته پیش معرفی کرد و می‌تونید برای دیدن جزئیات، بررسی کامل ما رو روی این گوشی میان‌رده اندروید بخونید. خلاصه که؟ سام عاشقش شد و هنوزم محبوب‌ترین گوشی زیر ۵۰۰ دلار ماست!

اگر هنوز از انتظارات ما برای کنفرانس توسعه‌دهندگان گوگل امروز مطلع نیستید، می‌توانید برای مرور سریع نگاهی به پست پیش‌نمایش ما بیندازید. بیشتر آن غیرمنتظره نخواهد بود – البته هوش مصنوعی به احتمال زیاد دستور کار را تحت سلطه خود درمی‌آورد. برای دریافت اخبار در اپست در اواخر بعد از ظهر امروز منتظر باشید! و اگر دوست داشتید، می‌توانید به همراه من و دِویندر هارداوار، بررسی‌کننده ارشد، امروز بعد از ظهر حدود ساعت ۳ ب برای پخش زنده خلاصه هر آنچه امروز یاد می‌گیریم، بپیوندید.

رونمایی گوگل از پیشرفت‌ جدید هوش‌ مصنوعی خود

سلام به همه به Google I/O 2024 خوش آمدید. من چرلین لو، سردبیر جانشین هستم که بعد از یک بازنشستگی ذهنی کوتاه برگشتم تا امروز اخبار نمایشگاه را برایتان بیاورم. همچنین تصاویر سم روترفورد، منتقد ارشد را خواهید دید که در آمفی تئاتر شورلاین به همراه کریسا بل، گزارشگر ارشد حضور دارد که بیشتر کارهای وبلاگ نویسی زنده را امروز انجام خواهد داد! من خیلی حسادت می‌کنم که آن‌ها می‌توانند از خوراکی‌های گوگل در محل نمایشگاه استفاده کنند.

برچسب ها

می 14, 2024

0 4 خواندن این مطلب 20 دقیقه زمان میبرد

به‌روزرسانی‌های زنده Google I/O 2024: هوش مصنوعی جِمینی، اندروید 15 و موارد دیگر

Gemini در پانل کناری برنامه‌های Google مانند Gmail و Docs قابل دسترسی خواهد بود

Google Gemini می تواند با حساب Workspace خود به یک هم تیمی مجازی هوش مصنوعی قدرت دهد

ابزارهای جدید تشخیص کلاهبرداری گوگل هشدارهای بلادرنگ را در طول تماس های تلفنی ارائه می دهند

Gemini Nano گوگل هوشمندی های بهتری برای توصیف تصویر به ابزار دید TalkBack خود می آورد

Google Gemini را مستقیماً در Android ایجاد می کند و آگاهی متنی را در برنامه ها اضافه می کند

Circle to Search اندروید اکنون می‌تواند به دانش‌آموزان در حل تکالیف ریاضی و فیزیک کمک کند

Gemini گوگل ویدیوهای شما را جستجو می کند تا به شما در حل مشکلات کمک کند

اکنون جستجوی گوگل به طور پیش‌فرض به میلیون‌ها نفر پاسخ‌های تولید شده توسط هوش مصنوعی را نشان می‌دهد

گوگل از Veo و Imagen 3، جدیدترین مدل های ایجاد رسانه هوش مصنوعی خود رونمایی کرد

گوگل به تازگی یک جفت عینک واقعیت افزوده را در نسخه نمایشی Project Astra در I/O فرو برده است

Google’s Project Astra از دوربین و هوش مصنوعی گوشی شما برای یافتن سازندگان نویز، موارد نابجا و موارد دیگر استفاده می کند.

مدل جدید Gemini 1.5 Flash AI گوگل سبک تر از Gemini Pro است و در دسترس تر است

از Google Photos بخواهید که برای درک گالری شما راهنمایی دریافت کند

Subscribe to our mailing list to get the new updates!

سونی پلی استیشن به زودی دو مدیر عامل خواهد داشت

Gemini در پانل کناری برنامه‌های Google مانند Gmail و Docs قابل دسترسی خواهد بود

نوشته های مشابه

چرا ویندوز ۱۱ آپدیت‌های اضافه نصب می‌کند؟ اگر این تنظیم را روشن کرده‌اید، مراقب باشید!

۳ تنظیم مهم ویندوز که می‌توانند عملکرد کامپیوتر شما را متحول کنند

آینده اکسل با هوش مصنوعی؛ چگونه Excel و AI هر روز هوشمندتر و نزدیک‌تر می‌شوند؟

گوگل از مدل‌های جدید Gemini رونمایی کرد؛ اما محبوب‌ترین مدل هنوز عرضه نشده است

دیدگاهتان را بنویسید لغو پاسخ