• امروز : شنبه, ۶ اردیبهشت , ۱۴۰۴
  • برابر با : Saturday - 26 April - 2025
امروز 0
16

به‌روزرسانی‌های زنده Google I/O 2024: هوش مصنوعی جِمینی، اندروید ۱۵ و موارد دیگر

  • کد خبر : 12974
  • ۲۵ اردیبهشت ۱۴۰۳ - ۱۹:۴۶
به‌روزرسانی‌های زنده Google I/O 2024: هوش مصنوعی جِمینی، اندروید 15 و موارد دیگر
ما در حال حاضر، به‌صورت زنده، اخبار مربوط به کنفرانس توسعه‌دهندگان این شرکت را برای شما پوشش می‌دهیم.

فهرست مطالب

به‌روزرسانی‌های زنده Google I/O 2024: هوش مصنوعی جِمینی، اندروید ۱۵ و موارد دیگر

به گزارش اپست به نقل از انجگت ، کمپانی گوگل در حال آماده شدن برای به اشتراک گذاشتن انبوهی از اخبار در مورد هوش مصنوعی و جستجو در کنفرانس توسعه دهندگان I/O در تاریخ ۱۴ می است و ما انتظار انبوهی از اعلامیه‌ها در مورد جミニ، اندروید، جستجو و موارد دیگر را داریم. این شرکت حتی نمی توانست تا سخنرانی اصلی خود صبر کند تا ما را در جریان آنچه که در حال پخت و پز بوده است قرار دهد و قبلاً با یک ویدیو از یک ویژگی هوش مصنوعی مبتنی بر دوربین در حساب های اجتماعی خود ما را اذیت کرده است.

بر اساس آنچه تاکنون می دانیم، به نظر می رسد این رویدادی با چندین ساعت رونمایی و اعلامیه های فراوان باشد. اگر نمی توانید سخنرانی اصلی Google I/O 2024 را برای مدت طولانی تماشا کنید، یا رویکرد مبتنی بر متن و تصویر را ترجیح می دهید، ما وبلاگ زنده را برای شما در نظر گرفته ایم. خبرنگاران ما، کریسا بل و سام روترفورد، در آمفی تئاتر شورلین حضور خواهند داشت تا اخبار را به صورت زنده برای شما به ارمغان بیاورند، با پشتیبانی کل تیم انگجت. برای پوشش همه به‌روزرسانی‌های Google I/O 2024، حدود ساعت ۱۲ ظهر به وقت شرقی در تاریخ ۱۴ مه برگردید!

اینستاگرام اپست

Gemini در پانل کناری برنامه‌های Google مانند Gmail و Docs قابل دسترسی خواهد بود

e30856d0 1221 11ef b4fb 90662859d445

گوگل اتوماسیون هوش مصنوعی مبتنی بر Gemini را به وظایف بیشتری در Workspace اضافه می کند. این شرکت در سخنرانی سه‌شنبه Google I/O خود گفت که Gemini 1.5 Pro پیشرفته‌اش به‌زودی در پانل جانبی Workspace به‌عنوان «بافت همبند در چندین برنامه با جریان‌های کاری مبتنی بر هوش مصنوعی» در دسترس خواهد بود، زیرا هوش مصنوعی هوشمندتر می‌شود، و اطلاعات بیشتری درباره آن می‌آموزد. شما و بیشتر گردش کار شما را خودکار می کند.

از اینکه به ما پیوستید متشکریم. ما تلاش می کنیم تا نگاه دقیق تری به برخی از چیزهایی که گوگل امروز در I/O اعلام کرد داشته باشیم.

اوه، و آن ساندار آخرین شمارش هوش مصنوعی را یک بار دیگر به ۱۲۱ رساند.

چه کسی می خواهد شرط بندی کند که آیا گوگل در سال آینده بالاتر از آن قرار خواهد گرفت؟

راستش من خوشحالم که بیشتر از این دوام نیاورد. در حالی که سم و کاریسا می روند و دمویی که ممکن است در I/O 2024 در دسترس باشد را بررسی کنند، بیایید و به من و داور ارشد Devindra Hardawar در کانال YouTube Engadget بپیوندید. من مطمئن هستم که افکار و احساساتی برای به اشتراک گذاشتن در مورد همه چیزهایی که Google اخیراً اعلام کرده است دارید!

و این خلاصه ای از سخنرانی اصلی است، *فقط* کمتر از ۲ ساعت از همه چیزهای Gemini و AI بود.

d30edf50 1222 11ef b1ff e9a7cdd06c08

حتی گوگل در مورد اینکه چند بار مردم هوش مصنوعی گفته اند جوک می کند

طبق گفته ساندار (که به تازگی روی صحنه برگشته) و جمینی، ۱۲۰ ذکر از “AI” در این سخنرانی کلیدی. من واقعاً کمی بالاتر حدس می زدم.

60747e50 1222 11ef bdff 05dd8e859ca9

Gems از مدل جدید LearnLM استفاده خواهد کرد که بر اساس Gemini ساخته شده است.

گوگل، مانند بسیاری از همتایان خود با هوش مصنوعی، قصد دارد از واترمارک برای افزایش شفافیت در مورد محتوای تولید شده توسط هوش مصنوعی با SynthID استفاده کند. این واترمارک‌ها به ویدیوهای تولید شده توسط هوش مصنوعی (آن نسخه‌های نمایشی Veo از قبل را به خاطر دارید؟) و متن گسترش خواهند یافت، که به ویژه جالب است زیرا متن تولید شده توسط هوش مصنوعی بسیار رایج‌تر است (و از جهاتی تشخیص آن سخت‌تر از تصاویر یا ویدیوها است).

SynthID ابزاری است که گوگل در حال ساخت آن است تا به راحتی محتوای تولید شده توسط هوش مصنوعی را شناسایی کند. اما به نظر می رسد چیزی از جهان Blade Runner است که مردم می توانند از آن برای تشخیص replicants استفاده کنند.

ما در حال وارد شدن به بخش “ساختن مسئولانه هوش مصنوعی” هستیم، با نگاهی به رویکرد Google برای تیم قرمز، فرآیند جستجوی تهدیدها، خروجی های “مشکل” و سایر مسائلی که ممکن است برای گوگل (و شاید بقیه ما) مشکل ایجاد کند. ). پس از شکست در تولید کننده تصویر Gemini در اوایل سال جاری، من واقعاً متعجبم که آنها این مدت طولانی منتظر ماندند تا همه اینها را مطرح کنند.

6e951720 1221 11ef beef b4cbf97d6c18

جیمز مانیکا در Google I/O 2024 درباره اخلاق و مسئولیت‌پذیری هوش مصنوعی صحبت می‌کند.

بنابراین به نظر می‌رسد که به بخش برنامه‌نویس محور اصلی I/O رسیده‌ایم. من و کاریسا فقط در مورد این صحبت کردیم که چگونه برای افراد غیر توسعه‌دهنده، تنظیم کردن مقادیر توکن‌های موجود در طرح‌های مختلف Gemini دشوار است.

ما در حال بررسی عمیق تر Gemini Flash هستیم که اولین بار در بالای سخنرانی اصلی درباره آن شنیدیم. فلاش مدل Gemini “سبک تر” است که تاخیر کمتری دارد و کارایی بیشتری دارد. به نظر می رسد که این برای توسعه دهندگان و سازمان هایی است که به قدرت کامل Gemini 1.5 Pro نیاز ندارند اما همچنان می خواهند از قابلیت های چند وجهی استفاده کنند.

بله، من فکر می‌کنم ویژگی هشدار کلاهبرداری واقعاً خوب است، زیرا می‌تواند در زمان واقعی به شما یک بررسی دقیق بدهد، زمانی که ممکن است احساس کنید که تماس کمی ناراحت‌کننده است.

Google Gemini می تواند با حساب Workspace خود به یک هم تیمی مجازی هوش مصنوعی قدرت دهد

c168bb80 121e 11ef bfdb 43e1d1c8b5b8

سیستم‌های هوش مصنوعی Gemini گوگل می‌توانند کارهای زیادی انجام دهند، با توجه به سخنرانی امروزی I/O. این شامل گزینه ای برای راه اندازی یک هم تیمی مجازی با حساب Workspace خودش است. شما می توانید هم تیمی را برای انجام وظایف خاص، مانند نظارت و پیگیری پروژه ها، سازماندهی اطلاعات، ارائه زمینه، مشخص کردن روندها پس از تجزیه و تحلیل داده ها و ایفای نقش در همکاری تیمی، پیکربندی کنید.

جاش وودوارد بازگشته است تا در مورد مدل های مختلف Gemini که در دسترس توسعه دهندگان است صحبت کند.

گوگل راه حل دیگری برای تماس های کلاهبرداری بی پایان دارد. اگر تماس را دریافت کنید، و متوجه شد که تماس “مشکوک” یا کلاهبرداری احتمالی است، می تواند یک هشدار بزرگ را مستقیماً روی تلفن شما نشان دهد و به طور بالقوه شما را از خرید هزاران دلار کارت هدیه یا انتقال وجه به یک حساب سرکش نجات دهد. بسیاری از این کلاهبرداری‌ها آشکار به نظر می‌رسند، اما مردم همچنان به آنها علاقه دارند و این ممکن است کمک کند.

مطالب خواندنی :  اپل در حال توسعه چت بات اختصاصی Apple GPT است

c3278d10 121f 11ef a27f 1c740dcad0e4

به‌روزرسانی‌های TalkBack

مثلاً آیا روزی را خواهیم دید که به شما اجازه می‌دهند برای شرکت در آزمون‌های SAT گوشی بیاورید؟ زیرا در غیر این صورت، به طور بالقوه به دانش‌آموزان کمکی می‌دهید که ممکن است نتوانند در طول ارزیابی‌های مهم از آن استفاده کنند، که ممکن است به یک نقطه ضعف تبدیل شود.

کاریسا، من فکر می‌کنم فرمول‌های پشتیبانی Circle to Search عجیب و غریب است، زیرا برای افراد مسن‌تری مانند ما (یا حداقل من)، شبیه تقلب است.

من از جستجو برای چیزی و در نتیجه گرفتن یک ویدیوی ۵ دقیقه‌ای YouTube متنفرم، بنابراین این که بتوانم به جای آن «از این ویدیو بپرسم» چیزی است که قطعاً می‌توانم ببینم که از آن استفاده می‌کنم. نمی‌دانم که آیا هنوز هم باید پیش‌بازی را تماشا کنید؟

07fd6d70 121f 11ef bf7e 53e7ec87942e

دیو برک در Google I/O درباره ادغام عمیق تر Gemini در اندروید صحبت می کند.

d88f8d20 121e 11ef abff 94baa03a72c0

حلقه برای جستجو به زودی از فرمول ها پشتیبانی می کند.

من می‌دانم که چرا کمک کردن به سؤالات تکالیف برای Google می‌تواند مفید باشد، اما چیزی وجود دارد که در مورد تشویق دانش‌آموزان و والدین به استفاده از کمک‌های تکالیف به هوش مصنوعی Google هنوز کمی احساس می‌کند.

خوب، حاشیه: آنها عکسی از شخصی نشان دادند که در حال جستجوی سس Fly by Jing بود. این چیزها عالی است.

ما بالاخره بخش Android از سخنرانی اصلی را شروع کردیم. وای، Gemini در حال تبدیل شدن به دستیار هوش مصنوعی جدید در اندروید است، بنابراین حدس می‌زنم دستیار گوگل مرده است؟

65378170 121e 11ef b467 ff66851ec973

در نهایت، وقت آن است که در مورد اندروید با سمیر سمت صحبت کنیم.

اوه نه، ما به بخش موسیقی Google I/O رسیده ایم.

ابزارهای جدید تشخیص کلاهبرداری گوگل هشدارهای بلادرنگ را در طول تماس های تلفنی ارائه می دهند

23064d90 1156 11ef 8ffe 06b5badaf178

گوگل به تازگی ابزارهای تشخیص کلاهبرداری آتی را که اواخر امسال به گوشی‌های اندرویدی عرضه می‌شود، معرفی کرد، که این یک چیز خوب است زیرا این کلاهبرداران در جدا کردن افراد از پول خود بهتر و بهتر می‌شوند. این مجموعه ابزار که در Google I/O 2024 فاش شد، هنوز در مراحل آزمایشی است اما از هوش مصنوعی برای سرکوب کلاهبرداران در میانه مکالمه استفاده می کند.

موافقم. من با استفاده از chatGPT و سایر ابزارهای هوش مصنوعی برای برنامه ریزی یک برنامه سفر تابستان گذشته آزمایش کردم و کمی سخت بود. در هر صورت، این بیشتر یک نقطه شروع بود تا یک راه حل واقعی، به خصوص به این دلیل که چندین پیشنهاد آن توهمات مستقیم بودند! شاید جوزا بهتر عمل کند،

b550aed0 121d 11ef bb5f ce98b8806bb4

برنامه ریزی سفر با جمینی

اکنون سیسی در مورد برنامه ریزی سفر با جمینی صحبت می کند، و من احساس می کنم تعطیلات بسیار گران است که نمی توان به یک هوش مصنوعی برنامه ریزی کرد. مدتی طول می کشد تا مردم با اجازه دادن به هوش مصنوعی اینگونه فرمان را به دست بگیرند، احساس راحتی کنند.

برنامه Gemini در حال دریافت یک ویژگی جدید “Live” است که فناوری Project Astra را که در ابتدای سخنرانی شاهد بودیم به ارمغان می آورد. می تواند صحبت کند و به دستورات صوتی پاسخ دهد و از دوربین تلفن شما برای ورودی استفاده کند.

فناوری ممکن است وجود داشته باشد، اما من واقعاً فکر نمی‌کنم که انسان‌ها برای همکاران هوش مصنوعی آماده باشند. آیا حتی می توانید تصور کنید افرادی که با ایمیل ها مشکل دارند سعی می کنند با چت ربات های هوشمند در Slack صحبت کنند؟

Gemini Nano گوگل هوشمندی های بهتری برای توصیف تصویر به ابزار دید TalkBack خود می آورد

 

107fa5a0 11d2 11ef b7bd 7dbab4f8d9bc

رویداد Google I/O اینجاست و این شرکت به‌روزرسانی‌های عالی زیادی را برای دستگاه اندرویدی شما اعلام می‌کند. همانطور که قبلا شنیدیم، Gemini Nano پشتیبانی چندوجهی دریافت می‌کند، به این معنی که اندروید شما همچنان متن را پردازش می‌کند، اما با درک بهتر عوامل دیگر مانند مناظر، صداها و زبان گفتاری. اکنون گوگل به اشتراک گذاشته است که ابزار جدید به ویژگی TalkBack آن نیز می آید.

TalkBack یک ابزار موجود است که توصیف یک تصویر را با صدای بلند می خواند، خواه تصویری که شما گرفته اید یا از طریق اینترنت. پشتیبانی چندوجهی Gemini Nano باید درک دقیق تری از تصویر ارائه دهد.

02b56a90 121d 11ef bdf5 d98f2e3dfb0a

Sissie Hsiao در Google I/O 2024

چیپ در اصل یک همکار هوش مصنوعی است. می تواند اسناد مشترک را تجزیه و تحلیل کند، جلسات را برنامه ریزی کند و پروژه ها را در فضای کاری شرکت شما ردیابی کند. به نظر می رسد که سازمان ها می توانند نسخه های تراشه خود را مطابق با نیازهای خود سفارشی کنند.

Google Gemini را مستقیماً در Android ایجاد می کند و آگاهی متنی را در برنامه ها اضافه می کند

bb2884c0 1152 11ef 9f3f f2f271569d33

گوگل اخیراً به‌عنوان بخشی از رویداد I/O 2024، بهبودهای بسیار خوبی را در چت ربات هوش مصنوعی Gemini خود برای دستگاه‌های اندرویدی اعلام کرد. هوش مصنوعی اکنون بخشی از سیستم عامل اندروید است و به آن اجازه می دهد تا به روشی جامع تر ادغام شود.

جالب ترین ویژگی جدید بدون آن ادغام با سیستم عامل اصلی امکان پذیر نخواهد بود. Gemini اکنون در درک زمینه بسیار بهتر است زیرا شما برنامه ها را در تلفن هوشمند کنترل می کنید. این دقیقا به چه معنی است؟ هنگامی که این ابزار به‌عنوان بخشی از اندروید ۱۵ به‌طور رسمی راه‌اندازی شد، می‌توانید یک پوشش Gemini که در بالای برنامه‌ای که استفاده می‌کنید قرار دارد، ایجاد کنید. این امکان اعمال و پرس و جوهای مربوط به زمینه را فراهم می کند.

7ff2fd70 121c 11ef af79 d527f111059c

تونی وینسنت در Google I/O 2024

Circle to Search اندروید اکنون می‌تواند به دانش‌آموزان در حل تکالیف ریاضی و فیزیک کمک کند

a60abd90 11d6 11ef bfe1 78dcd8ffbe7c

گوگل قابلیت دیگری را برای ویژگی Circle to Search خود در کنفرانس سالانه توسعه دهندگان I/O این شرکت معرفی کرده است و این چیزی است که می تواند به دانش آموزان کمک کند تا موضوعات کلاسی بالقوه دشوار را بهتر درک کنند. این ویژگی اکنون می‌تواند دستورالعمل‌های گام به گام را برای «مسائل کلمات فیزیک و ریاضی» به آنها نشان دهد. آنها فقط باید این ویژگی را با فشار طولانی دکمه هوم یا نوار ناوبری فعال کنند و سپس دور مشکلی که باعث سرگردانی آنها شده است را بچرخانند، اگرچه برخی از مشکلات ریاضی نیاز به ثبت نام کاربران در ویژگی آزمایشی آزمایشگاه های جستجوی گوگل دارند.

به هر حال، ما رسماً یک ساعت به این سخنرانی اصلی رسیده ایم، و هنوز هیچ علاقه ای به اندروید نداریم. می دانم که بعداً زمان زیادی برای به روز رسانی اندروید وجود خواهد داشت، اما در مورد اینکه تا چه حد اولویت های گوگل تغییر کرده اند، چیزهای زیادی می گوید، چندی پیش بود که اندروید ستاره I/O بود. اکنون، تقریباً مانند یک فکر بعدی به نظر می رسد.

اگرچه من حدس می‌زنم که این به نوعی جلوتر از جایی است که هوش مصنوعی در حال حاضر در آن قرار دارد.

اما من باید فکر کنم که آیا این نقش ممکن است توسط یک عامل هوش مصنوعی که همین کارها را با ورودی دستی بالقوه کمتر انجام دهد، بهتر انجام شود.

بله، من قصد ندارم دروغ بگویم، توانایی هوش مصنوعی برای خلاصه کردن چیزها خوب است، اما به نظر می رسد پایین ترین درجه از قابلیت های آن است. بنابراین خوب است که ببینیم با پاسخ‌های متنی و انتقال داده‌ها بین برنامه‌های مختلف مانند Gmail، Calendar و غیره، اوضاع چگونه در حال تکامل است.

Gemini قصد دارد برخی از ویژگی‌های جدید جالب را در برنامه Gmail تقویت کند، از جمله خلاصه‌ای از رشته‌های ایمیل طولانی. همچنین می‌توانید مستقیماً با Gemini چت کنید تا جزئیات را از صندوق ورودی خود بیابید. همچنین پیشنهادات پاسخ جدیدی وجود دارد که می تواند زمینه ایمیل های شما را برای پیشنهادات متنی مفیدتر (امیدوارم) درک کند. من هرگز تحت تاثیر پیشنهادات خودکار جیمیل قرار نگرفته ام، اما شاید Gemini آنها را واقعا مفید کند.

مطالب خواندنی :  کشف سیاره‌ای که شاید خانه حیات بیگانه باشد

33d097a0 121b 11ef 9de2 b2cda514f877

آپارنا پاپو در Google I/O

بله، ساختن همه اینها در دنیای واقعی چیزی نیست که فقط بتوانید انگشتانتان را بشکنید. اما در ادامه، تقریباً من را به این فکر می‌اندازد که آیا نقش بشریت در آینده ممکن است این باشد که هر ارتشی از عوامل هوش مصنوعی را که در اختیار دارید بررسی کنید.

خوب، این در واقع بسیار مفید به نظر می رسد. جستجو قابلیت‌های تشخیص ویدیو را دریافت می‌کند، بنابراین می‌توانید براساس محتویات یک ویدیو جستجو کنید، که می‌تواند به ویژه زمانی که نیاز به اصلاح چیزی یا پاسخ به سؤالی دارید که به راحتی نمی‌توانید توضیح دهید، مفید باشد. Google قادر خواهد بود آنچه در کلیپ است را بفهمد و (امیدواریم) نتایج مرتبط را نشان دهد.

Gemini گوگل ویدیوهای شما را جستجو می کند تا به شما در حل مشکلات کمک کند

e7e15230 1189 11ef beff 019ee3a658ed

گوگل به عنوان بخشی از تلاش خود برای افزودن هوش مصنوعی مولد به جستجو، یک پیچ جدید را معرفی کرده است: ویدیو. Gemini به شما اجازه می‌دهد ویدیویی را آپلود کنید که نشان می‌دهد مشکلی را که می‌خواهید حل کنید، سپس انجمن‌های کاربران و سایر مناطق اینترنت را برای یافتن راه‌حل جستجو کنید.

به عنوان مثال، رز یائو از گوگل روی صحنه در I/O 2024 در مورد صفحه گردان دست دومی که خریده بود صحبت کرد و اینکه چطور نتوانست سوزن را روی صفحه ضبط کند.

85fdd7f0 121a 11ef a2ff ee9f4427e7ab

رز یائو در Google I/O 2024

به نظر می رسد این آینده ای است که گوگل در حال حاضر به ما وعده می دهد. دیگر فقط یافتن اطلاعات مورد نیاز نیست، بلکه به «نمایندگان» گوگل اجازه می‌دهد تا کارهایی مانند اضافه کردن به لیست خرید شما را انجام دهند. من هنوز سوالات زیادی در مورد اینکه همه اینها در دنیای واقعی چقدر خوب عمل می کند، دارم.

اکنون جستجوی گوگل به طور پیش‌فرض به میلیون‌ها نفر پاسخ‌های تولید شده توسط هوش مصنوعی را نشان می‌دهد

5c842af0 121a 11ef bee7 679f9024e751

گوگل

گوگل جستجو را تکان می دهد. روز سه‌شنبه، این شرکت در کنفرانس سالانه Google برای توسعه‌دهندگان، تغییرات بزرگ جدید مبتنی بر هوش مصنوعی را در موتور جستجوی غالب جهان اعلام کرد. با ویژگی های جدید، گوگل جستجو را به عنوان چیزی بیش از راهی برای یافتن وب سایت ها قرار می دهد. در عوض، این شرکت از مردم می‌خواهد که از موتور جستجوی آن برای دریافت مستقیم پاسخ‌ها و کمک به آنها در برنامه‌ریزی رویدادها و ایده‌های طوفان فکری استفاده کنند.

نکته خوب کاریسا من فکر می‌کنم زاک نبرد سخت‌تری دارد، زیرا فیس‌بوک/متا مانند گوگل یا اپل تأثیری روی سخت‌افزار ندارند. اما می‌توانید مشاهده کنید که متا تلاش می‌کند تا آن را با دستگاه‌هایی مانند عینک هوشمند Ray-Ban تغییر دهد.

در حالی که هنوز خیلی زود است، به نظر می رسد که از Star Trek به رایانه نزدیک می شویم، یک موجودیت واقعی هوش مصنوعی فردی که رفتار خود را برای هر فرد تنظیم می کند.

این فقط گوگل نیست. مارک زاکربرگ نیز در مورد وعده “عوامل AI” صحبت کرده است، اگرچه من فکر می کنم مسیر گوگل برای رسیدن به آنجا بسیار ساده تر است، همانطور که اکنون با این بررسی عمیق در بررسی های AI در جستجو می بینیم.

آیا «عامل» داغ‌ترین کلمه در Google I/O امسال خواهد بود؟

مطمئناً به نظر می‌رسد که قبل از اینکه کسی عمیق‌تر به Android یا ChromeOS بپردازد، یک ساعت کامل درباره هوش مصنوعی خواهیم داشت.

72cbdca0 1219 11ef aaff ed69f8c78bee

لیز رید در Google I/O 2024

تقریباً ۴۵ دقیقه به این سخنرانی اصلی رسیده‌ایم و ذکر مختصری از Circle to Search یکی از اولین بارهایی است که ساندار در تمام طول روز «Android» را گفت. نشانه دیگری از اینکه امروز همه چیز در مورد هوش مصنوعی است.

1ee63360 1219 11ef beff e8761609776b

ظاهراً ابر رایانه ها دیگر به اندازه کافی خوب نیستند.

واحد پردازش تنسور (TPU) نسل ششم گوگل Trillium نام دارد و اواخر امسال برای مشتریان Cloud خود عرضه می شود. ممکن است TPU ها در بین بسیاری از به روز رسانی های هوش مصنوعی گوگل امروزی جذاب ترین نباشند، اما بخش مهمی از کار هوش مصنوعی آن است.

گوگل از Veo و Imagen 3، جدیدترین مدل های ایجاد رسانه هوش مصنوعی خود رونمایی کرد

538895f0 1218 11ef a6ff 66e559369394

در Google I/O همیشه هوش مصنوعی است! امروز، گوگل موتورهای جدید ایجاد رسانه هوش مصنوعی خود را معرفی کرد: Veo، که می تواند ویدیوهای ۱۰۸۰p با کیفیت بالا تولید کند. و Imagen 3، آخرین چارچوب متن به تصویر آن. هیچ‌کدام به‌خصوص انقلابی به نظر نمی‌رسند، اما راهی برای Google برای ادامه مبارزه با مدل ویدیویی Sora OpenAI و Dall-E 3 است، ابزاری که عملاً مترادف با تصاویر تولید شده توسط هوش مصنوعی شده است.

گوگل ادعا می کند که Veo “درکی پیشرفته از زبان طبیعی و معنای بصری” دارد تا هر ویدیویی را که در ذهن دارید ایجاد کند. ویدئوهای تولید شده توسط هوش مصنوعی می توانند «بیش از یک دقیقه» دوام بیاورند. Veo همچنین قادر به درک تکنیک های سینمایی و بصری مانند مفهوم تایم لپس است. اما واقعاً، این باید برای مدل تولید ویدیوی هوش مصنوعی باشد، درست است؟

یک چیز جالب این است که گوگل بیشتر در مورد AGI یا هوش عمومی مصنوعی صحبت می کند.

ایده هوش مصنوعی دارای هوش در سطح انسانی زمانی به عنوان موضوعی کاملاً علمی تخیلی به نظر می رسید، بنابراین شنیدن صحبت های شرکت هایی مانند گوگل در مورد آن در طول یک کنفرانس توسعه دهنده کمی سورئال به نظر می رسد.

با حفظ این موضوع، گوگل یک تولید کننده ویدیوی جدید به نام Veo را به نمایش می گذارد. به نظر می رسد دونالد گلاور آزمایش کننده اولیه این فناوری بوده است. تا اینجای کار، این کلیپ ها به طرز شگفت انگیزی صاف و واقعی به نظر می رسند. Veo در هفته‌های آینده به «انتخاب سازندگان» در VideoFX می‌آید.

6fbb84d0 1218 11ef bdfe ce926a9052fd

دونالد گلاور از Veo برای ساخت یک فیلم کوتاه استفاده می کند.

f2fd0270 1217 11ef b3f8 986c7c73bb90

Wyclef Jean در حال آزمایش هوش مصنوعی مولد برای کمک به ساخت موسیقی است.

Google I/O یک کنفرانس توسعه دهندگان است، اما جالب است که ما شاهد تاکید زیادی برای موارد استفاده خلاقانه از نسل هوش مصنوعی، مانند تولید تصویر و موسیقی هستیم.

گوگل به تازگی یک جفت عینک واقعیت افزوده را در نسخه نمایشی Project Astra در I/O فرو برده است

f32a5400 1217 11ef b3c0 56a5b95c6c9f

در ویدئویی که نشان‌دهنده مهارت برنامه جدید Project Astra بود، فردی که نمایش می‌داد از Gemini پرسید: “یادت هست عینک من را کجا دیدی؟” هوش مصنوعی به طرز چشمگیری پاسخ داد: “بله، دارم. عینک شما روی میز نزدیک یک سیب قرمز قرار داشت”، علیرغم اینکه شیء گفته شده در هنگام پرسیدن سوال واقعا در معرض دید نبود. اما اینها کمک بصری استاندارد باتلاقی شما نبودند. این عینک دارای دوربین و نوعی رابط بصری بود!

Imagen 3 جدیدترین تولیدکننده متن به تصویر گوگل است و ظاهراً در ایجاد متن در تصاویر بسیار بهتر است، که برای بسیاری از تولیدکنندگان تصویر ترفند بوده است.

9a9b46f0 1217 11ef b339 dc59105b01e1

داگ اک در Google I/O 2024

Google’s Project Astra از دوربین و هوش مصنوعی گوشی شما برای یافتن سازندگان نویز، موارد نابجا و موارد دیگر استفاده می کند.

44fb7e80 11ff 11ef bfbe 572e6162313e

هنگامی که گوگل برای اولین بار فناوری دستیار صوتی Duplex خود را در کنفرانس توسعه دهندگان خود در سال ۲۰۱۸ به نمایش گذاشت، هم چشمگیر و هم نگران کننده بود. امروز، در I/O 2024، این شرکت ممکن است دوباره همان واکنش‌ها را مطرح کند، این بار با نشان دادن کاربرد دیگری از هوش مصنوعی خود با چیزی به نام Project Astra.

مطالب خواندنی :  بهترین هدایای بازی یکپارچه سازی با سیستم عامل برای تعطیلات 2023

این شرکت حتی نمی‌توانست تا سخنرانی امروز خود صبر کند تا پروژه Astra را مورد آزار و اذیت قرار دهد و دیروز ویدیویی را از یک برنامه هوش مصنوعی مبتنی بر دوربین در رسانه‌های اجتماعی خود منتشر کرد. با این حال، دمیس حسابیس، مدیرعامل DeepMind گوگل در سخنرانی امروز خود به اشتراک گذاشت که تیم او “همیشه می خواستند عوامل هوش مصنوعی جهانی را توسعه دهند که می توانند در زندگی روزمره مفید باشند.” پروژه آسترا نتیجه پیشرفت در این زمینه است.

جزئیات زیادی در مورد Astra فراتر از آن ویدیو وجود ندارد، اما ظاهراً امروز یک نسخه ی نمایشی زنده از آن در اینجا وجود خواهد داشت، بنابراین امیدواریم که ما بعد از این ویدیو نگاه دقیق تری داشته باشیم.

ما در حال بررسی چیزی به نام Project Astra هستیم که بخشی از ماموریت گوگل برای ایجاد «عوامل هوش مصنوعی جهانی» است. به نظر می رسد این همان چیزی است که گوگل دیروز به طور مختصر در X به آن اشاره کرد – این شبیه یک نسخه لنز گوگل با هوش مصنوعی است، می تواند آنچه را در کادر دوربین در زمان واقعی وجود دارد تشخیص دهد و حتی در مورد اشیاء خارج از کادر به سوالات پاسخ دهد. همچنین به نظر می رسد که نوعی جزء عینک وجود دارد.

f2da0690 1216 11ef a7df bc3123420f9f

پروژه آسترا

مدل جدید Gemini 1.5 Flash AI گوگل سبک تر از Gemini Pro است و در دسترس تر است

938f3e70 117c 11ef bfe9 3d5d92399b65

گوگل روز سه‌شنبه در کنفرانس سالانه توسعه‌دهندگان، I/O، به‌روزرسانی‌های مدل‌های هوش مصنوعی جمینی خود را اعلام کرد. این شرکت در حال عرضه یک مدل جدید به نام Gemini 1.5 Flash است که می گوید برای سرعت و کارایی بهینه شده است.

Demis Hassabis، مدیرعامل Google DeepMind گفت: «۱٫۵ Flash در خلاصه‌سازی، برنامه‌های چت، شرح تصاویر و ویدیوها، استخراج داده‌ها از اسناد و جداول طولانی و موارد دیگر برتری دارد.

Gemini 1.5 Flash یک مدل جدید جمینی با وزن سبک تر است که دارای قابلیت های چندوجهی است اما کارآمدتر از Gemini 1.5 Pro است.

6861b8f0 1216 11ef 9b90 fea9aff407c0

دمیس حسابیس در Google I/O 2024

1f362f80 1216 11ef bff7 e050a7103d7f

استفاده از هوش مصنوعی برای خودکار کردن فرآیند بازگرداندن چیزی که خریداری کرده اید.

ساندار بازگشته است و در مورد وعده “عوامل هوش مصنوعی” صحبت می کند، که در واقع می توانند وظایف را از طرف ما انجام دهند. او می‌گوید که آنها باید بتوانند «از قبل فکر کنند و استدلال کنند» تا به ما در انجام کارها کمک کنند.

d09b8140 1215 11ef af7e c44874b304f2

استفاده از هوش مصنوعی برای زمینه سازی آموزش

ما نگاهی به Gemini 1.5 Pro در NotebookLM و نحوه فعال کردن ویژگی‌های صوتی مانند دستیار صوتی داریم. اساساً مجموعه ای از مطالب منبع را تجزیه و تحلیل می کند و می تواند آن را به طور طبیعی توضیح دهد و حتی به سؤالات پاسخ دهد.

792907c0 1215 11ef bfee 8722036fb432

Josh Woodward at Google I/O 2024

27cdd9f0 1215 11ef b7f7 f4b0a09e01a0

Gemini 1.5 Pro

از Google Photos بخواهید که برای درک گالری شما راهنمایی دریافت کند

6b58db50 1186 11ef beae d691c441daa3

گوگل بیشتر از هوش مصنوعی Gemini خود را در هر محصولی که دارد وارد می کند و هدف بعدی در نظرش Photos است. در کنفرانس توسعه دهندگان I/O امروز، ساندار پیچای، مدیرعامل این شرکت، قابلیتی به نام Ask Photos را اعلام کرد که برای کمک به شما در یافتن تصاویر خاص در گالری خود با صحبت با Gemini طراحی شده است.

جستجو در حال حاضر یکی از بهترین ویژگی‌های Google Photos است، اما به نظر می‌رسد Gemini آن را قدرتمندتر می‌کند. Sundar نشان داد که چگونه نه تنها می‌تواند جزئیات را در عکس‌های خاص جستجو کند، بلکه می‌تواند زمینه وسیع‌تر چندین عکس را در طول زمان درک کند، مانند ردیابی مهارت‌های شنای کودک شما در طول تابستان.

Ask Photos یک ویژگی کوچک ساده به نظر می رسد، اما می تواند واقعا مفید باشد. من دائماً چیزهایی را در Photos جستجو می‌کنم و معمولاً باید به یاد بیاورم که چه زمانی عکس را گرفته‌ام و سپس فقط در جدول زمانی خود پیمایش کنم تا آن را پیدا کنم.

83a6b040 1214 11ef 9ff7 1335f00764c9

نسخه نمایشی Google Ask Photos

اول Google Photos است، Gemini در قالب یک چت ربات مفید به Google Photos می آید که می تواند به سؤالات مربوط به آنچه در گالری شما وجود دارد پاسخ دهد. «عکس بپرس» تابستان امسال می آید.

4519a850 1214 11ef 92ff 90b7540fe6ac

مروری بر هوش مصنوعی

فکر می‌کنم همه می‌دانستند که گوگل با صحبت کردن درباره جمینی کارها را آغاز می‌کند. اما من کنجکاو هستم که چگونه دستیار گوگل و جمینی در آینده در کنار یکدیگر (یا شاید هم) کار کنند.

bb6064f0 1213 11ef bfff afa968dd9c2f

ساندار پیچای در Google I/O 2024

ساندار روی صحنه است، او به شوخی می گوید که I/O “نسخه گوگل از تور Eras” است و می گوید که گوگل در “عصر جمینی” خود است، بنابراین انتظار یک سخنرانی کلیدی را داشته باشید که همه چیز هوش مصنوعی باشد.

7cca3540 1213 11ef a3f7 09a093401e16

 

6fe35c50 1211 11ef 8ffc 913443115399

حالا مارک درخواست های موسیقی را از جمعیت دریافت می کند و می خواهد کار Loop Daddy خود را انجام دهد و آن را به یک آهنگ کامل تبدیل کند.

b6db8070 1210 11ef 9ff9 32c3b77f950b

Marc Rebillet در حال آزمایش برخی از نمونه‌های موسیقی هوش مصنوعی در Google I/O 2024 است

او به تازگی برخی از ابزارهای موسیقی مولد هوش مصنوعی گوگل را به نمایش گذاشته است، به نظر می رسد از شنیده هایش تحت تاثیر قرار گرفته است، می گوید که چیزهای بیشتری در راه است.

اکنون مارک در حال ورود به موسیقی مولد ساخته شده توسط هوش مصنوعی است.

4672f390 1210 11ef 8d47 456e7d790ee1

Marc Rebillet در Google I/O

مارک ریبیلت به تازگی از یک لیوان ورودی/خروجی در اندازه واقعی بیرون آمده و وظایف را بر عهده گرفته است.

سالن در حال پر شدن است! 13cabab0 120e 11ef b3bd 0e231a65819d

ما در حال معاشرت هستیم ، خیلی خنک است. سالن آمفی تئاتر در حال پر شدن است.

0e8242a0 120c 11ef bfe6 72f827ed2bab

نمای نزدیک Google I/O

و ما رسما یک ساعت بیرون هستیم!

ما وارد شدیم

73cea470 120a 11ef 9add 0b4936f7f9b4

ریویان R1S در Google I/O

ریویان R1S در Google I/O

گوگل یک ریوین را در خارج از چادر مطبوعات قرار داده است، بنابراین به احتمال زیاد امروز بعد از ظهر برخی به‌روزرسانی‌های Android Automotive را دریافت خواهیم کرد.

فقط شنیدم که گوگل لیست بلندبالایی از موضوعات را برای امروز در نظر گرفته است، بنابراین برای یک ارائه طولانی‌تر آماده شوید. حدس می‌زنم نزدیک به دو ساعت طول بکشد تا یک ساعت.

بر اساس تحولات دو سال گذشته، به نظر می‌رسد که I/O امسال کاملاً در مورد هوش مصنوعی (AI) باشد. گوگل محصولات زیادی در بخش‌های جستجو، دستیار، اندروید، Workspace، کروم، نقشه و موارد دیگر دارد که همگی با هوش مصنوعی  Gemini خود پر شده‌اند یا می‌توان آن‌ها را با این هوش مصنوعی تجهیز کرد. بیایید یک بازی انجام دهیم: امروز چند بار کلمه «Gemini» را خواهیم شنید؟ باشه، شاید این خیلی ساده باشد. به نظر شما چند بار کلمه «هوش مصنوعی مسئولانه» را خواهیم شنید؟

هنوز منتظر هستیم تا وارد خود آمفی تئاتر شویم، به نظر می رسد طی ۱۰ تا ۲۵ دقیقه آینده باز شود.

از آنجایی که Google I/O یک کنفرانس توسعه‌دهندگان است، بعید است به هر حال سکویی برای معرفی دستگاه‌های جدید باشد. اما این بدان معنا نیست که گوگل در گذشته چنین نکرده است. ما شاهد معرفی Pixel Tablet و Pixel Fold در نمایشگاه سال گذشته بودیم. گوگل همچنین در I/O سال ۲۰۲۲ عینک‌های AR جدیدی را معرفی کرد، اگرچه این پوشیدنی هرگز در دسترس منتقدان یا عموم مردم قرار نگرفت. با تشکر از اینکه به من در این گذر کوتاه در خاطرات I/O های گذشته پیوستید. دلم برایش تنگ شده و آرزو می کنم آنجا بودم!

در صورتی که کنجکاو بودید که آیا امروز قراره سخت‌افزار جدیدی ببینیم، به احتمال زیاد هیچ پیکسل جدیدی نخواهیم دید. گوگل پیکسل ۸a خودش رو هفته پیش معرفی کرد و می‌تونید برای دیدن جزئیات، بررسی کامل ما رو روی این گوشی میان‌رده اندروید بخونید. خلاصه که؟ سام عاشقش شد و هنوزم محبوب‌ترین گوشی زیر ۵۰۰ دلار ماست!

اگر هنوز از انتظارات ما برای کنفرانس توسعه‌دهندگان گوگل امروز مطلع نیستید، می‌توانید برای مرور سریع نگاهی به پست پیش‌نمایش ما بیندازید. بیشتر آن غیرمنتظره نخواهد بود – البته هوش مصنوعی به احتمال زیاد دستور کار را تحت سلطه خود درمی‌آورد. برای دریافت اخبار در اپست در اواخر بعد از ظهر امروز منتظر باشید! و اگر دوست داشتید، می‌توانید به همراه من و دِویندر هارداوار، بررسی‌کننده ارشد، امروز بعد از ظهر حدود ساعت ۳ ب برای پخش زنده خلاصه هر آنچه امروز یاد می‌گیریم، بپیوندید.

رونمایی گوگل از پیشرفت‌ جدید هوش‌ مصنوعی خود

سلام به همه به Google I/O 2024 خوش آمدید. من چرلین لو، سردبیر جانشین هستم که بعد از یک بازنشستگی ذهنی کوتاه برگشتم تا امروز اخبار نمایشگاه را برایتان بیاورم. همچنین تصاویر سم روترفورد، منتقد ارشد را خواهید دید که در آمفی تئاتر شورلاین به همراه کریسا بل، گزارشگر ارشد حضور دارد که بیشتر کارهای وبلاگ نویسی زنده را امروز انجام خواهد داد! من خیلی حسادت می‌کنم که آن‌ها می‌توانند از خوراکی‌های گوگل در محل نمایشگاه استفاده کنند.

فروشگاه کوکوهوم
لینک کوتاه : https://www.appest.ir/?p=12974

ثبت دیدگاه

مجموع دیدگاهها : 0در انتظار بررسی : 0انتشار یافته : 0
قوانین ارسال دیدگاه
  • دیدگاه های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.