تکنولوژیکامپیوترهوش مصنوعی

مایکروسافت کوپایلت با هوش مصنوعی صوتی جدیدش که شخصی‌تر از ChatGPT به نظر می‌رسد، از نزدیک تجربه می‌شود.

به گزارش اپست به نقل از windowslatest ، مایکروسافت پس از معرفی Copilot Vision، ابزاری برای تحلیل صفحه‌نمایش با قابلیت‌های هوش مصنوعی، محصول جدیدی را در دست آزمایش دارد. وب‌سایت Windows Latest Copilot Audio Expressions را آزمایش کرده است؛ یک ابزار تولید صدا با هوش مصنوعی که می‌تواند برای متن شما خروجی صوتی شبیه به انسان تولید کند و حتی در صورت تمایل، کنترل‌های خلاقانه‌تری را در اختیارتان بگذارد.

این ابزار برای آزمایش در وب‌سایت رسمی Copilot Labs در دسترس است. این ابزار دو حالت به نام‌های Emotive (عاطفی) و Story (داستان) دارد که تقریباً ده مدل صدا و گزینه سبک مختلف را ارائه می‌دهد. یک تجزیه و تحلیل عمیق در مورد نحوه عملکرد این ویژگی انجام داده و گزینه‌های مختلف صدا و لحن را امتحان کرده است؛ این ابزار در کاری که انجام می‌دهد بسیار خوب عمل می‌کند، اما زبان اصلی آن فقط انگلیسی است.

اینستاگرام اپست

ابتدا، ما کار را با یک متن آزمایشی شروع کردیم که یک سناریو از یک ایستگاه قطار شلوغ را روایت می‌کرد. ما این متن را در فیلد مربوطه وارد کردیم و یک خط متن برای مشخص کردن سبک صدا اضافه کردیم.

مایکروسافت کوپایلت با هوش مصنوعی صوتی جدیدش که شخصی‌تر از ChatGPT به نظر می‌رسد، از نزدیک تجربه می‌شود.

ما Emote را به عنوان گزینه حالت (mode) با صدای Oak و سبک روایت انتخاب کردیم. این ابزار زمان زیادی برای تولید یک فایل صوتی صرف نکرد، که توانستیم آن را با استفاده از پخش‌کننده وب یکپارچه پخش کنیم.

مایکروسافت کوپایلت با هوش مصنوعی صوتی جدیدش که شخصی‌تر از ChatGPT به نظر می‌رسد، از نزدیک تجربه می‌شود.

حالت Emote حداکثر ۵۹ ثانیه برای هر کلیپ صوتی تولید می‌کند. ما انتظار یک روایت ساده را داشتیم که یک صدای هوش مصنوعی متن را با صدای بلند بخواند. به طور شگفت‌آور، کلیپ صوتی با اسکریپت ارائه شده به خود اجازه داد که بخش‌هایی را به آن اضافه کند، جملات را تغییر دهد تا جذاب‌تر به نظر برسند. جزئیات کوچک اما مفیدی را به بخش اسکریپت از قبل خوب، اضافه کرد.

مطالب خواندنی :  همه چیزهایی که در Google I/O 2024 اعلام شد از جمله هوش مصنوعی Gemini، Project Astra، Android 15 و موارد دیگر

قابلیت دانلود فایل صوتی بدون نیاز به ورود به سیستم و استفاده از فرمت MP3 برای ما بسیار جذاب بود. به همین دلیل، پخش آن روی هر دستگاه یا پلیر هیچ مشکلی نخواهد داشت. ابزار Copilot Audio Expressions با حالت Emote و کنترل‌های دقیق آن ما را تحت تأثیر قرار داد، اما می‌خواستیم حالت Story را هم امتحان کنیم.

در ادامه، حالت Story را انتخاب کردیم که صدا و سبک را به صورت خودکار انتخاب می‌کند و هیچ گزینه‌ای برای تنظیم آن‌ها ندارد. می‌توانید آنچه را که می‌خواهید با استفاده از یک دستور متنی مشخص کنید، اما ما با یک دستور ساده یعنی «داستانی در مورد یک گربه که در سایه‌ها برای شکار کمین کرده، تعریف کن» شروع کردیم.

این بار، ابزار یک داستان ۹۰ ثانیه‌ای در مورد شخصی که داستان گربه‌ای را روایت می‌کند که به دنبال شکار است، ساخت. این داستان هم صدای راوی (با لهجه آمریکایی) و هم صدای گربه (بله، گربه در این داستان صحبت می‌کند و گرسنگی خود را بیان می‌کند) را با لهجه بریتانیایی داشت. هر دو صدا به طور کامل هماهنگ بودند و بیشتر شبیه یک همکاری به نظر می‌رسیدند تا یک صدای هوش مصنوعی ساده.

مایکروسافت کوپایلت با هوش مصنوعی صوتی جدیدش که شخصی‌تر از ChatGPT به نظر می‌رسد، از نزدیک تجربه می‌شود.

می‌توانید هر دو قطعه صوتی را بررسی کنید تا کیفیت خروجی را بسنجید.

ما این ابزار را شایسته یک ابزار تولید صدای هوش مصنوعی یافتیم که می‌توانید از آن برای ساخت کلیپ‌های صوتی استفاده کنید. این ابزار را در سایت Copilot Labs امتحان کنید.

فروشگاه کوکوهوم

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا