مایکروسافت کوپایلت با هوش مصنوعی صوتی جدیدش که شخصیتر از ChatGPT به نظر میرسد، از نزدیک تجربه میشود.

مایکروسافت کوپایلت با هوش مصنوعی صوتی جدیدش که شخصیتر از ChatGPT به نظر میرسد، از نزدیک تجربه میشود.
به گزارش اپست به نقل از windowslatest ، مایکروسافت پس از معرفی Copilot Vision، ابزاری برای تحلیل صفحهنمایش با قابلیتهای هوش مصنوعی، محصول جدیدی را در دست آزمایش دارد. وبسایت Windows Latest Copilot Audio Expressions را آزمایش کرده است؛ یک ابزار تولید صدا با هوش مصنوعی که میتواند برای متن شما خروجی صوتی شبیه به انسان تولید کند و حتی در صورت تمایل، کنترلهای خلاقانهتری را در اختیارتان بگذارد.
این ابزار برای آزمایش در وبسایت رسمی Copilot Labs در دسترس است. این ابزار دو حالت به نامهای Emotive (عاطفی) و Story (داستان) دارد که تقریباً ده مدل صدا و گزینه سبک مختلف را ارائه میدهد. یک تجزیه و تحلیل عمیق در مورد نحوه عملکرد این ویژگی انجام داده و گزینههای مختلف صدا و لحن را امتحان کرده است؛ این ابزار در کاری که انجام میدهد بسیار خوب عمل میکند، اما زبان اصلی آن فقط انگلیسی است.
ابتدا، ما کار را با یک متن آزمایشی شروع کردیم که یک سناریو از یک ایستگاه قطار شلوغ را روایت میکرد. ما این متن را در فیلد مربوطه وارد کردیم و یک خط متن برای مشخص کردن سبک صدا اضافه کردیم.

ما Emote را به عنوان گزینه حالت (mode) با صدای Oak و سبک روایت انتخاب کردیم. این ابزار زمان زیادی برای تولید یک فایل صوتی صرف نکرد، که توانستیم آن را با استفاده از پخشکننده وب یکپارچه پخش کنیم.

حالت Emote حداکثر ۵۹ ثانیه برای هر کلیپ صوتی تولید میکند. ما انتظار یک روایت ساده را داشتیم که یک صدای هوش مصنوعی متن را با صدای بلند بخواند. به طور شگفتآور، کلیپ صوتی با اسکریپت ارائه شده به خود اجازه داد که بخشهایی را به آن اضافه کند، جملات را تغییر دهد تا جذابتر به نظر برسند. جزئیات کوچک اما مفیدی را به بخش اسکریپت از قبل خوب، اضافه کرد.
قابلیت دانلود فایل صوتی بدون نیاز به ورود به سیستم و استفاده از فرمت MP3 برای ما بسیار جذاب بود. به همین دلیل، پخش آن روی هر دستگاه یا پلیر هیچ مشکلی نخواهد داشت. ابزار Copilot Audio Expressions با حالت Emote و کنترلهای دقیق آن ما را تحت تأثیر قرار داد، اما میخواستیم حالت Story را هم امتحان کنیم.
تولید داستانهای جذاب با حالت Story
در ادامه، حالت Story را انتخاب کردیم که صدا و سبک را به صورت خودکار انتخاب میکند و هیچ گزینهای برای تنظیم آنها ندارد. میتوانید آنچه را که میخواهید با استفاده از یک دستور متنی مشخص کنید، اما ما با یک دستور ساده یعنی «داستانی در مورد یک گربه که در سایهها برای شکار کمین کرده، تعریف کن» شروع کردیم.
این بار، ابزار یک داستان ۹۰ ثانیهای در مورد شخصی که داستان گربهای را روایت میکند که به دنبال شکار است، ساخت. این داستان هم صدای راوی (با لهجه آمریکایی) و هم صدای گربه (بله، گربه در این داستان صحبت میکند و گرسنگی خود را بیان میکند) را با لهجه بریتانیایی داشت. هر دو صدا به طور کامل هماهنگ بودند و بیشتر شبیه یک همکاری به نظر میرسیدند تا یک صدای هوش مصنوعی ساده.

میتوانید هر دو قطعه صوتی را بررسی کنید تا کیفیت خروجی را بسنجید.
ما این ابزار را شایسته یک ابزار تولید صدای هوش مصنوعی یافتیم که میتوانید از آن برای ساخت کلیپهای صوتی استفاده کنید. این ابزار را در سایت Copilot Labs امتحان کنید.






