شرکت آمازون اخیرا عرضه مدل جدید هوش مصنوعی خود را که قادر به تبدیل متن به گفتار است، به طور رسمی تأیید کرد. این مدل هوش مصنوعی صوتی Nova Sonic شناخته میشود، با تمرکز بر توانمندسازی برنامهنویسان در جهت توسعه برنامههایی طراحی شده است که قادر به تعامل با صداهای واقعی و شبیه به انسان در لحظه باشند.
آمازون در بیانیه خود مدعی شده است که مدل هوش مصنوعی صوتی Nova Sonic با ارائه تعادل بهتری میان قیمت و عملکرد در مقایسه با رقبای فعلی در بازار، همچنین تأخیر به مراتب کمتری را برای برقراری مکالمات واقعیتر و همزمان فراهم میآورد.
مشخصات و جزئیات مهم مدل هوش مصنوعی صوتی Nova Sonic
در روال معمول، برنامههای کاربردی که نیازمند پشتیبانی از ارتباطات صوتی هستند، برنامهنویسان را ملزم به استفاده همزمان از چندین مدل مختلف میسازند. این فرآیند شامل تبدیل مؤثر گفتار به متن در ابتدا، سپس ارائه پاسخ مناسب، و در نهایت استفاده از مدلی برای تولید صدای نهایی میگردد.
هدف اصلی از توسعه مدل هوش مصنوعی صوتی Nova Sonic، ادغام تمامی این مدلهای ضروری در قالب یک مدل واحد است. این رویکرد نه تنها منجر به افزایش چشمگیر کارایی و کاهش هزینهها در مقایسه با استفاده از مدلهای جداگانه میشود، بلکه پیچیدگیهای مربوط به توسعه برنامهها و نقاط احتمالی بروز خطا را نیز به میزان قابل توجهی کاهش میدهد.
بر اساس اطلاعات منتشر شده، مدل هوش مصنوعی صوتی Nova Sonic فراتر از پردازش صرف دادهها عمل میکند و قادر است تا به سرعت صدای نهایی را مطابق با استانداردهای تعیین شده توسط برنامهنویسان برای کاربردهای مختلف ایجاد نماید. این مدل توانایی تولید صدایی با ظرافتهای گوناگون، مشابه نحوه صحبت کردن انسانها را دارا است. با این حال، در حال حاضر، قابلیت اصلی این مدل محدود به تولید صدا به زبان انگلیسی، با امکان انتخاب صدای مردانه یا زنانه، میباشد.
عرضه مدل هوش مصنوعی صوتی Nova Sonic از سوی آمازون، گامی مهم در عرصه رقابت با شرکتهای پیشرویی همچون OpenAI و گوگل در زمینه فناوریهای صوتی مبتنی بر هوش مصنوعی تلقی میگردد و میتواند تحولات قابل توجهی را در نحوه تعامل انسان و ماشین از طریق صدا رقم بزند.
__ تکنو دات مرجع اخبار تکنولوژی __