آمازون از مدل هوش مصنوعی صوتی Nova Sonic برای رقابت با OpenAI رونمایی کرد

آخرین به روز رسانی: ۲۰ فروردین ۱۴۰۴

3 دقیقه مطالعه

شرکت آمازون اخیرا عرضه مدل جدید هوش مصنوعی خود را که قادر به تبدیل متن به گفتار است، به طور رسمی تأیید کرد. این مدل هوش مصنوعی صوتی Nova Sonic شناخته می‌شود، با تمرکز بر توانمندسازی برنامه‌نویسان در جهت توسعه برنامه‌هایی طراحی شده است که قادر به تعامل با صداهای واقعی و شبیه به انسان در لحظه باشند.

آمازون در بیانیه خود مدعی شده است که مدل هوش مصنوعی صوتی Nova Sonic با ارائه تعادل بهتری میان قیمت و عملکرد در مقایسه با رقبای فعلی در بازار، همچنین تأخیر به مراتب کمتری را برای برقراری مکالمات واقعی‌تر و همزمان فراهم می‌آورد.

مدل هوش مصنوعی صوتی Nova Sonic

مشخصات و جزئیات مهم مدل هوش مصنوعی صوتی Nova Sonic

در روال معمول، برنامه‌های کاربردی که نیازمند پشتیبانی از ارتباطات صوتی هستند، برنامه‌نویسان را ملزم به استفاده همزمان از چندین مدل مختلف می‌سازند. این فرآیند شامل تبدیل مؤثر گفتار به متن در ابتدا، سپس ارائه پاسخ مناسب، و در نهایت استفاده از مدلی برای تولید صدای نهایی می‌گردد.

هدف اصلی از توسعه مدل هوش مصنوعی صوتی Nova Sonic، ادغام تمامی این مدل‌های ضروری در قالب یک مدل واحد است. این رویکرد نه تنها منجر به افزایش چشمگیر کارایی و کاهش هزینه‌ها در مقایسه با استفاده از مدل‌های جداگانه می‌شود، بلکه پیچیدگی‌های مربوط به توسعه برنامه‌ها و نقاط احتمالی بروز خطا را نیز به میزان قابل توجهی کاهش می‌دهد.

مدل هوش مصنوعی صوتی Nova Sonic

بر اساس اطلاعات منتشر شده، مدل هوش مصنوعی صوتی Nova Sonic فراتر از پردازش صرف داده‌ها عمل می‌کند و قادر است تا به سرعت صدای نهایی را مطابق با استانداردهای تعیین شده توسط برنامه‌نویسان برای کاربردهای مختلف ایجاد نماید. این مدل توانایی تولید صدایی با ظرافت‌های گوناگون، مشابه نحوه صحبت کردن انسان‌ها را دارا است. با این حال، در حال حاضر، قابلیت اصلی این مدل محدود به تولید صدا به زبان انگلیسی، با امکان انتخاب صدای مردانه یا زنانه، می‌باشد.

عرضه مدل هوش مصنوعی صوتی Nova Sonic از سوی آمازون، گامی مهم در عرصه رقابت با شرکت‌های پیشرویی همچون OpenAI و گوگل در زمینه فناوری‌های صوتی مبتنی بر هوش مصنوعی تلقی می‌گردد و می‌تواند تحولات قابل توجهی را در نحوه تعامل انسان و ماشین از طریق صدا رقم بزند.

__ تکنو دات مرجع اخبار تکنولوژی __