عملکرد مدل هوش مصنوعی شبیه سازی صوتی OpenAI، در نمونه های ۱۵ ثانیه‌ای بسیار ترسناک است!

عملکرد مدل هوش مصنوعی شبیه سازی صوتی OpenAI، در نمونه های ۱۵ ثانیه‌ای بسیار ترسناک است!

به تازگی مدل هوش مصنوعی شبیه سازی صوتی OpenAI توسعه داده شده است، که برای تعداد محدودی از کاربران اختصاصی در دسترس می باشد. این فناوری می تواند صدای مصنوعی را از یک کلیپ صوتی ۱۵ ثانیه ای دریافت کند و نسخه بازتولید شده را ارائه دهد. دستورالعمل‌های متنی را می‌توان با صدای تولید شده توسط این تکنولوژی را در بسیاری از زبان‌ها یا به همان زبانی که گوینده در دستور قرار می‌دهد، استفاده کرد.

شرکت OpenAI در یک پست وبلاگی اعلام کرد: رویکرد، اقدامات ایمنی و ایده‌های ما در مورد اینکه چگونه بخش تولید صدا می‌تواند در صنایع مختلف به‌خوبی مورد استفاده قرار گیرد، توسط این استقرار در مقیاس کوچک اطلاع‌رسانی می‌شود. دسترسی به شرکت‌هایی مانند Age of Learning، پلتفرم داستان سرایی بصری، Livox، تولیدکننده اپلیکیشن‌های ارتباطی هوش مصنوعی، Dimagi، ارائه‌دهنده نرم‌افزار سلامت خط مقدم، و سیستم سلامت Lifespan جرو دستاورد های جدید این برند در سال جدید است.

جزئیات قابل توجه مدل هوش مصنوعی شبیه سازی صوتی OpenAI

طی همکاری های جدید با Age of Learning، این فناوری برای ایجاد محتوای صوتی از پیش تعیین‌شده و خواندن پاسخ‌های هم‌زمان و شخصی‌شده برای دانش‌آموزان نوشته‌شده توسط GPT-4 در این گزیده‌هایی موجود را استفاده می کند.

طبق گفته پتلفرم سازنده، توسعه مدل هوش مصنوعی شبیه سازی صوتی OpenAI در اواخر سال ۲۰۲۲ آغاز شده است و این فناوری قبلاً برای تقویت صداهای از پیش تعیین شده API تبدیل متن به گفتار و ویژگی خواندن به کار می رفت.

جف هریس، یکی از اعضای تیم محصول این پروژه، در مصاحبه ای با خبرگذاری ها اظهار داشت که با استفاده از ترکیب داده های مجوزدار و در دسترس عموم آموزش کامل نسخه جدید صورت گرفته است. همچنین، طبق بیانه‌ای از این برند، نسخه فعلی تنها برای تقریباً ده توسعه دهنده بزرگ قابل دسترسی خواهد بود.

یکی از جنبه های هوش مصنوعی مولد که هنوز در حال توسعه است، تولید متن به صدا با استفاده از این فناوری بود. مطالعات کمتری بر روی تولید گفتار نسبت به صداهای ابزاری یا طبیعی متمرکز شده وجود دارد. برخی از نام‌ها در این بخش شامل شرکت‌هایی مانند Podcastle و ElevenLabs هستند که فناوری‌های شبیه‌سازی صوتی و قابلیت‌هایی را که Vergecast در سال گذشته مورد بررسی قرار داد، ارائه می‌کنند.

دولت ایالات متحده در تلاش است تا استفاده غیراخلاقی از فناوری صدای هوش مصنوعی را کاملا متوقف کند. پس از اینکه مردم شروع به دریافت تماس های هرزنامه با نسخه شبیه سازی شده از صدای رئیس جمهور جو بایدن کردند، کمیسیون ارتباطات فدرال ماه گذشته تماس های رباتیک با به کارگیری این قابلیت را ممنوع کرد.

علاوه براین، شرکت سازنده ادعا می کند که شرکای آن متعهد به رعایت مقررات استفاده خود هستند که استفاده از مدل هوش مصنوعی شبیه سازی صوتی OpenAI را برای جعل هویت افراد یا سازمان ها بدون مجوز ممنوع می کند.

علاوه بر این، برند های همکار نباید ویژگی هایی ارائه بدهند که به کاربران قابلیت ضبط صدای خود را داشته باشند. در این عنوان رضایت صریح و آگاهانه گوینده اصلی باید دریافت شود و به شنوندگان اطلاع دهند که صداها ساخته شده از هوش مصنوعی (AI) هستند. همچنین، به منظور ردیابی منبع آن و نظارت بر نحوه استفاده از صدا، شرکت سازنده فایل های صوتی را با واترمارک اصلی ارائه می کند.

به منظور کاهش خطرات مرتبط با ابزارهایی مانند این، پلتفرم سازنده تعدادی اقدامات شامل حذف احراز هویت مبتنی بر صدا برای دسترسی به حساب های بانکی، ایجاد سیاست هایی برای محافظت از استفاده از صدای انسان در هوش مصنوعی، افزایش آگاهی را پیشنهاد کرد.

__ تکنودات مرجع اخبار تکنولوژی __

نظرتون در مورد این مطلب چیه

آدرس ایمیل شما بصورت عمومی منتشر نخواهد شد.

لطفا از ارسال نظرات بی ربط با این مطلب خودداری نمایید.