ساخت ویدیو با هوش مصنوعی OpenAI امکان پذیر نیست
بر اساس گفته سازندگان انیمیشن کوتاه «Air Head»، کار با هوش مصنوعی تولید ویدیوی «سورا»ی OpenAI بسیار چالش برانگیزه و علیرغم ادعای سهولت کار با این ابزار، نیازمند صدها دستورالعمل و کار فشرده روی جلوه های ویژه برای دستیابی به یک داستان منسجم حتی کوتاهتر از ۲ دقیقهست.
استودیوی «شای کیدز» به تازگی انیمیشن کوتاه «Air Head» را با همکاری مدل تولید ویدیوی هوش مصنوعی «سورا»ی OpenAI ساخته. OpenAI پیشتر دموی تاثیرگذاری را به نمایش گذاشته بود که با استفاده از «سورا» و توسط همین استودیو ساخته شده بود. با این حال، مصاحبه اخیر FX Guide با «شای کیدز» نشان می ده که علیرغم ادعای OpenAI مبنی بر سهولت تولید ویدیو با «سورا»، این استودیو کار قابل توجهی را در بخش پس از تولید انیمیشن انجام داده.
توانایی های «سورا» به طور قطع چشمگیره و دستاوردهایی را به همراه دارد که تنها چند سال پیش تقریبا غیرممکن بود. اما تیم «شای کیدز» همچنان نزدیک به دو هفته را صرف ساخت «سر بی هوا» کرده که دلیل اصلی آن محدودیت های هوش مصنوعیه. یکی از بزرگترین موانع بر سر راه «شای کیدز»، فقدان انسجام خروجیهای «سورا» بوده که تیم تولید را ملزم به استفاده از روشی غیرمتعارف در تدوین کرده. این روش شباهتهایی به ساخت فیلم یا مستندی با استفاده از تصاویر پیدا شده داره.
به گفته پاتریک سادربرگ، از اعضای بخش پس از تولید «Air Head»، فرایند کار بدین صورت بوده که ابتدا حجم زیادی از خروجیهای «سورا» تولید شده و سپس تلاش بر آن بوده تا با تدوینی هوشمندانه، آنها را به روشی جذاب در کنار صدای روایت اثر قرار بدن.
«شای کیدز» فیلمنامهای برای این ویدیو داشت، اما خروجیهای متنوع «سورا» آنها را ملزم به انعطاف پذیری بالا و تطبیق پذیری با خروجیهای تولید شده کرده. همچنین، حفظ انسجام بصری بین نماهای مختلف با چالشهایی همراه بوده، چرا که «سورا» اغلب سرهای متفاوتی را روی بادکنک خروجی میداده.
به طور کلی، سادربرگ میگوید صدها بار فرایند تولید خروجی را با «سورا» تکرار کردهان تا تنها به یک دقیقه و نیم محتوای قابل ویرایش دست پیدا کنن. او تخمین میزند که نسبت خام تولید شده توسط «سورا» به محتوای نهایی اثر، ۳۰۰ به ۱ بوده، به این معنی که تنها حدود ۰.۳۳ درصد از خروجی «سورا» در تدوین نهایی به کار گرفته شده.
با این حال، کار با «سورا» فراتر از تولید صدها کلیپ بوده. تیم «شای کیدز» همچنین مجبور شد به صورت دستی وارد بشه و کل فرایندهای پس از تولید رایج مانند اصلاح رنگ، تغییر سرعت و حتی اعمال جلوه های ویژه را برای حذف عناصر ناخواسته از فریم انجام بده. در برخی خروجیها، «سورا» بادکنکی را با چهرهای چاپ شده روی آن تولید کرده بوده، و در برخی دیگر، بادکنک رنگهای متفاوتی داشت یا یک نخ ناخواسته از پایین آن آویزان بود، که همه این موارد نیازمند حذف و اصلاح در نرم افزارهایی مانند ادوبی افتر افکتس بوده.
در حالی که «سورا» و ویدیوهای تولید شده با هوش مصنوعی دستاوردهای قابل توجهی را به همراه داشتهان، به نظر میرسد هنوز فاصله زیادی با جایگزین کردن کامل هنرمندان و متخصصان پشت صحنه دارن، به ویژه اگر قرار باشه محتوایی با انسجام و مدت زمان بیشتر از چند ثانیه تولید بشه. این امر احتمالا دلیل اصلی این است که همه ویدیوهای «غیرتدوین شده» که OpenAI در صفحه «سورا»ی خود منتشر کرده، به جز دو مورد، همگی در حدود ۲۰ ثانیه یا کمترن.
__ تکنودات مرجع اخبار تکنولوژی __