OpenAI گفته است که Sora در حال حاضر قادر به تولید حداکثر یک دقیقه محتوای ویدیویی Full HD است و نمونه هایی که از آن منتشر شده بسیار امیدوارکننده به نظر می رسند.
به گزارش دیجی کالا، شرکت OpenAI از مدل جدید برای تولید ویدیو به نام Sora رونمایی کرد که با استفاده از دستورهای متنی، می تواند ویدیو های واقع گرایانه ی فوق العاده ای ایجاد کند. این شرکت اعلام کرده مدل موردنظر قادر است ویدیو هایی تا حداکثر زمان ۱ دقیقه را تحویل کاربران دهد.
بر اساس اعلام OpenAI در پستی که به معرفی این مدل اختصاص یافته، Sora قادر است صحنه های پیچیده ای با چندین شخصیت، انواع حرکات خاص و جزئیات دقیق موضوع و پس زمینه را بوجود آورد. علاوه بر تولید ویدیو بر اساس متن، مدل Sora قادر است بر اساس یک تصویر ثابت ویدیو بسازد و یا فریم های گمشده یک ویدیوی موجود را پر کند و حتی طول آن را افزایش دهد. با وجود اینکه با کمی دقت می توانیم متوجه مصنوعی بودن ویدیوها شویم، ولی نسبت به مدل های مشابه ویدیو های شگفت انگیزی ارائه می دهد.
در ابتدا این مدل های هوش مصنوعی (Artificial Intelligence) تبدیل متن به عکس بودند که سروصدای زیادی راه می انداختند. ولی در یک سال اخیر، با حجم شگفت انگیزی از پیشرفت در زمینه ی تبدیل متن به ویدیو روبرو شده ایم. شرکت هایی مانند Runway و Pika مدل های تبدیل متن به ویدئوی چشمگیر خود را نشان داده اند و Lumiere گوگل نیز یکی از رقبای اصلی OpenAI در این زمینه به شمار می رود. Lumiere مشابه Sora، ابزارهای متن به ویدئو را به کاربران ارائه می دهد و همچنین به آنها امکان می دهد از یک تصویر ثابت ویدئو ایجاد کنند.
در حال حاضر، دسترسی به مدل Sora تنها برای افراد گروهی موسوم به «تیم قرمز» امکان پذیر است که به ارزیابی آسیب ها و خطرات احتمالی این مدل می پردازند. OpenAI همچنین به برخی از هنرمندان، طراحان و فیلم سازان برای دریافت بازخورد، دسترسی به این مدل را ارائه داده است. این شرکت تأکید می کند که امکان دارد مدل فعلی بدرستی فیزیک یک صحنه پیچیده را شبیه سازی نکند و به درستی برخی از موارد علت و معلول را تفسیر نکند.
- 17
- 3