گوگل به شکل رسمی، «لومیِر» (Lumiere) را که نسل جدید تولیدکننده ویدیو از متن مبتنی بر هوش مصنوعی است، معرفی کرد.
به گزارش ایسنا به نقل از تی ای، گروهی از پژوهشگران هوش مصنوعی در گوگل ریسرچ (Google Research) نسل جدید تولیدکننده ویدیو از متن را که مبتنی بر هوش مصنوعی است، به نام لومیر (Lumiere) توسعه داده اند.
این گروه مقاله ای را منتشر کرده است که در آن تلاش های خود را در پایگاه پیش چاپ arXiv شرح داده است.
در طول چند سال گذشته ، برنامه های کاربردی هوش مصنوعی از آزمایشگاه به جامعه کاربران منتقل شده اند. برای مثال ، مدل های زبانی بزرگ (LLM) مانند ChatGPT با مرورگرها ادغام شده اند که به کاربران اجازه می دهند متون دلخواه خود را به روش های بی سابقه ای تولید کنند.
اخیرا مولدهای تبدیل متن به تصویر به کاربران اجازه ایجاد تصاویر فراواقعی را داده اند و مولدهای تبدیل متن به ویدیو به کاربران این امکان را داده اند که با استفاده از چند کلمه کلیپ های ویدیویی کوتاه تولید کنند.
اکنون تیم گوگل (Google) در این تلاش جدید با اعلام یک تولیدکننده ویدیو از متن به نام لومیر، این حوزه را به اوج جدیدی رسانده است.
لومیر که احتمالاً از روی نام برادران لومیر که پیشگامان تجهیزات اولیه عکاسی بودند نامیده شده است، به کاربران اجازه می دهد جمله ساده ای مانند «دو راکون با هم کتاب می خوانند» را بنویسند و یک ویدیوی کامل از آن دریافت کنند که نشان می دهد دو راکون دقیقاً در حال مطالعه هستند.
وضوح خیره کننده و بالای این مولد هوش مصنوعی (Artificial Intelligence) جدید نشان دهنده گام بعدی در توسعه مولدهای ویدیو از متن با ایجاد نتایج بسیار بهتر است.
گوگل فناوری پشت این مولد جدید را به عنوان یک معماری پیشگامانه فضا- زمان U- Net توصیف می کند که برای تولید ویدیوی متحرک در یک مدل طراحی شده است.
ویدئوی نمایشی نشان می دهد که گوگل ویژگی های جدیدی مانند اجازه دادن به کاربران برای ویرایش یک ویدیوی موجود با برجسته کردن بخشی از آن و تایپ دستورالعمل هایی مانند «تغییر رنگ لباس به قرمز» را به این فناوری اضافه کرده است.
این مولد همچنین انواع مختلفی از نتایج را مانند سبک سازی تولید می کند که در آن سبک سوژه به جای نمایش تمام رنگی آن ایجاد می شود و ارجاع به سبک های مختلف را نیز ممکن می کند. همچنین کارهای سینمایی انجام می دهد که در آن کاربر می تواند بخشی یا تمام یک تصویر ثابت را برجسته و آنرا متحرک کند.
گوگل در اعلامیه خود مشخص نکرد که قصد دارد« لومیر» را به عموم مردم عرضه کند یا نه و این احتمالاً به دلیل عواقب قانونی آشکاری است که امکان دارد به دلیل ایجاد احتمالی ویدیوهایی که قوانین حق نشر را نقض می کنند، ایجاد شود.
- 10
- 2