متا مدل هوش مصنوعی متن بازي را معرفی کرده است که میتواند با دریافت ورودهای متنی یا تکه های یک ملودی، آهنگ های تازه بسازد.
تیم تحقیقاتی Audiocraft از شرکت متا به تازگی یک مدل هوش مصنوعی متن باز به نام MusicGen را منتشر کرده است که شبیه ChatGPT با ورودی های متنی کار می کند، ولی از آنها آهنگ می سازد. این مدل حتی قادر است نمونه ای از یک آهنگ را دریافت کند و آنرا مطابق توصیف کاربر تغییر دهد.
به گزارش وب سایت Decoder، با استفاده از MusicGen می توانید سبک موسیقی مدنظر خود را توصیف کنید یا بخشی از یک آهنگ را به نرمافزار بدهید و روی دکمه Generate کلیک کنید. پس از چند ثانیه (در یک مثال پس از ۱۶۰ ثانیه) به آهنگ جدیدی می رسید که مطابق توصیف متنی شما ساخته شده یا تغییر پیدا کرده است.
دموی این مدل یادگیری عمیق که در سایت Hugging Face فیسبوک قرار دارد، به شما اجازه می دهد آهنگ مدنظر خود را توصیف کنید. به عنوان مثال، میتوانید بگویید آهنگی شبیه به آهنگ های دهه ۱۹۸۰ میلادی می خواهم که درام های سنگینی در پس زمینه داشته باشد.
هوش مصنوعی متا با ۲۰ هزار ساعت موسیقی آموزش داده شده است
متا برای توسعه این مدل هوش مصنوعی از ۲۰ هزار ساعت موسیقی مجوزدار شامل ۱۰ هزار قطعه آهنگ از پایگاه داده داخلی خود بهمراه داده های سایت هایی مثل Shutterstock و Pond5 استفاده کرده است. این شرکت برای بالابردن سرعت فرایند آموزش، از توکن ساز صوتی ۳۲ کیلوهرتزی EnCodec استفاده کرده تا تکه های کوچک تری از آهنگ ها را با قابلیت پردازش هم زمان بسازد.
«احسان خالق»، مهندس یادگیری ماشینی Hugging Face می گوید: «MusicGen برخلاف متدهای موجود نظیر MusicLM به بازنمایی معنایی با قابلیت نظارت بر خود نیاز ندارد و به ازای هر ثانیه صدا فقط ۵۰ گام پس رونده خودکار دارد.»
همان طور که گفتیم، MusicGen متن باز است و حتی میتواند برای تولید آهنگ های تجاری استفاده شود. این نرم افزار نشان می دهد که توسعه هوش مصنوعی با چه سرعتی درحال پیش رفتن است و مدل های یادگیری عمیق چگونه می توانند بازار موسیقی را تهدید کنند. گوگل هم حدود یک ماه پیش مدل MusicLM را معرفی کرد، اما بنظر میرسد که MusicGen عملکرد بهتری دارد.
- 9
- 4