گوگل امکان ساخت موسیقی با Lyria 3 را در Gemini راهاندازی کرد

شرکت گوگل اعلام کرده است که کاربران اکنون میتوانند با بهرهگیری از اپلیکیشن Gemini، موسیقیهایی مبتنی بر هوش مصنوعی تولید نمایند؛ این قابلیت از پیشرفتهترین مدل تولید موسیقی این شرکت به نام Lyria 3 پشتیبانی میکند.
بر اساس گزارش رسانه اخبار فناوری تکنا، به نقل از گوگل، با گسترش استفاده از هوش مصنوعی در تولید متن، تصویر و ویدیو، حالا تولید موسیقی نیز به عنوان یک بخش اصلی به این جریان ملحق شده است. با ادغام Lyria 3 در Gemini، کاربران میتوانند تنها با ارائه توصیفهای متنی ساده، قطعات موسیقی تازهای تولید کرده و بدون نیاز به نرمافزارهای تخصصی آهنگسازی به خروجی قابل استفاده دست یابند.
Lyria 3 که به عنوان یک ابزار جدید تولید موسیقی مبتنی بر هوش مصنوعی توسط گوگل دیپمایند معرفی شده، قادر است با تکیه بر ورودیهای متنی، فایلهای صوتی با کیفیت بالا تولید کند. این سامانه برخلاف برخی مدلهای قبلی، بهگونهای طراحی شده که برای خلق موسیقی منسجمتر با ریتم، ملودی و سازبندی مناسبتر عمل کند. طبق توضیحات گوگل، این ابزار قادر به درک زبان طبیعی است و مواد ثانوی شامل سبک، حالوهوا، تمپو و حتی شیوههای تولید را تحلیل کرده و بر اساس آن، بخشی اورجینال را ایجاد میکند.
این مدل با تحلیل پرامپتهای کاربر، موسیقی را بر مبنای پارامترهای استخراجشده ایجاد میکند. همچنین Lyria 3 قابلیت تولید موسیقی متناسب با عکس و ویدیو را داراست و میتواند لحن و جو بصری را با قطعه صوتی همسو کند. تمامی آثار تولیدشده میتوانند با استفاده از هوش مصنوعی، کاور آرتی نیز داشته باشند که فرایند انتشار آثار را برای هنرمندان تسهیل میسازد. گوگل دیپمایند اظهار داشته که این مدل بخشی از استراتژی کلی این شرکت برای توسعه هوش مصنوعی چندوجهی است، که در آن تولید متن، تصویر، صدا و ویدیو به طور همزمان در یک پلتفرم واحد گنجانده شده است.
برای دستیابی به نتایج دقیقتر، پیشنهاد میشود که کاربران پرامپتهای واضح و ساختاریافته ارائه دهند. ذکر سبکهایی مانند pop، hip-hop، classical، EDM و یا ambient، تعیین حالوهواهایی مانند energetic، calm، suspenseful و یا uplifting، اشاره به سازهایی نظیر piano، guitar، synth، drums و یا strings، همچنین مشخص کردن تمپو و توضیح کاربرد نهایی مثل موسیقی پسزمینه برای vlog یا قطعه تمرینی، میتواند دقت خروجی را بالا ببرد. هرچه توصیف دقیقتر باشد، احتمال تولید ترکیبی موسیقایی مطابق با انتظارات کاربر بیشتر خواهد بود.
برای استفاده از این ویژگی، ابتدا باید اپلیکیشن یا وبسایت Gemini را باز کرده و با حساب کاربری گوگل خود وارد شوید و از بهروز بودن نسخه برنامه مطمئن شوید. سپس در بخش ابزارهای خلاقانه، گزینه تولید موسیقی که Lyria 3 در آن یکپارچه است، را انتخاب کنید. در کادر پرامپت، توصیف دقیقی از موسیقی موردنظر خود وارد نمایید و در صورت نیاز، جزئیاتی مانند نبود وکال، ملایم بودن پرکاشن یا ایجاد build-up دهثانیهای پیش از drop را اضافه کنید تا محدودیتهای بیشتری برای مدل تعریف شود.
پس از آمادهسازی پرامپت، باید گزینه generate را انتخاب کنید تا Gemini با استفاده از Lyria 3 درخواست را پردازش کند و یک قطعه موسیقی تولیدشده توسط هوش مصنوعی ارائه دهد. زمان پردازش ممکن است بسته به پیچیدگی درخواست و بار سرور متغیر باشد. اگر خروجی اولیه با انتظارات کاربر همخوانی نداشته باشد، امکان اصلاح پرامپت و اعمال محدودیتهای بیشتر وجود دارد تا نسخههای بعدی به نتایج مطلوبتری دست یابند.


