NVIDIA تطلق Fugatto لإنشاء صوت من المطالبات النصية
تاريخ النشر: 26th, November 2024 GMT
أطلقت NVIDIA نموذجًا تجريبيًا جديدًا للذكاء الاصطناعي التوليدي، والذي تصفه بأنه "سكين الجيش السويسري للصوت". يمكن للنموذج المسمى Foundational Generative Audio Transformer Opus 1، أو Fugatto، تلقي الأوامر من المطالبات النصية واستخدامها لإنشاء الصوت أو تعديل ملفات الموسيقى والصوت والصوت الموجودة. تم تصميمه بواسطة فريق من الباحثين في مجال الذكاء الاصطناعي من جميع أنحاء العالم، وتقول NVIDIA أن هذا جعل "قدرات تعدد اللهجات واللغات أقوى".
قال رافائيل فالي، أحد الباحثين وراء المشروع ومدير أبحاث الصوت التطبيقية في NVIDIA، "أردنا إنشاء نموذج يفهم ويولد الصوت مثلما يفعل البشر". وقد أدرجت الشركة بعض السيناريوهات الواقعية المحتملة حيث يمكن أن يكون Fugatto مفيدًا في إعلانها. وقد اقترحت الشركة أن منتجي الموسيقى يمكنهم استخدام التكنولوجيا لتوليد نموذج أولي بسرعة لفكرة أغنية، والتي يمكنهم بعد ذلك تحريرها بسهولة لتجربة أنماط وأصوات وآلات مختلفة.
يمكن للناس استخدامها لتوليد مواد لأدوات تعلم اللغة بصوت من اختيارهم. ويمكن لمطوري ألعاب الفيديو استخدامها لإنشاء أشكال مختلفة من الأصول المسجلة مسبقًا لتناسب التغييرات في اللعبة بناءً على اختيارات اللاعبين وأفعالهم. بالإضافة إلى ذلك، وجد الباحثون أن النموذج يمكنه إنجاز مهام ليست جزءًا من تدريبه المسبق، مع بعض الضبط الدقيق. يمكنه الجمع بين التعليمات التي تم تدريبه عليها بشكل منفصل، مثل توليد كلام يبدو غاضبًا بلكنة معينة أو صوت الطيور التي تغرد أثناء عاصفة رعدية. يمكن للنموذج أيضًا توليد أصوات تتغير بمرور الوقت، مثل هدير عاصفة مطيرة أثناء تحركها عبر الأرض.
لم تذكر شركة NVIDIA ما إذا كانت ستمنح الجمهور إمكانية الوصول إلى Fugatto، لكن النموذج ليس أول تقنية ذكاء اصطناعي توليدية يمكنها إنشاء أصوات من مطالبات نصية. أصدرت Meta سابقًا مجموعة أدوات ذكاء اصطناعي مفتوحة المصدر يمكنها إنشاء أصوات من أوصاف نصية. تمتلك شركة Google نظام الذكاء الاصطناعي الخاص بها لتحويل النصوص إلى موسيقى والذي يسمى MusicLM والذي يمكن للأشخاص الوصول إليه من خلال موقع AI Test Kitchen التابع للشركة.
المصدر: بوابة الوفد
إقرأ أيضاً:
صحف بريطانية تطلق حملة ضد مقترحات حول "الذكاء الاصطناعي"
أطلقت بعض أكبر الصحف في المملكة المتحدة، اليوم الثلاثاء، حملة منسقة عبر صفحاتها الأولى، لإثارة مخاوفها بشأن تأثير الذكاء الاصطناعي على الصناعات الإبداعية، بحسب ما أوردته وكالة الأنباء البريطانية (بي إيه ميديا).
وظهرت أغلفة خاصة في إصدارات اليوم، لصحف "ديلي إكسبريس"، و"ديلي ميل"، و"ذا ميرور"، و"ديلي ستار"، و"ذا آي"، و "ذا صن"، و "ذا تايمز"، بالإضافة إلى عدد من العناوين الإقليمية، لتنتقد الاستشارة التي تقوم بها الحكومة بشأن الإعفاءات المحتملة، التي يمكن إضافتها إلى قانون حقوق الملكية لتدريب نماذج الذكاء الاصطناعي.
The UK’s creative industries have today launched an unprecedented campaign #MakeItFair across national, local and regional news brands to highlight how their content is at risk of being given away for free to AI firms as the government proposes weakening copyright law.
Read on… pic.twitter.com/aJokhO41Kn
ومن شأن المقترحات أن تسمح لشركات التكنولوجيا، باستخدام المواد المحمية بحقوق الملكية للمبدعين والناشرين، دون الحاجة إلى دفع رسوم أو الحصول على ترخيص، أو تعويض المبدعين عن استخدام أعمالهم.
ورداً على ذلك، قام الناشرون بإطلاق حملة "ميك إت فير" (اجعلوها عادلة)، والتي شهدت قيام الصحف بوضع أغلفة على صفحتها الأولى، منتقدة استشارة الحكومة بشأن الإعفاءات، تحت تنظيم "جمعية وسائل الإعلام الإخبارية".
“I don't think I've ever seen newspapers editorialised with one voice - this is a first.”
News UK COO David Dinsmore explains the Make It Fair campaign, warning about the existential threat posed by generative AI models to creative industries.@DaveDins @StigAbell @KateEMcCann pic.twitter.com/ncGFoXKYpO
ويأتي ذلك في توقيت يتزامن مع اليوم الأخير من مشاورات الحكومة، اليوم الثلاثاء.