NVIDIA تطلق Fugatto لإنشاء صوت من المطالبات النصية
تاريخ النشر: 26th, November 2024 GMT
أطلقت NVIDIA نموذجًا تجريبيًا جديدًا للذكاء الاصطناعي التوليدي، والذي تصفه بأنه "سكين الجيش السويسري للصوت". يمكن للنموذج المسمى Foundational Generative Audio Transformer Opus 1، أو Fugatto، تلقي الأوامر من المطالبات النصية واستخدامها لإنشاء الصوت أو تعديل ملفات الموسيقى والصوت والصوت الموجودة. تم تصميمه بواسطة فريق من الباحثين في مجال الذكاء الاصطناعي من جميع أنحاء العالم، وتقول NVIDIA أن هذا جعل "قدرات تعدد اللهجات واللغات أقوى".
قال رافائيل فالي، أحد الباحثين وراء المشروع ومدير أبحاث الصوت التطبيقية في NVIDIA، "أردنا إنشاء نموذج يفهم ويولد الصوت مثلما يفعل البشر". وقد أدرجت الشركة بعض السيناريوهات الواقعية المحتملة حيث يمكن أن يكون Fugatto مفيدًا في إعلانها. وقد اقترحت الشركة أن منتجي الموسيقى يمكنهم استخدام التكنولوجيا لتوليد نموذج أولي بسرعة لفكرة أغنية، والتي يمكنهم بعد ذلك تحريرها بسهولة لتجربة أنماط وأصوات وآلات مختلفة.
يمكن للناس استخدامها لتوليد مواد لأدوات تعلم اللغة بصوت من اختيارهم. ويمكن لمطوري ألعاب الفيديو استخدامها لإنشاء أشكال مختلفة من الأصول المسجلة مسبقًا لتناسب التغييرات في اللعبة بناءً على اختيارات اللاعبين وأفعالهم. بالإضافة إلى ذلك، وجد الباحثون أن النموذج يمكنه إنجاز مهام ليست جزءًا من تدريبه المسبق، مع بعض الضبط الدقيق. يمكنه الجمع بين التعليمات التي تم تدريبه عليها بشكل منفصل، مثل توليد كلام يبدو غاضبًا بلكنة معينة أو صوت الطيور التي تغرد أثناء عاصفة رعدية. يمكن للنموذج أيضًا توليد أصوات تتغير بمرور الوقت، مثل هدير عاصفة مطيرة أثناء تحركها عبر الأرض.
لم تذكر شركة NVIDIA ما إذا كانت ستمنح الجمهور إمكانية الوصول إلى Fugatto، لكن النموذج ليس أول تقنية ذكاء اصطناعي توليدية يمكنها إنشاء أصوات من مطالبات نصية. أصدرت Meta سابقًا مجموعة أدوات ذكاء اصطناعي مفتوحة المصدر يمكنها إنشاء أصوات من أوصاف نصية. تمتلك شركة Google نظام الذكاء الاصطناعي الخاص بها لتحويل النصوص إلى موسيقى والذي يسمى MusicLM والذي يمكن للأشخاص الوصول إليه من خلال موقع AI Test Kitchen التابع للشركة.
المصدر: بوابة الوفد
إقرأ أيضاً:
اكتشاف أسرار أصوات المحيط الغامضة
يستمر الأصوات الغامضة الصادرة من أعماق المحيط الجنوبي في إذهال العلماء، حيث تشير أحدث الأبحاث إلى أن هذه الأصوات الغريبة ربما كانت "محادثة" بين حيوانات مجهولة الهوية.
وتعود تسجيلات الأصوات الغامضة التي رصدها علماء من نيوزيلندا إلى أوائل الثمانينيات ويحتوي على أربع نغمات غريبة قصيرة، فقبل عشر سنوات، قال العلماء إنهم وجدوا أدلة على أن الأصوات صدرت عن طيور المنك في القطب الجنوبي، وشككت الجمعية الصوتية الأمريكية في نتائج الباحثين.
وقال روس تشابمان الباحث بجامعة فيكتوريا البريطانية يوم الخميس "ربما كانوا يتحدثون عن العشاء، أو ربما كان الآباء يتحدثون إلى أطفالهم، أو ربما كانوا ببساطة يعلقون على تلك السفينة المجنونة التي ظلت تتحرك ذهابا وإيابا وهي تسحب ذلك الحبل الطويل خلفها" .
وتشبه الانفجارات الصوتية أصوات النعيق، مما أكسب التسجيل لقب "البطة البيولوجية"، وتنوعت التكهنات حول مصدرها، فقد تكون غواصة تحت الماء، أو سمكة .
تمكن باحثون من إدارة المحيطات والغلاف الجوي الوطنية وجامعة ديوك ومجموعات أخرى من ربط علامات أكواب الشفط والميكروفونات بحيوانات المنك وتمكنوا من تحديد نداءات "البط الحيوي" المميزة.
ويصدر حيوان المنك أصوات "ارتداد" غريبة ، وأصوات أخرى مثل تلك التي سمعت في تسجيل "البط الحيوي". قبل إصداره، لم يكن أحد يعتقد أن الحيتان كانت في المنطقة خلال فصل الشتاء، حيث كان من المعروف أنها تهاجر إلى المياه الدافئة.
و تظهر الأبحاث الحديثة أن حيوان المنك مرن اجتماعيًا، حيث يكون الأفراد الأكبر والأكبر سنًا أكثر عرضة للتواصل الاجتماعي من الأفراد الأصغر والأصغر سنًا.