إنفيديا تكشف عن نموذج ذكاء اصطناعي لتعديل الأصوات وإنتاج أصوات جديدة
تاريخ النشر: 28th, November 2024 GMT
أعلنت شركة إنفيديا، الرائدة عالميًا في صناعة الشرائح وبرمجيات الذكاء الاصطناعي، عن تطوير نموذج ذكاء اصطناعي جديد يحمل اسم "Fugatto" يمكنه تعديل الأصوات وإنتاج أصوات مبتكرة.
تم تصميم هذا النموذج لدعم منتجي الموسيقى والأفلام وألعاب الفيديو، حيث يمكنه تحويل وصف نصي إلى موسيقى أو مؤثرات صوتية فريدة، بما في ذلك أصوات غير مألوفة مثل جعل البوق يصدر صوت نباح الكلاب.
أقرأ أيضاً.. "أوبن إي آي" تدخل عالم تصميم الرقائق الخاصة لمنافسة "إنفيديا"
ميزات تقنية "Fugatto"
ما يميز هذا النموذج عن غيره من تقنيات الذكاء الاصطناعي هو قدرته على تعديل الصوتيات الموجودة. على سبيل المثال، يمكنه تحويل مقطوعة تعزف على البيانو إلى صوت بشري يغني نفس المقطع، أو تعديل تسجيل صوتي لتغيير اللهجة أو الحالة العاطفية.
قال برايان كاتانزارو، نائب رئيس قسم أبحاث التعلم العميق المطبّق في إنفيديا: "إذا نظرنا إلى الموسيقى على مدار الخمسين عامًا الماضية، نجد أن الحواسيب والمُركِّبات الصوتية قد أحدثت فرقًا كبيرًا. أعتقد أن الذكاء الاصطناعي التوليدي سيضيف إمكانيات جديدة في مجالات الموسيقى وألعاب الفيديو وحتى للأفراد العاديين الذين يرغبون في الإبداع".
مخاوف أخلاقية وخطط مستقبلية
رغم الإمكانات الهائلة للنموذج، أكدت إنفيديا أنها لا تنوي إطلاق التقنية للجمهور في الوقت الحالي، مشيرة إلى المخاطر المحتملة لاستخدامات غير أخلاقية أو إنتاج محتوى مسيء أو منتهك لحقوق الملكية الفكرية. وأوضح كاتانزارو: "أي تقنية توليدية تحمل مخاطر، لذلك يجب أن نكون حذرين في إطلاقها".
نقاشات في قطاع الترفيه
التكنولوجيا الجديدة تأتي في وقت يشهد توترًا متزايدًا بين شركات التكنولوجيا وقطاع الترفيه، خاصة بعد اتهام الممثلة سكارليت جوهانسون لـ ""أوبن إي آي"" بمحاكاة صوتها دون إذن. مثل هذه القضايا تسلط الضوء على التحديات التي تواجه تقنيات الذكاء الاصطناعي التوليدية وكيفية استخدامها بشكل مسؤول.
أقرأ أيضاً.. تحدث 9 لغات بصوتك مع تقنية ثورية من "مايكروسوفت تيمز"
تدريب النموذج ومستقبله
تم تدريب "Fugatto" باستخدام بيانات مفتوحة المصدر، وتدرس إنفيديا بعناية كيفية إطلاقه بشكل آمن. هذا الإعلان يعكس التوجه المتزايد نحو تقنيات الذكاء الاصطناعي في إنتاج المحتوى الإبداعي، مع التأكيد على ضرورة معالجة المخاوف المتعلقة بسوء الاستخدام.
المصدر: صحيفة الاتحاد
كلمات دلالية: إنفيديا أوبن إي آي ألعاب الفيديو الأفلام ذكاء اصطناعي الأصوات الذکاء الاصطناعی
إقرأ أيضاً:
فوغاتو من إنفيديا.. كيف أسهم باحثون أردنيون في تطوير ثورة الصوتيات؟
أصدرت شركة "إنفيديا" نموذجا تجريبيا جديدا للذكاء الاصطناعي التوليدي أطلقت عليه اسم "فوغاتو" (Fugatto) ووصفته بأنه "سكين الجيش السويسري للصوت"، وفقا لموقع "إنفيديا" الرسمي.
وتتيح أداة "فوغاتو" استخدام النص أو الصوت المُدخل في إنشاء الأصوات والكلام والموسيقى وغيرها من التعديلات الصوتية.
وقد صمم النموذج باحثون في مجال الذكاء الاصطناعي من دول مختلفة منها الهند والبرازيل والصين والأردن وكوريا الجنوبية، وتقول "إنفيديا" إن ذلك يُحسن من قدرات النموذج على فهم اللهجات واللغات المتعددة.
وقال رافائيل فاليه أحد الباحثين ومدير أبحاث الصوت في شركة إنفيديا "أردنا إنشاء نموذج يفهم ويولد الصوت مثلما يفعل البشر تماما".
وتدّعي "إنفيديا" أن نموذجها يمكنه إنشاء مقطوعة موسيقية من خلال كتابة نص فقط، كما يستطيع إزالة أو إضافة آلات موسيقية من أغنية معينة، بالإضافة إلى تغيير اللهجة أو العاطفة في الصوت، فمثلا يحوّل النص إلى صوت غاضب أو حزين أو ضاحك حسب الاختيار، كما يتيح للأشخاص إنتاج أصوات لم يسمعوها من قبل.
أين يمكن استخدام "فوغاتو"؟يمكن لمنتجي الموسيقى استخدام نموذج "فوغاتو" لإنشاء فكرة أغنية بسرعة أو تعديلها، وتجربة أنماط وأصوات وآلات مختلفة، ويمكنهم أيضا إضافة تأثيرات وتعزيز جودة الصوت لمقطوعة معينة.
وقال إيدو زمشليني، وهو منتج ومؤلف أغان حاصل على العديد من الجوائز البلاتينية وعضو في برنامج "إنفيديا إنسيبشن" (NVIDIA Inception)، إن الذكاء الاصطناعي "أتاح لنا كتابة الفصل التالي من الموسيقى، فنحن لدينا آلة جديدة الآن لصنع الموسيقى، وهذا مثير للغاية".
ومن جهة أخرى، يمكن لأي وكالة إعلانات استخدام "فوغاتو" لاستهداف حملة معينة في مناطق أو مواقف عدة وتطبيق لهجات وعواطف مختلفة على تسجيلات الصوت.
ويمكن لمطوري ألعاب الفيديو استخدام النموذج لتعديل العناصر المسجلة سابقا لتناسب المواقف المتغيرة أثناء لعب المستخدمين للعبة، أو يمكنهم إنشاء عناصر أو أصوات جديدة تناسب أحداث اللعبة.
ويتميز نموذج "فوغاتو" عن غيره بأنه يتحكم بدقة في تطور المشهد، فمثلا يمكنه إنشاء أصوات لعاصفة رعدية مارقة ويُظهر صوت الرعد يختفي ببطء مع ابتعاد العاصفة، كما يمكنه إنشاء مشاهد صوتية إبداعية مثل عاصفة ماطرة تتلاشى ببطء عند شروق الشمس مع صوت زقزقة العصافير.
ولم تذكر "إنفيديا" في منشور مدونتها إذا كانت ستمنح المستخدمين إمكانية الوصول إلى نموذج "فوغاتو"، أو متى سيتوفر للمستخدمين.
ومن الجدير بالذكر أن نموذج "إنفيديا" ليس أول تقنية ذكاء اصطناعي يمكنها إنشاء الأصوات بالاعتماد على نص مُدخل، فقد أصدرت ميتا مجموعة أدوات ذكاء اصطناعي مفتوحة المصدر يمكنها إنشاء صوت من نص.
ومن جانبها، تمتلك غوغل نموذج ذكاء اصطناعي لتحويل النص إلى موسيقى يعرف باسم "ميوزك إل إم" (MusicLM) يمكن الوصول إليه من خلال موقع "إيه آي تيست كيتشن" (AI Test Kitchen) التابع للشركة.