يعمل مختبر الذكاء الاصطناعي DeepMind التابع لشركة Google على تقنية جديدة يمكنها إنشاء مقاطع صوتية، وحتى حوار، لتتماشى مع مقاطع الفيديو. شارك المختبر التقدم الذي أحرزه في مشروع تقنية تحويل الفيديو إلى الصوت (V2A)، والذي يمكن إقرانه مع Google Veo وأدوات إنشاء الفيديو الأخرى مثل Sora من OpenAI.

 في منشور مدونته، يوضح فريق DeepMind أن النظام يمكنه فهم وحدات البكسل الأولية ودمج تلك المعلومات مع المطالبات النصية لإنشاء مؤثرات صوتية لما يحدث على الشاشة.

للملاحظة، يمكن أيضًا استخدام الأداة لإنشاء مقاطع صوتية للقطات التقليدية، مثل الأفلام الصامتة وأي فيديو آخر بدون صوت.

قام باحثو DeepMind بتدريب التكنولوجيا على مقاطع الفيديو والتسجيلات الصوتية والتعليقات التوضيحية التي تم إنشاؤها بواسطة الذكاء الاصطناعي والتي تحتوي على أوصاف تفصيلية للأصوات ونصوص الحوار. 

وقالوا إنه من خلال القيام بذلك، تعلمت التكنولوجيا ربط أصوات معينة بالمشاهد المرئية. وكما لاحظ TechCrunch، فإن فريق DeepMind ليس أول من أطلق أداة ذكاء اصطناعي يمكنها إنشاء مؤثرات صوتية - فقد أصدرت ElevenLabs واحدة مؤخرًا أيضًا - ولن تكون الأخيرة.

 يكتب الفريق: "يتميز بحثنا عن حلول تحويل الفيديو إلى الصوت الموجودة لأنه يمكنه فهم وحدات البكسل الأولية وإضافة مطالبة نصية أمر اختياري".


على الرغم من أن المطالبة النصية اختيارية، إلا أنه يمكن استخدامها لتشكيل المنتج النهائي وتحسينه بحيث يكون دقيقًا وواقعيًا قدر الإمكان. يمكنك إدخال مطالبات إيجابية لتوجيه الإخراج نحو إنشاء الأصوات التي تريدها، على سبيل المثال، أو مطالبات سلبية لتوجيهه بعيدًا عن الأصوات التي لا تريدها. في العينة أدناه، استخدم الفريق الموجه: "فيلم سينمائي، فيلم إثارة، فيلم رعب، موسيقى، توتر، أجواء، خطى على الخرسانة.


يعترف الباحثون أنهم ما زالوا يحاولون معالجة القيود الحالية لتقنية V2A الخاصة بهم، مثل الانخفاض في جودة الصوت الناتج الذي يمكن أن يحدث إذا كانت هناك تشوهات في الفيديو المصدر. كما أنهم ما زالوا يعملون على تحسين مزامنة الشفاه للحوار الذي تم إنشاؤه. بالإضافة إلى ذلك، تعهدوا بإخضاع التكنولوجيا "لتقييمات واختبارات صارمة للسلامة" قبل إطلاقها للعالم.

المصدر: بوابة الوفد

إقرأ أيضاً:

طحنون بن زايد: نتوافق مع «بلاكستون» في أهمية دمج الذكاء الاصطناعي باستراتيجيات الاستثمار العالمية

قال سموّ الشيخ طحنون بن زايد آل نهيان، نائب حاكم إمارة أبوظبي، مستشار الأمن الوطني، في تغريدة عبر منصة «إكس»: «ناقشت مع ستيفن شوارزمان، الرئيس التنفيذي والشريك المؤسس لمجموعة «بلاكستون» للاستشارات المالية مستقبل الذكاء الاصطناعي».
وأضاف سموّه: «لدينا رؤى متوافقة في أهمية دمج تقنيات الذكاء الاصطناعي ضمن استراتيجيات الاستثمار العالمية، ونتطلع إلى العمل معاً لاستكشاف المسارات المحتملة التي يمكن أن تعيد تعريف معايير الصناعة وتعزز الأطر الاقتصادية العالمية».

مقالات مشابهة

  • Google تطلق "مبادرة فرص الذكاء الاصطناعي"
  • «الذكاء الاصطناعي» يتوقع مستقبل أموريم مع مانشستر يونايتد!
  • الأسهم الأمريكية تغلق منخفضة مع ارتفاع تكلفة الذكاء الاصطناعي
  • تحديث من تيليجرام لمقاطع الفيديو.. ما الجديد؟
  • ولي عهد الفجيرة وابتسام المزروعي يؤكدان أهمية الذكاء الاصطناعي
  • ميتا ترصد 38 مليار دولار للاستثمار في الذكاء الاصطناعي
  • طحنون بن زايد: نتوافق مع «بلاكستون» في أهمية دمج الذكاء الاصطناعي باستراتيجيات الاستثمار العالمية
  • ميتا تعتزم ضخ مبالغ كبيرة في الذكاء الاصطناعي
  • مدعومة بالذكاء الاصطناعي.. «جوجل» تستعد لطرح ميزة في «Google Play»
  • ولي عهد الفجيرة يشهد محاضرة حول الذكاء الاصطناعي