الذكاء الاصطناعي من Google DeepMind ينشأ مقاطع صوتية للفيديو
تاريخ النشر: 18th, June 2024 GMT
يعمل مختبر الذكاء الاصطناعي DeepMind التابع لشركة Google على تقنية جديدة يمكنها إنشاء مقاطع صوتية، وحتى حوار، لتتماشى مع مقاطع الفيديو. شارك المختبر التقدم الذي أحرزه في مشروع تقنية تحويل الفيديو إلى الصوت (V2A)، والذي يمكن إقرانه مع Google Veo وأدوات إنشاء الفيديو الأخرى مثل Sora من OpenAI.
في منشور مدونته، يوضح فريق DeepMind أن النظام يمكنه فهم وحدات البكسل الأولية ودمج تلك المعلومات مع المطالبات النصية لإنشاء مؤثرات صوتية لما يحدث على الشاشة.
قام باحثو DeepMind بتدريب التكنولوجيا على مقاطع الفيديو والتسجيلات الصوتية والتعليقات التوضيحية التي تم إنشاؤها بواسطة الذكاء الاصطناعي والتي تحتوي على أوصاف تفصيلية للأصوات ونصوص الحوار.
وقالوا إنه من خلال القيام بذلك، تعلمت التكنولوجيا ربط أصوات معينة بالمشاهد المرئية. وكما لاحظ TechCrunch، فإن فريق DeepMind ليس أول من أطلق أداة ذكاء اصطناعي يمكنها إنشاء مؤثرات صوتية - فقد أصدرت ElevenLabs واحدة مؤخرًا أيضًا - ولن تكون الأخيرة.
يكتب الفريق: "يتميز بحثنا عن حلول تحويل الفيديو إلى الصوت الموجودة لأنه يمكنه فهم وحدات البكسل الأولية وإضافة مطالبة نصية أمر اختياري".
على الرغم من أن المطالبة النصية اختيارية، إلا أنه يمكن استخدامها لتشكيل المنتج النهائي وتحسينه بحيث يكون دقيقًا وواقعيًا قدر الإمكان. يمكنك إدخال مطالبات إيجابية لتوجيه الإخراج نحو إنشاء الأصوات التي تريدها، على سبيل المثال، أو مطالبات سلبية لتوجيهه بعيدًا عن الأصوات التي لا تريدها. في العينة أدناه، استخدم الفريق الموجه: "فيلم سينمائي، فيلم إثارة، فيلم رعب، موسيقى، توتر، أجواء، خطى على الخرسانة.
يعترف الباحثون أنهم ما زالوا يحاولون معالجة القيود الحالية لتقنية V2A الخاصة بهم، مثل الانخفاض في جودة الصوت الناتج الذي يمكن أن يحدث إذا كانت هناك تشوهات في الفيديو المصدر. كما أنهم ما زالوا يعملون على تحسين مزامنة الشفاه للحوار الذي تم إنشاؤه. بالإضافة إلى ذلك، تعهدوا بإخضاع التكنولوجيا "لتقييمات واختبارات صارمة للسلامة" قبل إطلاقها للعالم.
المصدر: بوابة الوفد
إقرأ أيضاً:
طحنون بن زايد: نتوافق مع «بلاكستون» في أهمية دمج الذكاء الاصطناعي باستراتيجيات الاستثمار العالمية
قال سموّ الشيخ طحنون بن زايد آل نهيان، نائب حاكم إمارة أبوظبي، مستشار الأمن الوطني، في تغريدة عبر منصة «إكس»: «ناقشت مع ستيفن شوارزمان، الرئيس التنفيذي والشريك المؤسس لمجموعة «بلاكستون» للاستشارات المالية مستقبل الذكاء الاصطناعي».
وأضاف سموّه: «لدينا رؤى متوافقة في أهمية دمج تقنيات الذكاء الاصطناعي ضمن استراتيجيات الاستثمار العالمية، ونتطلع إلى العمل معاً لاستكشاف المسارات المحتملة التي يمكن أن تعيد تعريف معايير الصناعة وتعزز الأطر الاقتصادية العالمية».