الذكاء الاصطناعي من Google DeepMind ينشأ مقاطع صوتية للفيديو
تاريخ النشر: 18th, June 2024 GMT
يعمل مختبر الذكاء الاصطناعي DeepMind التابع لشركة Google على تقنية جديدة يمكنها إنشاء مقاطع صوتية، وحتى حوار، لتتماشى مع مقاطع الفيديو. شارك المختبر التقدم الذي أحرزه في مشروع تقنية تحويل الفيديو إلى الصوت (V2A)، والذي يمكن إقرانه مع Google Veo وأدوات إنشاء الفيديو الأخرى مثل Sora من OpenAI.
في منشور مدونته، يوضح فريق DeepMind أن النظام يمكنه فهم وحدات البكسل الأولية ودمج تلك المعلومات مع المطالبات النصية لإنشاء مؤثرات صوتية لما يحدث على الشاشة.
قام باحثو DeepMind بتدريب التكنولوجيا على مقاطع الفيديو والتسجيلات الصوتية والتعليقات التوضيحية التي تم إنشاؤها بواسطة الذكاء الاصطناعي والتي تحتوي على أوصاف تفصيلية للأصوات ونصوص الحوار.
وقالوا إنه من خلال القيام بذلك، تعلمت التكنولوجيا ربط أصوات معينة بالمشاهد المرئية. وكما لاحظ TechCrunch، فإن فريق DeepMind ليس أول من أطلق أداة ذكاء اصطناعي يمكنها إنشاء مؤثرات صوتية - فقد أصدرت ElevenLabs واحدة مؤخرًا أيضًا - ولن تكون الأخيرة.
يكتب الفريق: "يتميز بحثنا عن حلول تحويل الفيديو إلى الصوت الموجودة لأنه يمكنه فهم وحدات البكسل الأولية وإضافة مطالبة نصية أمر اختياري".
على الرغم من أن المطالبة النصية اختيارية، إلا أنه يمكن استخدامها لتشكيل المنتج النهائي وتحسينه بحيث يكون دقيقًا وواقعيًا قدر الإمكان. يمكنك إدخال مطالبات إيجابية لتوجيه الإخراج نحو إنشاء الأصوات التي تريدها، على سبيل المثال، أو مطالبات سلبية لتوجيهه بعيدًا عن الأصوات التي لا تريدها. في العينة أدناه، استخدم الفريق الموجه: "فيلم سينمائي، فيلم إثارة، فيلم رعب، موسيقى، توتر، أجواء، خطى على الخرسانة.
يعترف الباحثون أنهم ما زالوا يحاولون معالجة القيود الحالية لتقنية V2A الخاصة بهم، مثل الانخفاض في جودة الصوت الناتج الذي يمكن أن يحدث إذا كانت هناك تشوهات في الفيديو المصدر. كما أنهم ما زالوا يعملون على تحسين مزامنة الشفاه للحوار الذي تم إنشاؤه. بالإضافة إلى ذلك، تعهدوا بإخضاع التكنولوجيا "لتقييمات واختبارات صارمة للسلامة" قبل إطلاقها للعالم.
المصدر: بوابة الوفد
إقرأ أيضاً:
كيف يعزز الذكاء الاصطناعي من تحسين تجربة المستخدم ؟
تواصل المنصات الرقمية في الشرق الأوسط تعزيز مكانتها من خلال الاستفادة من تقنيات الذكاء الاصطناعي لتحسين تجربة المستخدم.
وكشفت عدد من الشركات العالمية عن ارتفاع ملحوظ في عدد المستخدمين النشطين، مما يعكس نجاح استراتيجياتها في تقديم تجارب تفاعلية متطورة.
تحسين التجربة الرقميةويلعب الذكاء الاصطناعي دورًا محوريًا في إعادة تشكيل المشهد الرقمي، حيث تُستخدم هذه التكنولوجيا لتطوير ميزات مبتكرة تعزز من تفاعل المستخدمين..فمن خلال تحليل البيانات وفهم احتياجات العملاء، تتمكن الشركة من تقديم محتوى مخصص وتجارب فريدة، مما يزيد من ولاء المستخدمين ويحفزهم على استخدام المنصة بشكل متكرر.
من جانبه صرح يانغ تاو، الرئيس التنفيذي لمجموعة يلا العالمية فى تصريحات صحفية اليوم أنه يتم الاستثمار في الذكاء الاصطناعي لتعزيز الكفاءة التشغيلية وتحسين الربحية. هذا التوجه يعكس الالتزام بخلق تجارب رقمية غامرة تعيد تعريف كيفية تفاعل المستخدمين مع خدماتها.
مواكبة التحولات الرقميةوقال: مع التحولات الرقمية السريعة في منطقة الشرق الأوسط وشمال إفريقيا، ندرك أهمية التكيف مع هذه التغييرات. فمن خلال تسخير الذكاء الاصطناعي، تسعى إلى استغلال الفرص الجديدة التي تتيحها هذه البيئة الديناميكية، مما يساهم في تعزيز مكانتها كمنصة رائدة في السوق