يعمل مختبر الذكاء الاصطناعي DeepMind التابع لشركة Google على تقنية جديدة يمكنها إنشاء مقاطع صوتية، وحتى حوار، لتتماشى مع مقاطع الفيديو. شارك المختبر التقدم الذي أحرزه في مشروع تقنية تحويل الفيديو إلى الصوت (V2A)، والذي يمكن إقرانه مع Google Veo وأدوات إنشاء الفيديو الأخرى مثل Sora من OpenAI.

 في منشور مدونته، يوضح فريق DeepMind أن النظام يمكنه فهم وحدات البكسل الأولية ودمج تلك المعلومات مع المطالبات النصية لإنشاء مؤثرات صوتية لما يحدث على الشاشة.

للملاحظة، يمكن أيضًا استخدام الأداة لإنشاء مقاطع صوتية للقطات التقليدية، مثل الأفلام الصامتة وأي فيديو آخر بدون صوت.

قام باحثو DeepMind بتدريب التكنولوجيا على مقاطع الفيديو والتسجيلات الصوتية والتعليقات التوضيحية التي تم إنشاؤها بواسطة الذكاء الاصطناعي والتي تحتوي على أوصاف تفصيلية للأصوات ونصوص الحوار. 

وقالوا إنه من خلال القيام بذلك، تعلمت التكنولوجيا ربط أصوات معينة بالمشاهد المرئية. وكما لاحظ TechCrunch، فإن فريق DeepMind ليس أول من أطلق أداة ذكاء اصطناعي يمكنها إنشاء مؤثرات صوتية - فقد أصدرت ElevenLabs واحدة مؤخرًا أيضًا - ولن تكون الأخيرة.

 يكتب الفريق: "يتميز بحثنا عن حلول تحويل الفيديو إلى الصوت الموجودة لأنه يمكنه فهم وحدات البكسل الأولية وإضافة مطالبة نصية أمر اختياري".


على الرغم من أن المطالبة النصية اختيارية، إلا أنه يمكن استخدامها لتشكيل المنتج النهائي وتحسينه بحيث يكون دقيقًا وواقعيًا قدر الإمكان. يمكنك إدخال مطالبات إيجابية لتوجيه الإخراج نحو إنشاء الأصوات التي تريدها، على سبيل المثال، أو مطالبات سلبية لتوجيهه بعيدًا عن الأصوات التي لا تريدها. في العينة أدناه، استخدم الفريق الموجه: "فيلم سينمائي، فيلم إثارة، فيلم رعب، موسيقى، توتر، أجواء، خطى على الخرسانة.


يعترف الباحثون أنهم ما زالوا يحاولون معالجة القيود الحالية لتقنية V2A الخاصة بهم، مثل الانخفاض في جودة الصوت الناتج الذي يمكن أن يحدث إذا كانت هناك تشوهات في الفيديو المصدر. كما أنهم ما زالوا يعملون على تحسين مزامنة الشفاه للحوار الذي تم إنشاؤه. بالإضافة إلى ذلك، تعهدوا بإخضاع التكنولوجيا "لتقييمات واختبارات صارمة للسلامة" قبل إطلاقها للعالم.

المصدر: بوابة الوفد

إقرأ أيضاً:

كيف يعزز الذكاء الاصطناعي من تحسين تجربة المستخدم ؟

تواصل  المنصات الرقمية في الشرق الأوسط تعزيز مكانتها من خلال الاستفادة من تقنيات الذكاء الاصطناعي لتحسين تجربة المستخدم. 

وكشفت عدد من الشركات العالمية  عن ارتفاع ملحوظ في عدد المستخدمين النشطين، مما يعكس نجاح استراتيجياتها في تقديم تجارب تفاعلية متطورة.

تحسين التجربة الرقمية

ويلعب الذكاء الاصطناعي دورًا محوريًا في إعادة تشكيل المشهد الرقمي، حيث تُستخدم هذه التكنولوجيا لتطوير ميزات مبتكرة تعزز من تفاعل المستخدمين..فمن خلال تحليل البيانات وفهم احتياجات العملاء، تتمكن الشركة من تقديم محتوى مخصص وتجارب فريدة، مما يزيد من ولاء المستخدمين ويحفزهم على استخدام المنصة بشكل متكرر.

من جانبه صرح يانغ تاو، الرئيس التنفيذي لمجموعة يلا العالمية  فى تصريحات صحفية اليوم أنه  يتم الاستثمار في الذكاء الاصطناعي لتعزيز الكفاءة التشغيلية وتحسين الربحية. هذا التوجه يعكس الالتزام بخلق تجارب رقمية غامرة تعيد تعريف كيفية تفاعل المستخدمين مع خدماتها.

مواكبة التحولات الرقمية

وقال: مع التحولات الرقمية السريعة في منطقة الشرق الأوسط وشمال إفريقيا، ندرك   أهمية التكيف مع هذه التغييرات. فمن خلال تسخير الذكاء الاصطناعي، تسعى إلى استغلال الفرص الجديدة التي تتيحها هذه البيئة الديناميكية، مما يساهم في تعزيز مكانتها كمنصة رائدة في السوق

مقالات مشابهة

  • كيف يعزز الذكاء الاصطناعي من تحسين تجربة المستخدم ؟
  • أول رد من سيلين ديون بعد وقوعها ضحية الذكاء الاصطناعي
  • المعركة القادمة من أجل الذكاء الاصطناعي
  • موقف الشريعة من التطورات الحديثة في الذكاء الاصطناعي
  • Google تسبق Apple.. ميزة Connected Cameras تمنح هواتف Pixel 9 تفوقًا في تصوير الفيديو
  • «الذكاء الاصطناعي» يرسم تصوراً لـ«شكل العالم» بعد 30عاماً
  • "التعليم العالي": فتح باب التقديم لمشروع إنشاء مركز سلامة وأمان الذكاء الاصطناعي
  • فتح باب التقديم لمشروع إنشاء مركز سلامة وأمان الذكاء الاصطناعي في التعليم العالي
  • هل تقضي روبوتات الذكاء الاصطناعي على الصدق في تطبيقات المواعدة؟
  • آبل تؤجل تحديثات الذكاء الاصطناعي لـ Siri إلى عام 2026