أداة الذكاء الاصطناعي من مايكروسوفت تحول الصور إلى مقاطع فيديو واقعية
تاريخ النشر: 20th, April 2024 GMT
كشفت شركة Microsoft Research Asia عن أداة تجريبية جديدة للذكاء الاصطناعي تسمى VASA-1 يمكنها التقاط صورة ثابتة لشخص ما - أو رسم لشخص ما - وملف صوتي موجود لإنشاء وجه ناطق نابض بالحياة في الوقت الفعلي.
لديه القدرة على توليد تعبيرات الوجه وحركات الرأس لصورة ثابتة موجودة وحركات الشفاه المناسبة لتتناسب مع خطاب أو أغنية.
في حين أن حركات الشفاه والرأس في الأمثلة لا تزال تبدو آلية إلى حد ما وغير متزامنة عند الفحص الدقيق، إلا أنه لا يزال من الواضح أنه يمكن إساءة استخدام التكنولوجيا لإنشاء مقاطع فيديو مزيفة بسهولة وسرعة لأشخاص حقيقيين.
يدرك الباحثون أنفسهم هذه الإمكانية وقرروا عدم إصدار "عرض توضيحي عبر الإنترنت، أو واجهة برمجة تطبيقات، أو منتج، أو تفاصيل تنفيذ إضافية، أو أي عروض ذات صلة" حتى يتأكدوا من أن التكنولوجيا الخاصة بهم "سيتم استخدامها بشكل مسؤول وبما يتوافق مع المعايير المناسبة". أنظمة." ومع ذلك، لم يذكروا ما إذا كانوا يخططون لتنفيذ ضمانات معينة لمنع الجهات الفاعلة السيئة من استخدامها لأغراض شائنة، مثل إنشاء حملات إباحية مزيفة أو حملات معلومات مضللة.
ويعتقد الباحثون أن تقنيتهم تتمتع بالكثير من الفوائد على الرغم من احتمالية إساءة استخدامها.
قالوا إنه يمكن استخدامه لتعزيز المساواة التعليمية، وكذلك لتحسين إمكانية الوصول لأولئك الذين يعانون من تحديات التواصل، ربما من خلال منحهم إمكانية الوصول إلى الصورة الرمزية التي يمكنها التواصل معهم. وقالوا إنه يمكنه أيضًا توفير الرفقة والدعم العلاجي لأولئك الذين يحتاجون إليه، ملمحين إلى أنه يمكن استخدام VASA-1 في البرامج التي توفر الوصول إلى شخصيات الذكاء الاصطناعي التي يمكن للأشخاص التحدث إليها.
وفقًا للورقة البحثية المنشورة مع الإعلان، تم تدريب VASA-1 على مجموعة بيانات VoxCeleb2، التي تحتوي على "أكثر من مليون عبارة لـ 6,112 من المشاهير" والتي تم استخلاصها من مقاطع فيديو يوتيوب. على الرغم من أن الأداة تم تدريبها على الوجوه الحقيقية، إلا أنها تعمل أيضًا على الصور الفنية مثل الموناليزا، والتي قام الباحثون بدمجها بشكل مسلي مع ملف صوتي من أداء آن هاثاواي الشهير لمصوري ليل واين.
إنه أمر مبهج للغاية، ويستحق المشاهدة، حتى لو كنت تشك في مدى فائدة تقنية كهذه.
المصدر: بوابة الوفد
إقرأ أيضاً:
أشرف زكي: هناك بعض الصور التي لا نرضى عنها جميعا في تغطية الجنازات
أكد الدكتور أشرف زكي نقيب المهن التمثيلية أن التقدير والاحترام بين النقابتين موصول وسيستمر إلى الأبد، فلا غنى لكل من الصحفيين والفنانين عن الآخر.
وأضاف "هناك بعض الصور التي لا نرضى عنها جميعا في تغطية الجنازات، ونقسمها إلى ثلاثة أقسام؛ الجنازة، والمقابر والعزاء"؛ قائلا "العزاء مكان خاص وقد يوافق أهل المتوفي على التغطية له أو لا، وإذا وافق أهل المتوفي على التغطية في العزاءات، فأرجو وبشدة عدم الدخول وتصوير المعزين".
وأشار إلى أنه بالنسبة للمقابر؛ تم الاتفاق على أنه ليس من المسموح تصوير ما يجري فيها، لافتا إلى أن المشكلة الكبرى في الجنازات التي تجري في أماكن صعب السيطرة عليها مثل مسجد السيدة نفيسة وغيره، وإذا تعاوننا معا سنستطيع تجاوز هذه الأزمة التي يتسبب فيها طرف ثالث يقتحم الجنازات تحت مسميات مختلفة هي "المدونين والمواقع"، لكننا بوصفنا ارباب نقابات عريقة لدينا قواعد وأخلاقيات ثابتة للمهنة.
وقال زكي "أعتذر إن كان قد حدث من الأسرة الفنية اي تجاوز او اي خطأ وتظل المحبة والتقدير عنوانا للعلاقة بيننا وبين بعضنا البعض."
عقد المؤتمر بحضور جمال عبدالرحيم سكرتير عام نقابة الصحفيين، ومجدي إبراهيم رئيس شعبة المصورين الصحفيين بنقابة الصحفيين.
وقعت نقابة الصحفيين اتفاقية تعاون مع شركة سكنة "SOKNA" المتخصصة في تقديم خدمات تنظيم مراسم الجنازات مساء اليوم الثلاثاء؛ حيث أعلنت النقابة في مؤتمر صحفي عن الإجراءات التنفيذية والتنظيمية الخاصة بتطبيق قواعد جديدة لتنظيم تغطية مراسم الجنازات والعزاءات، خاصة تغطيات جنازات الفنانين والمشاهير، وذلك بالشراكة مع نقابة المهن التمثيلية، بما يضمن حق الصحفيين والمصورين الصحفيين في أداء عملهم، وكذلك احترام خصوصية اللحظات الإنسانية والقواعد المهنية والأخلاقية للعمل الصحفي.