الموناليزا تغني الراب! .. "مايكروسوفت" تطور نموذج ذكاء اصطناعي "واقعي بشكل مخيف"
تاريخ النشر: 23rd, April 2024 GMT
طورت شركة "مايكروسوفت" نموذج ذكاء اصطناعي، يحول صور وجه الشخص ومقاطع الصوت إلى فيديو مع مزامنة الشفاه وتعبيرات الوجه وحركات الرأس بشكل مناسب.
وتم تطوير نموذج الذكاء الاصطناعي الجديد بواسطة فريق من العلماء في مجال الذكاء الاصطناعي في Microsoft Research Asia، ويسمى VASA-1.
7. Potencia de desentrañamiento 1
Ejemplo de la misma secuencia de movimiento con diferentes fotos pic.
وقال الفريق في ورقة بحثية: "لقد قدمنا VASA، وهو إطار عمل لتوليد وجوه ناطقة نابضة بالحياة مع مهارات عاطفية بصرية جذابة (VAS) من خلال صورة ثابتة واحدة ومقطع صوتي للكلام. إن نموذجنا الأول، VASA-1، قادر ليس فقط على إنتاج حركات الشفاه المتزامنة بشكل رائع مع الصوت، ولكن أيضا التقاط مجموعة كبيرة من الفروق الدقيقة في الوجه وحركات الرأس الطبيعية التي تساهم في إدراك الأصالة والحيوية".
Microsoft acaba de lanzar VASA-1.
Esta IA puede hacer que una sola imagen cante y hable a partir de una referencia de audio de forma expresiva. Similar a EMO de Alibaba
10 ejemplos salvajes ↓
1. Mona Lisa rapeando a Paparazzi pic.twitter.com/74mZH9fTQO
ويدعي الفريق أن طريقتهم لا توفر جودة فيديو عالية مع ديناميكيات واقعية للوجه والرأس فحسب، بل تدعم أيضا إنشاء مقاطع فيديو بحجم 512 × 512 عبر الإنترنت بسرعة تصل إلى 40 إطارا في الثانية مع زمن انتقال لا يكاد يذكر.
إقرأ المزيد Meta تختبر الذكاء الاصطناعي في "إنستغرام"وهذا يمهد الطريق للتفاعلات في الوقت الفعلي مع الصور الرمزية النابضة بالحياة التي تحاكي سلوكيات المحادثة البشرية، وفقا لما ذكره العلماء.
ويشار إلى أن VASA هو اختصار لـ Visual Affective Skills Animator (بمعنى الرسوم المتحركة للمهارات البصرية العاطفية)، وهو نموذج قادر على تحويل أي صور ثابتة سواء تم التقاطها بواسطة الكاميرا، أو رسمها، إلى رسوم متحركة "متزامنة بشكل رائع".
ويمكن لـ VASA إنشاء فيديو حقيقي "مخيف"، حيث تحاكي "الوجوه الناطقة الواقعية" سلوكيات المحادثة البشرية من خلال إيماءات الوجه وحركة العين والرأس الطبيعية، وكل ذلك من صورة ثابتة واحدة للرأس.
واستخدم الفريق مجموعة بيانات VoxCeleb2 المتاحة للجمهور والتي تحتوي على مقاطع فيديو لأكثر من 6000 من المشاهير الواقعيين.
وبعد التخلص من المقاطع التي تتضمن عدة أفراد وذات جودة منخفضة، قام الفريق بتدريب نموذجهم على مجموعة البيانات المعالجة.
ومن اللافت للنظر أن نموذجهم يمكنه التعامل مع المدخلات خارج مجموعة التدريب، مثل الصور الفنية والكلام بغير الإنجليزية.
إقرأ المزيد الذكاء الاصطناعي يصل إلى تطبيقات "واتس آب"غناء الموناليزا
وباستخدام مقطع صوتي لأغنية Paparazzi بصوت آن هاثاواي، أجرى العلماء تجارب على الموناليزا.
وادعى الفريق أن نظام الذكاء الاصطناعي يمكن أن يعمل في الوقت الفعلي، حيث أظهروا مقطعا يوضح الأداة وهي تقوم على الفور بتحريك الصور باستخدام تعبيرات الوجه وحركات الرأس. كما يوفر النموذج التحكم في النظرة والمسافة والعواطف في الفيديو الذي تم إنشاؤه.
مخاوف انتحال الشخصية
في حين أن قدرات النموذج تثير مخاوف انتحال الشخصية، فإن العلماء يصرون على أن هدفهم من الأداة ليس تعزيز التزييف العميق.
وكتبوا في منشور: "نحن نستكشف توليد المهارات العاطفية البصرية للشخصيات الافتراضية والتفاعلية، وليس انتحال شخصية أي شخص في العالم الحقيقي".
ويؤكد فريق البحث أن النموذج سيتم استخدامه للتعليم وتوفير الرفقة. وقد رفضوا أيضا إصدار الكود الذي يدعم النموذج.
وأكد الفريق اهتمامه بتطبيق التقنية الجديدة لتعزيز اكتشاف التزوير. وأكدوا: "ليس لدينا أي خطط لإصدار عرض توضيحي عبر الإنترنت أو واجهة برمجة تطبيقات أو منتج أو تفاصيل تنفيذ إضافية أو أي عروض ذات صلة حتى نتأكد من استخدام التكنولوجيا بشكل مسؤول ووفقا للوائح المناسبة".
المصدر: Interesting Engineering
المصدر: RT Arabic
كلمات دلالية: جديد التقنية ذكاء اصطناعي مايكروسوفت MicroSoft معلومات علمية الذکاء الاصطناعی
إقرأ أيضاً:
موظفو البنوك.. أين أنتم من الذكاء الاصطناعي؟
مؤيد الزعبي
رغم أنَّ قطاع البنوك واحدٌ من أكثر القطاعات حساسية في استخدام تقنيات الذكاء الاصطناعي لما يترتب على ذلك من مخاطر عديدة، إلّا أنه في الوقت نفسه، يُعد قطاع البنوك واحدًا من أكثر القطاعات استثمارًا في التكنولوجيا واستخداماتها لتطوير بيئة العمل داخل القطاع نفسه أو حتى فيما يتعلق بتحسين تجربة المستخدمين وتعاملاتهم وخدمتهم بشكل أفضل وأسرع.
ووفقًا لدراسة أجرتها شركة "ماكينزي" بعنوان "لماذا تفشل أغلب عمليات التحول إلى الخدمات المصرفية الرقمية، وكيفية قلب الاحتمالات"، فإنَّ إنتاجية البنوك الكبيرة كانت أقل بنسبة 40% من البنوك الرقمية. وهنا نتحدث عن البنوك الرقمية، ولك أن تتخيل عزيزي القارئ كيف يكون الحال مع البنوك الذكية أو بنوك الذكاء الاصطناعي. وفي المقابل كيف سيؤثر هذا الأمر على موظفي قطاع البنوك؛ سواء من حيث طريقة عملهم أو حتى فرصهم المستقبلية والمخاطر التي تهدد وظائفهم، هذا هو ما سوف أتناوله معك ها هنا من خلال هذا الطرح.
تُشير الدراسات إلى أنه منذ عام 2013 وحتى عام 2022، زادت البنوك إنفاقها على التكنولوجيا بنسبة 38% لدعم الاحتياجات الرقمية المتطورة للعملاء، وفي بيئة حياة دخلها الذكاء الاصطناعي بشكل لافت خلال السنوات القليلة الماضية فكان لا بُد للبنوك من إدخال هذه التقنيات في صلب عملياتها التشغيلية وأيضًا إدراجها في عمليات تحسين تجربة العملاء. وقد حدث بالفعل في أن شهدنا تطورًا كبيرًا في التطبيقات الرقمية الخاصة بالبنوك، من خلال تحسينات ملحوظة في واجهة المستخدم، وأيضًا من خلال الخدمات التي يمكن للعمل الوصول إليها من خلال هذه التطبيقات مباشرة دون تدخل موظفي البنوك إلا في بعض الحالات.
الذكاء الاصطناعي قادم لا محال في قطاع البنوك، أولًا: لأن البنوك تستهدف الربحية في المقام الأول؛ إذ يُشير تقرير منشور في موقع "Financial News London" إلى أن تبنِّي الذكاء الاصطناعي يُمكن أن يضيف 170 مليار دولار إلى أرباح البنوك في السنوات الخمس المقبلة، مع توقعات بزيادة الأرباح إلى ما يقرب من 1.992 مليار دولار بحلول عام 2028، وعين البنوك جميعها على هذه الأرباح. وثانيًا: لأن البنوك لن تدخر أي فرصة من شأنها تحسين وتسريع تجربة العملاء. وثالثًا: لأن المخاطر التي سيخلقها دخول الذكاء الاصطناعي لحياتنا تحتاج لذكاء اصطناعي قادر على مواجهتها. ونتحدث هنا عن الأمن الإلكتروني والاحتيال وما شابه ذلك من مخاطر رقمية. ففي الوقت الذي تعمل فيه أنظمة الذكاء الاصطناعي من محاكاة الأصوات وتقليدها وما سيُسببه ذلك من إرباك لمقدمي الخدمات المصرفية عبر الهاتف، إلّا أنه في الوقت نفسه، سيُقدِّم الذكاء الاصطناعي حلًا لمثل هذه المشاكل، كما إن أنظمة الذكاء الاصطناعي ستُقلِّل من عمليات جرائم غسيل الأموال أو انتحال الهوية أو التحويلات المزيفة أو السرقة الإلكترونية.
ربما لاحظنا جميعًا السرعة الكبيرة التي حدثت في عمليات التحويلات المالية والتي باتت مؤتمتة بالكامل من خلال أنظمة تكنولوجية لا يمكننا القول إنها تعمل بالذكاء الاصطناعي؛ لأن هذه العمليات يمكن إدراجها ضمن الأتمتة الإلكترونية المتطورة، وليس لها علاقة بالذكاء الاصطناعي. لكن سنجد أن الذكاء الاصطناعي سيقوم بتسريع بعض العمليات المُعقَّدة في هذا الجانب، مثل التحويلات المالية بين الشركات أو حتى التحويلات الدولية، والتي كانت تحتاج لبعض الأيام لمعالجتها والتأكد منها إلى حين إتمامها. والذكاء الاصطناعي سيؤدي دورًا كبيرًا في تسريع هذه العملية لما له من قدرات فائقة في تحليل البيانات والتأكد من صحتها.
وتُعد خدمة العملاء أو الرد على استفسارات أو تنفيذ متطلباتهم المالية من أكثر المهام التي سيدخلها الذكاء الاصطناعي، وسيسطر عليها في السنوات المقبلة. فعلى سبيل المثال: رُوبوت الدردشة "Watsonx Assistant" الذي طورته شركة "IBM، وهو عبارة عن روبوت محادثة يقدم المساعدة للخدمات المصرفية مدعوم بالذكاء الاصطناعي، سنجده يلبي احتياجات المؤسسات المالية بشكل فعّال في الرد على استفسارات العملاء، وتسجيل شكاويهم وتنفيذ طلباتهم وتقديم المساعدة في الوصول لبياناتهم المصرفية. وكل هذا دون تدخل بشري، إلّا أن الشركة المُطوِّرة تقول إن نظامها يُشبه البشر في طريقة الرد والتحدث، ونحن ما زلنا في بداية الأمر؛ إذ ستشهد هذه الخدمات تطورًا كبيرًا قد يتسبب في إلغاء أي وظيفة متعلقة بخدمة العملاء في قطاع البنوك في السنواتر المقبلة.
وأحد أكبر فوائد استخدام الذكاء الاصطناعي في القطاع المالي، هو تحسين عملية اتخاذ القرار المتعلقة بتقييم الائتمان والإقراض والاستثمار، والذكاء الاصطناعي وقدراته في الاستفادة من الكم الهائل من البيانات التي تولدها المؤسسات المالية سيُعزز عمليات اتخاذ القرار؛ سواءً بالنسبة للموظفين العاملين في البنوك من عمليات الموافقة على القروض والائتمان، أو حتى تحسين اتخاذ القرار بالنسبة للخدمات المؤتمتة والرقمية؛ حيث سيُوفِّر الذكاء الاصطناعي القدرة على تقييم المخاطر الائتمانية وبنفس الوقت سيكون قادرًا بنفسه على اتخاذ القرار للموافقة أو الرفض لأي عملية ائتمانية دون الرجوع للبشر.
أيضًا الذكاء الاصطناعي قادرٌ على فتح وإغلاق الحسابات، وقد لاحظنا إدراج العديد من البنوك لمثل هذه الخدمات ضمن خدماتها المصرفية الرقمية. كما يُمكن للذكاء الاصطناعي أن يتنبأ ما إذا كان العملاء الأفراد أو الشركات على وشك إلغاء حساباتهم بناء على سجلاتهم البنكية، مثل عدد مرات تسجيل الدخول أو إيداع الأموال، وبالتالي يُمكن للبنوك تفادي هذا الأمر من خلال تقديم بعض العروض للعملاء، أو حتى تقديم بعض التحسينات في تجربتهم الشخصية. ومن هنا تأتي أهمية الذكاء الاصطناعي في أن يقدم للعملاء تجربة شخصية بناءً على متطلباته ومتغيراته الشخصية، ولهذا سنجد في قادم الوقت خدمات أكثر شخصية تقدمها البنوك لعملائها، مثل بطاقة ائتمانية تناسب العميل نفسه وحده، أو نوع حساب مناسب له بشكل أكبر، أو تسهيلات في عمليات الدفع تناسب ظروفه المالية أو حتى تناسب طبيعة عمله.
الخلاصة.. أن قطاع البنوك سيشهد طفرة كبيرة في عملية التحوُّل التشغيلي والخدمي مع دخول الذكاء الاصطناعي، وسنجد وظائفَ تنتهي مثل وظائف خدمة العملاء، ووظائف متعلقة بالتحليل الائتماني ومكافحة الاحتيال، أو حتى بعض وظائف المبيعات والتسويق، إلّا أن الذكاء الاصطناعي سيخلق وظائف جديدة في قطاع البنوك، مثل مُبرمِج ذكاء اصطناعي أو مُتخصص أمن سيبراني أو مدير أنظمة الذكاء الاصطناعي. وعلى جانب آخر، ستُوفِّر البنوك خدمات "أكثر ملاءمة شخصية" لعملائها، تتناسب معهم ومع طبيعة أعمالهم الشخصية أو التجارية، ولكن ينبغي الانتباه إلى أنَّ الخطأ في برمجة الذكاء الاصطناعي قد يُسبب كارثة في المستقبل، ولهذا ما نُبرمِجه اليوم وما نُدخله في بيئة أعمالنا هو ما سيُحدد شكل تواجدنا المستقبلي كمؤسسات بنكية، وما نتعلمه اليوم ونُطوِّرُه من مهارات، سيُحدد ما إذا كُنا سنخسر وظائفنا أم سنُطوِّرُها كأفراد وعاملين في قطاع البنوك.
رابط مختصر