تقنية جديدة من «مايكروسوفت» بالذكاء الاصطناعي.. «هتخلي الصور تتحرك زي البشر»
تاريخ النشر: 22nd, April 2024 GMT
ما زال التطور المعتمد على الذكاء الاصطناعي مستمر، وهو ما يبهرنا بنتائجه غير المتوقعة، ولعل أحدث ما تم ابتكاره اعتمادا على الذكاء الاصطناعي هو أداة جديدة طرحتها شركة مايكروسوفت العالمية لتحريك الصور الثابتة.
إضفاء الواقعية على الصور الثابتةوتقوم فكرة التقنية الجديدة والتي أطلقت عليها الشركة اسم VASA-1 على تحويل صورة الوجه الثابتة إلى صورة متحركة تتحدث أو تغني ما يضفي الواقعية إلى حد كبير على الصور الثابتة.
وزعمت مايكروسوفت أن حركات الشفاه بهذه التقنية المعتمدة على الذكاء الاصطناعي تكون متزامنة بشكل كبير مع صوت الموسيقى أو الكلام ما يجعله يبدو واقعيا.
تلتقط الأداة الجديدة صورة لوجه الشخص سواء كان حقيقيا أو رسما خياليا لشخصية غير حقيقية، ثم تضيف صوت إلى الصورة وتتطابقه معها لإضفاء الحيوية والواقعية على الوجه ثم يتحرك الوجه بما يتناسب ويتزامن مع هذا الصوت حسبما ذكرت صحيفة «ديلي ميل» البريطانية.
التفاعلات مع البشر الحقيقيينوكشفت مايكروسوفت أنه تم دعم الأداة وتدريبها بمكتبة كبيرة من تعبيرات الوجه المختلفة ما يمكنها من الاستجابة للصوت وتحريك الوجه وإصدار تعبيرات تتناسب معه بشكل كبير يجعله أقرب للواقعية.
يعتقد الفريق الخاص بشركة مايكروسوفت أن VASA-1 يمكنها أن تمكّن الصور الرمزية الرقمية للذكاء الاصطناعي من التفاعل بطرق طبيعية وبديهية مثل التفاعلات مع البشر الحقيقيين.
المصدر: الوطن
كلمات دلالية: الذكاء الاصطناعي شركة مايكروسوفت تقنيات الذكاء الاصطناعي الموسيقى مايكروسوفت
إقرأ أيضاً:
«ChatGPT» يغير قواعد إنشاء الصور باستخدام الذكاء الاصطناعي
في خطوة جديدة تعزز الإبداع البصري المدعوم بالذكاء الاصطناعي، أعلنت OpenAI عن تحسينات كبيرة في قدرة ChatGPT على إنشاء الصور، مما يجعل تجربة المستخدم أكثر دقة وسلاسة.
التحديث الجديد يمنح الأداة قدرة أكبر على فهم الأوصاف النصية وتحويلها إلى صور أكثر واقعية وتفصيلاً، مما يفتح الباب أمام استخدامات واسعة في التصميم، التسويق، والإبداع الفني.
قدرات محسّنة لتوليد صور أكثر دقة
بفضل التطورات الجديدة، أصبح ChatGPT قادرًا على إنشاء صور بجودة أفضل، مع تحسينات في التفاصيل والألوان والتركيبات البصرية. كما أصبح النظام أكثر استجابة للأوصاف المعقدة، مما يساعد المستخدمين على الحصول على نتائج أقرب لما يتخيلونه.
دقة أعلى وتفاعل أفضل
واحدة من الميزات البارزة في التحديث هي التحسينات في فهم السياق، حيث يمكن لـ ChatGPT الآن تقديم صور تعكس بشكل أكثر دقة ما يريده المستخدم، سواء كانت شخصيات خيالية، مشاهد طبيعية، أو تصميمات مفاهيمية. كما أصبح النظام أكثر قدرة على تجنب الأخطاء الشائعة التي كانت تحدث في الأجيال السابقة.
استخدامات متعددة وواعدة
مع هذه التحديثات، يمكن للمستخدمين الاستفادة من قدرات ChatGPT في العديد من المجالات، مثل:
التصميم الجرافيكي: حيث يمكن للمصممين إنشاء تصورات أولية بسرعة.
الإعلانات والتسويق: إذ يمكن إنشاء صور تسويقية جذابة.
الفن الرقمي: تسهيل إنشاء الأعمال الفنية من خلال وصف بسيط.
ومع استمرار تحسين قدرات الذكاء الاصطناعي في هذا المجال، من المتوقع أن يصبح ChatGPT أداة لا غنى عنها في عالم الإبداع البصري والتصميم.