بدأ إدخال تقنيات المعالجة الرقمية ضمن الأفلام الروائية الطويلة، عام 1973 مع فيلم وست وورلد (Westworld)، الذي يعتبر أول فيلم روائي طويل استخدم الصور المولدة بالحاسوب (Computer-generated imagery) واختصارا "سي جي آي" (CGI). عالج الفيلم بعض الصور الفوتوغرافية المتحركة رقميا بحيث تظهر منقطة، من أجل محاكاة ما تراه الروبوتات التي تظهر في الفيلم.

طبعا كانت المعالجة بسيطة وبدائية.

تمثل ثلاثية سيد الخواتم (The Lord of the Rings) التي بدأ عرضها عام 2001، نقطة انعطاف في تاريخ السينما من حيث استخدام تقنيات حاسوبية متقدمة، أبرزها إصدارة متطورة من تقنية الصور المولدة بالحاسوب "سي جي آي" (CGI) لإنشاء العديد من المشاهد والشخصيات التي لا تنسى في هذه الثلاثية.

واستخدمت الثلاثية أيضا برنامج ماسيف (MASSIVE) الذي تم تطويره خصيصا لها، لتوليد مشاهد المعارك الضخمة التي تضم آلاف الشخصيات الفردية، والتي تسمح لكل شخصية رقمية في هذه الجيوش بأن تفكر وتتفاعل وتقاتل بشكل مستقل.

وكان تطوير شخصية غولوم (Gollum) في الفيلم نقطة بارزة في تاريخ المؤثرات البصرية واستخدام تقنية التقاط الحركة (Motion Capture) في الأفلام. شملت العملية مزيجا من التمثيل الحي، وتقنيات متقدمة في التقاط الحركة، ومهارات عالية في الرسوميات الحاسوبية، حيث ارتدى الممثل العراقي الأصل آندي سركيس بزة مجهزة بمجسات استشعار تسجل حركات جسمه وتعابير وجهه وتنقلها إلى الشخصية الرقمية غولوم.

تحويل النصوص إلى صور (Text to Image)

جاءت القفزة الحقيقية نحو "تحويل النص إلى صورة" باستخدام الذكاء الاصطناعي والتعلم الآلي عام 2016، حينما قام سكوت ريد وفريقه بتطوير نموذج يمكنه توليد صور معقولة من أوصاف نصية مفصلة.

استخدم هذا النموذج مزيجا من الشبكات العصبية الالتفافية (CNNs) التي تحلل الصور إلى بكسلات تعطى كل منها قيمة تصنيفية، والشبكات العصبية المتكررة (RNNs)، جنبا إلى جنب مع تقنية التعزيز المشروط (Conditioning Augmentation) لتحسين جودة وتنوع الصور التي تم إنشاؤها.

أظهر عمل هذا الفريق إمكانية توليد صور متماسكة ومتنوعة للطيور والزهور من الأوصاف النصية، وهو ما كان جهدا رائدا في تحويل النص إلى الصورة.

مهدت أعمال هذه الفريق الطريق أمام تطوير أنظمة أكثر تقدماً مثل "دال إي" (DALL-E) من "أوبن إيه آي" (OpenAI) في عام 2021، من خلال إنشاء صور إبداعية ودقيقة للغاية من أوصاف نصية معقدة.

الفيديو التوليدي نقطة انعطاف جديدة في تاريخ السينما

في منتصف فبراير/شباط 2024، دعت شركة أوبن إيه آي مجموعة من صانعي الأفلام وخبراء التكنولوجيا لتجربة نموذج الفيديو التوليدي الجديد الذي طورته عبر تقنية تحويل النص إلى فيديو (Text-to-Video)، وأطلقت عليه اسم "سورا" (Sora)، وذلك بهدف تجربته والتعرف على إمكانياته ومزاياه وعيوبه.

أدهش سورا الحاضرين ووصفه المدير التنفيذي للتكنولوجيا في مايكروسوفت، مارك روسينوفيتش، بأنه "مذهل ومخيف في الوقت نفسه"، وأضاف "أعتقد أنه يمثل نهاية الواقع كما نعرفه".

ومنذ ذلك الحين وحتى اليوم" أتاحت الشركة للجمهور مشاهدة العديد من مقاطع الفيديو التي أنشأها سورا، منها مقطع دعائي لفيلم يعرض مغامرات رجل فضاء بالغ من العمر (30 عاما)، وموقع بناء مملوء بالعمال والمعدات والآلات الثقيلة، وكنغر يرقص الديسكو، ومدينة طوكيو وهي مكسوة بالثلج وتعج بالحركة، وجراء تلعب في الثلج، وغيرها.

يمكنكم الاطلاع عليها عبر حساب سام ألتمان على موقع إكس (تويتر سابقا)، أو على موقع يوتيوب.

ظهرت الدفعة الأولى من النماذج التي يمكنها تحويل النص إلى فيديو في أواخر عام 2022، من شركات ميتا وغوغل ورنواي (Runway) وغيرها، لكن نتائجها كانت مشوشة، ومشوهة، ولم يستغرق الفيديو الواحد منها سوى بضع ثوان.

توليد الفيديو من النص أو تحويل النص إلى فيديو عملية معقدة تتطلب دمج تقنيات الذكاء الاصطناعي التوليدي، والتعلم الآلي، ومعالجة الوسائط المتعددة. ويعتقد الخبراء أن سورا هو الأفضل حتى الآن، نظرا لوضوحه العالي وواقعيته المذهلة لدرجة توقع معها بعض المراقبين المتحمسين وفاة هوليود كما نعرفها.

يمكن أن تصل مدة مقاطع الفيديو التي يولدها سورا حاليا إلى دقيقة واحدة، وتتكون من مشاهد معقدة وشخصيات متعددة وأنواع مختلفة من الحركة مع تفاصيل دقيقة.

أزمات قانونية وأخلاقية حالية ومستقبلية

تواجه كل من أوبن إيه آي وغوغل والشركات الأخرى التي تطور نماذج الذكاء الاصطناعي التوليدي مشكلات قانونية تتعلق باستخدام بيانات المواقع الإخبارية، ومواقع الفيديو، ووسائل التواصل الاجتماعي، والمنتديات، وقواعد بيانات الكتب، لتدريب برمجيات الذكاء الاصطناعي التوليدي على إنتاج النصوص والصور والفيديوهات، دون الحصول على إذن مسبق، مما يمثل انتهاكا للخصوصية وحقوق النشر.

وكان رد هذه الشركات على هذه الاتهامات بأن البيانات التي تستخدمها للتدريب متاحة للجمهور، لكن هذا لم يقنع صحيفة نيويورك تايمز التي رفعت دعوى قضائية ضد شركة أوبن إيه آي، زاعمة أنها استخدمت أعمالها لتدريب برمجياتها، وانتهكت بذلك حقوقها في النشر والطباعة.

وتوجد مشكلة أخرى تواجه هذه الشركات هي التزييف العميق الذي نما بسرعة مع تطور الذكاء الاصطناعي التوليدي، إذ تزداد المخاوف من احتمال إضافة مقاطع فيديو مزيفة في مجالات عديدة تؤثر على الانتخابات والأسواق المالية، بل الحياة الشخصية.

مستقبل صناعة الترفيه

عقد سام ألتمان في شهر مارس/آذار الماضي سلسلة من الاجتماعات مع المدراء التنفيذيين في هوليود حاول إقناعهم فيها بأن سورا لن يدمر صناعة السينما، خاصة مع تزايد المخاوف بشأن فقدان الوظائف لصالح الذكاء الاصطناعي، والذي كان أحد أسباب إضرابات الممثلين والكتاب العام الماضي، وأدى حينها إلى تعطل الإنتاج التلفزيوني لبعض الوقت.

ويبدو أن بعض الأستوديوهات تقبلت فكرة أن استخدام هذه الأداة بعناية في الإنتاج، يمكنها أن توفر الوقت.

لكن الممثل والمخرج الأميركي تايلر بيري قال إنه يخشى تأثير الذكاء الاصطناعي على الصناعات الإبداعية، وإنه أوقف التوسع الذي سبق وخطط له في أحد أستوديوهات الإنتاج الخاصة به بسبب سورا.

تتفوق سورا حاليا على البرامج المنافسة في مجال إنشاء الفيديو عبر النص. لكن العديد من الشركات الأخرى تعمل حاليا على تحسين تقنياتها المشابهة، حيث يتوقع أن تطرح برامج منافسة لسورا خلال الأشهر المقبلة.

المصدر: الجزيرة

كلمات دلالية: ترجمات حريات الذکاء الاصطناعی التولیدی أوبن إیه آی

إقرأ أيضاً:

الذكاء الاصطناعي يحوّل الأفكار إلى كلام في الوقت الحقيقي

طور علماء جهازا يمكنه ترجمة الأفكار المتعلقة بالكلام إلى كلمات منطوقة في الوقت الحقيقي بالاستعانة بزراعة دماغية تستخدم الذكاء الاصطناعي.
ورغم كون هذا الإنجاز لا يزال في مراحل تجريبية، فإنه عزز الآمال في أن تُمكّن هذه الأجهزة الأشخاص الذين فقدوا القدرة على التواصل من استعادة أصواتهم.

وسبق لعلماء في كاليفورنيا أن استخدموا واجهة دماغ حاسوبية لفك تشفير أفكار "آن"، البالغة 47 عامًا والمصابة بشلل رباعي، وترجمتها إلى كلام. ومع ذلك، كان هناك تأخير زمني قدره ثماني ثوانٍ بين أفكارها وقراءة الكمبيوتر للكلام بصوتٍ عالٍ. وهذا يعني أن إجراء محادثة سلسة لا يزال بعيدًا عن متناول "آن"، مُعلمة الرياضيات السابقة في المدرسة الثانوية التي لم تعد قادرة على الكلام منذ إصابتها بسكتة دماغية قبل 18 عامًا.
لكن النموذج الجديد، الذي طوره الفريق، والذي نُشر في مجلة Nature Neuroscience، حوّل أفكار "آن" إلى نسخة من صوتها القديم بزيادات قدرها 80 ميلي ثانية.

وقال غوبالا أنومانشيبالي، كبير الباحثين في الدراسة من جامعة كاليفورنيا، بيركلي "نهجنا الجديد في البث يُحوّل إشارات دماغها إلى صوتها آنيًا، في غضون ثانية واحدة من نيتها الكلام".
وأضاف أن هدف "آن" هو أن تصبح مستشارة جامعية. وأكد "في حين أننا ما زلنا بعيدين عن تمكين آن من ذلك، فإن هذا الإنجاز يُقرّبنا من تحسين جودة حياة الأفراد المصابين بالشلل الصوتي بشكل جذري".
في إطار البحث، عُرضت على "آن" جمل على شاشة، وكانت ترددها في ذهنها. ثم تُحوَّل أفكارها إلى صوتها، الذي شكّله الباحثون من تسجيلات صوتية لها قبل إصابتها.
اقرأ أيضا... الذكاء الاصطناعي يتفوق في رصد تشوهات الجنين

أخبار ذات صلة أبل تطلق ثورة صحية.. "طبيب بالذكاء الاصطناعي" الذكاء الاصطناعي يتقن الخداع!

وقال أنومانشيبالي "كانت آن متحمسة جدًا لسماع صوتها".
بدوره، أوضح تشيول جون تشو، المؤلف المشارك في الدراسة، في بيان، أن واجهة الدماغ والحاسوب تعترض إشارات الدماغ "بعد أن نقرر ما نقوله، وبعد أن نقرر الكلمات التي نستخدمها، وكيفية تحريك عضلات المسالك الصوتية".
يستخدم النموذج أسلوب ذكاء اصطناعي يُسمى التعلم العميق، تم تدريبه على "آن" التي كانت تحاول سابقًا التحدث بصمت بآلاف الجمل.

ولا تزال مفردات الدراسة محدودة، إذ لا تتجاوز 1024 كلمة.
وصرح باتريك ديجينار، أستاذ الأطراف الاصطناعية العصبية في جامعة نيوكاسل البريطانية، والذي لم يشارك في الدراسة، أن هذا البحث "يُعدّ دليلًا مبكرًا جدًا على صحة المبدأ"، مضيفا أنه "رائع للغاية".
مع التمويل المناسب، قدر أنومانشيبالي أن هذه التقنية قد تساعد الأشخاص المصابين بالشلل الصوتي على التواصل في غضون خمس إلى عشر سنوات.
مصطفى أوفى (أبوظبي)

المصدر: الاتحاد - أبوظبي

مقالات مشابهة

  • الذكاء الاصطناعي يكشف مخاطر أمراض القلب عبر مسح شبكية العين
  • صور الذكاء الاصطناعي بأسلوب غيبلي تغرق مواقع التواصل (شاهد)
  • 3 وظائف فقط ستنجو من سيطرة الذكاء الاصطناعي
  • مايكروسوفت.. قصة نجاح من الحوسبة إلى الذكاء الاصطناعي والسحابة
  • تحديات جوهرية تواجه تطور الذكاء الاصطناعي
  • الذكاء الاصطناعي واغتيال الخيال
  • الذكاء الاصطناعي يحوّل الأفكار إلى كلام في الوقت الحقيقي
  • الذكاء الاصطناعي يتقن الخداع!
  • السعودية تحقق طفرة في صناعة بطاريات الليثيوم باستخدام نايلون الملابس
  • بيل جيتس: الذكاء الاصطناعي سيحل محل العديد من المهن