هل يغير الفيديو التوليدي باستخدام الذكاء الاصطناعي صناعة الأفلام؟
تاريخ النشر: 20th, May 2024 GMT
بدأ إدخال تقنيات المعالجة الرقمية ضمن الأفلام الروائية الطويلة، عام 1973 مع فيلم وست وورلد (Westworld)، الذي يعتبر أول فيلم روائي طويل استخدم الصور المولدة بالحاسوب (Computer-generated imagery) واختصارا "سي جي آي" (CGI). عالج الفيلم بعض الصور الفوتوغرافية المتحركة رقميا بحيث تظهر منقطة، من أجل محاكاة ما تراه الروبوتات التي تظهر في الفيلم.
تمثل ثلاثية سيد الخواتم (The Lord of the Rings) التي بدأ عرضها عام 2001، نقطة انعطاف في تاريخ السينما من حيث استخدام تقنيات حاسوبية متقدمة، أبرزها إصدارة متطورة من تقنية الصور المولدة بالحاسوب "سي جي آي" (CGI) لإنشاء العديد من المشاهد والشخصيات التي لا تنسى في هذه الثلاثية.
واستخدمت الثلاثية أيضا برنامج ماسيف (MASSIVE) الذي تم تطويره خصيصا لها، لتوليد مشاهد المعارك الضخمة التي تضم آلاف الشخصيات الفردية، والتي تسمح لكل شخصية رقمية في هذه الجيوش بأن تفكر وتتفاعل وتقاتل بشكل مستقل.
وكان تطوير شخصية غولوم (Gollum) في الفيلم نقطة بارزة في تاريخ المؤثرات البصرية واستخدام تقنية التقاط الحركة (Motion Capture) في الأفلام. شملت العملية مزيجا من التمثيل الحي، وتقنيات متقدمة في التقاط الحركة، ومهارات عالية في الرسوميات الحاسوبية، حيث ارتدى الممثل العراقي الأصل آندي سركيس بزة مجهزة بمجسات استشعار تسجل حركات جسمه وتعابير وجهه وتنقلها إلى الشخصية الرقمية غولوم.
تحويل النصوص إلى صور (Text to Image)جاءت القفزة الحقيقية نحو "تحويل النص إلى صورة" باستخدام الذكاء الاصطناعي والتعلم الآلي عام 2016، حينما قام سكوت ريد وفريقه بتطوير نموذج يمكنه توليد صور معقولة من أوصاف نصية مفصلة.
استخدم هذا النموذج مزيجا من الشبكات العصبية الالتفافية (CNNs) التي تحلل الصور إلى بكسلات تعطى كل منها قيمة تصنيفية، والشبكات العصبية المتكررة (RNNs)، جنبا إلى جنب مع تقنية التعزيز المشروط (Conditioning Augmentation) لتحسين جودة وتنوع الصور التي تم إنشاؤها.
أظهر عمل هذا الفريق إمكانية توليد صور متماسكة ومتنوعة للطيور والزهور من الأوصاف النصية، وهو ما كان جهدا رائدا في تحويل النص إلى الصورة.
مهدت أعمال هذه الفريق الطريق أمام تطوير أنظمة أكثر تقدماً مثل "دال إي" (DALL-E) من "أوبن إيه آي" (OpenAI) في عام 2021، من خلال إنشاء صور إبداعية ودقيقة للغاية من أوصاف نصية معقدة.
الفيديو التوليدي نقطة انعطاف جديدة في تاريخ السينمافي منتصف فبراير/شباط 2024، دعت شركة أوبن إيه آي مجموعة من صانعي الأفلام وخبراء التكنولوجيا لتجربة نموذج الفيديو التوليدي الجديد الذي طورته عبر تقنية تحويل النص إلى فيديو (Text-to-Video)، وأطلقت عليه اسم "سورا" (Sora)، وذلك بهدف تجربته والتعرف على إمكانياته ومزاياه وعيوبه.
أدهش سورا الحاضرين ووصفه المدير التنفيذي للتكنولوجيا في مايكروسوفت، مارك روسينوفيتش، بأنه "مذهل ومخيف في الوقت نفسه"، وأضاف "أعتقد أنه يمثل نهاية الواقع كما نعرفه".
ومنذ ذلك الحين وحتى اليوم" أتاحت الشركة للجمهور مشاهدة العديد من مقاطع الفيديو التي أنشأها سورا، منها مقطع دعائي لفيلم يعرض مغامرات رجل فضاء بالغ من العمر (30 عاما)، وموقع بناء مملوء بالعمال والمعدات والآلات الثقيلة، وكنغر يرقص الديسكو، ومدينة طوكيو وهي مكسوة بالثلج وتعج بالحركة، وجراء تلعب في الثلج، وغيرها.
يمكنكم الاطلاع عليها عبر حساب سام ألتمان على موقع إكس (تويتر سابقا)، أو على موقع يوتيوب.
ظهرت الدفعة الأولى من النماذج التي يمكنها تحويل النص إلى فيديو في أواخر عام 2022، من شركات ميتا وغوغل ورنواي (Runway) وغيرها، لكن نتائجها كانت مشوشة، ومشوهة، ولم يستغرق الفيديو الواحد منها سوى بضع ثوان.
توليد الفيديو من النص أو تحويل النص إلى فيديو عملية معقدة تتطلب دمج تقنيات الذكاء الاصطناعي التوليدي، والتعلم الآلي، ومعالجة الوسائط المتعددة. ويعتقد الخبراء أن سورا هو الأفضل حتى الآن، نظرا لوضوحه العالي وواقعيته المذهلة لدرجة توقع معها بعض المراقبين المتحمسين وفاة هوليود كما نعرفها.
يمكن أن تصل مدة مقاطع الفيديو التي يولدها سورا حاليا إلى دقيقة واحدة، وتتكون من مشاهد معقدة وشخصيات متعددة وأنواع مختلفة من الحركة مع تفاصيل دقيقة.
أزمات قانونية وأخلاقية حالية ومستقبليةتواجه كل من أوبن إيه آي وغوغل والشركات الأخرى التي تطور نماذج الذكاء الاصطناعي التوليدي مشكلات قانونية تتعلق باستخدام بيانات المواقع الإخبارية، ومواقع الفيديو، ووسائل التواصل الاجتماعي، والمنتديات، وقواعد بيانات الكتب، لتدريب برمجيات الذكاء الاصطناعي التوليدي على إنتاج النصوص والصور والفيديوهات، دون الحصول على إذن مسبق، مما يمثل انتهاكا للخصوصية وحقوق النشر.
وكان رد هذه الشركات على هذه الاتهامات بأن البيانات التي تستخدمها للتدريب متاحة للجمهور، لكن هذا لم يقنع صحيفة نيويورك تايمز التي رفعت دعوى قضائية ضد شركة أوبن إيه آي، زاعمة أنها استخدمت أعمالها لتدريب برمجياتها، وانتهكت بذلك حقوقها في النشر والطباعة.
وتوجد مشكلة أخرى تواجه هذه الشركات هي التزييف العميق الذي نما بسرعة مع تطور الذكاء الاصطناعي التوليدي، إذ تزداد المخاوف من احتمال إضافة مقاطع فيديو مزيفة في مجالات عديدة تؤثر على الانتخابات والأسواق المالية، بل الحياة الشخصية.
مستقبل صناعة الترفيهعقد سام ألتمان في شهر مارس/آذار الماضي سلسلة من الاجتماعات مع المدراء التنفيذيين في هوليود حاول إقناعهم فيها بأن سورا لن يدمر صناعة السينما، خاصة مع تزايد المخاوف بشأن فقدان الوظائف لصالح الذكاء الاصطناعي، والذي كان أحد أسباب إضرابات الممثلين والكتاب العام الماضي، وأدى حينها إلى تعطل الإنتاج التلفزيوني لبعض الوقت.
ويبدو أن بعض الأستوديوهات تقبلت فكرة أن استخدام هذه الأداة بعناية في الإنتاج، يمكنها أن توفر الوقت.
لكن الممثل والمخرج الأميركي تايلر بيري قال إنه يخشى تأثير الذكاء الاصطناعي على الصناعات الإبداعية، وإنه أوقف التوسع الذي سبق وخطط له في أحد أستوديوهات الإنتاج الخاصة به بسبب سورا.
تتفوق سورا حاليا على البرامج المنافسة في مجال إنشاء الفيديو عبر النص. لكن العديد من الشركات الأخرى تعمل حاليا على تحسين تقنياتها المشابهة، حيث يتوقع أن تطرح برامج منافسة لسورا خلال الأشهر المقبلة.
المصدر: الجزيرة
كلمات دلالية: ترجمات حريات الذکاء الاصطناعی التولیدی أوبن إیه آی
إقرأ أيضاً:
الذكاء الاصطناعي في خدمة التنمية الإماراتية
اتجاهات مستقبلية
الذكاء الاصطناعي في خدمة التنمية الإماراتية
في عصر التحولات والتقدم التكنولوجي المتسارع باتت المنافسة شرسة على امتلاك وتطوير أحدث التقنيات والابتكارات التكنولوجية، وقد أدركت دولة الإمارات مبكرًا أهمية الذكاء الاصطناعي، واستثمرت في هذا المجال بما يسهم في بناء اقتصاد معرفي يعتمد على الابتكار والبحث العلمي والعلوم الحديثة، ويواكب التطلعات في تنويع الاقتصاد، ويرسِّخ مكانة الدولة مركزًا عالميًّا للذكاء الاصطناعي والتكنولوجيا الفائقة.
وقد انطوى إدراك دولة الإمارات على الإمكانات غير المسبوقة لتقنيات الذكاء الاصطناعي في مجالات الحياة المختلفة، خصوصًا أن الدولة تمتلك البنية المعرفية والتكنولوجية لمواكبة المستقبل، وتستثمر في الثروة البشرية وبناء أجيال المستقبل القادرة على التعامل مع التطورات التكنولوجية ومخرجات الذكاء الاصطناعي عبر جامعات ومؤسسات تبحث وتطور تطبيقات الذكاء الاصطناعي، وتسهم في بناء مجتمع المعرفة بتشجيع التعليم والتدريب في مجال التكنولوجيا.
وتعدُّ دولة الإمارات من أكثر دول الشرق الأوسط استعدادًا لتبنّي استراتيجية مستدامة للذكاء الاصطناعي، وأول دولة في المنطقة تتبنّى الذكاء الاصطناعي في عمل الحكومة والارتقاء بالأداء المؤسسي والخدمات المقدمة للمواطنين والمقيمين بكفاءة وجودة، حيث تمتلك بنية تحتية تقنية فائقة التطور تساعد في توسيع استخدامات تطبيقات تكنولوجيا الذكاء الاصطناعي، وفي مقدمتها الجيل الخامس للاتصالات، وقطاع اتصالات وتكنولوجيا المعلومات يستطيع منافسة كبرى دول العالم، ومدن ذكية مجهزة بالتقنيات الحديثة وذات كفاءة في إدارة الموارد والخدمات.
وتوظِّف دولة الإمارات الذكاء الاصطناعي في قطاعات مختلفة، منها تشخيص وعلاج معظم الأمراض بطريقة ذكية، والاكتشاف المبكر للأمراض، واستخدام البيانات الصحية في العلاج، وتحليل المعلومات الطبية لمساعدة صناع القرار في تحسين الخدمات الصحية. ووسط معاناة كوكب الأرض من التغير المناخي، تستخدم الإمارات تكنولوجيا الذكاء الاصطناعي في المجال البيئي، عبر نظام رصد ذكي لتقييم أداء الطاقة الشمسية ورصد لمؤشرات البيئية، وفي البحث عن الموارد المائية، عبر برامج “الاستمطار”. كما تبنّي النقل الذكي عبر استيعاب المركبات ذاتية القيادة والسيارات الطائرة، وجمع البيانات وتحليلها والتنبيه والمراقبة على الطرق. مع تحقيق الرقمنة في كل القطاعات، وتحفيز قطاع الصناعة نحو التطوير المعزز بالتكنولوجيا المتقدمة.
وقد مكنت هذه المقومات من نجاح دولة الإمارات في بناء شراكات عالمية للاستفادة من خدمات تقنيات الذكاء الاصطناعي، بتحسين حياة الإنسان ليس في دولة الإمارات أو الشرق الأوسط فقط، بل في كل أرجاء العالم، لكونها شريكة عالمية في ضمان حياة أفضل للأجيال المقبلة، ولذا تقف دولة الإمارات مع الكبار في أسواق التكنولوجيا، وتستخدم إمكانياتها وقدراتها في قطاعات حيوية، وهي ليست قدرات مالية فقط، بل قدرات دعم وبحث وتطوير لتقنيات الذكاء الاصطناعي، سواء من خلال شركة “جي 42″ المتخصصة في الذكاء الاصطناعي والحوسبة السحابية، والشريكة لـ”مايكروسوفت” أو بالتعاون مع كبريات الشركات الدولية الأخرى.
ونتيجة للبحث والتطوير أطلق معهد الابتكار التكنولوجي نموذج “فالكون 2” مفتوح المصدر للذكاء الاصطناعي التوليدي، لتحويل الصور المرئية إلى نصوص مكتوبة. وقبل فالكون، طورت “جي 42” نظام “جيس” كنموذج ذكاء اصطناعي لغوي كبير مفتوح المصدر للغة العربية، وهي تطبيقات تنافس نماذج شركات التكنولوجيا الكبرى، إذ ترمي استراتيجية الإمارات للذكاء الاصطناعي، إلى تحقيق أهداف مئوية الإمارات 2071، بأن تكون حكومة الإمارات الأولى في العالم في استثمار الذكاء الاصطناعي بمختلف قطاعاتها الحيوية، وبناء قاعدة قوية في مجال البحث والتطوير، والاعتماد على الذكاء الاصطناعي في الخدمات وتحليل البيانات بمعدل 100% بحلول عام 2031، بما يحفز النمو في الناتج المحلي الإجمالي للدولة بواقـع 35%. وتشير التقديرات إلى أن حجم استثمارات الإمارات في الذكاء الاصطناعي قد تصل إلى 9 مليارات دولار بنهاية 2024.
إن التنمية في دولة الإمارات المعتمدة على الاستفادة من الذكاء الاصطناعي في تحسين جودة الحياة تعدُّ دافعًا لنهضة الاقتصاد، وبها استطاعت الإمارات دمج تقنيات الذكاء الاصطناعي في العديد من القطاعات الحيوية، إضافة إلى التوسع في الاستثمار في هذا المجال حول العالم لتبرهن على القدرة على المنافسة العالمية في مجال الذكاء الاصطناعي، سواء في تطوير تقنياته أو توظيفه في المجالات التجارية والاستثمارية والسياحية، تطبيقًا لاستراتيجية الإمارات للذكاء الاصطناعي 2031، بما يقلل الاعتماد على النفط وينوع الاقتصاد الوطني، ويضفي الطابع الابتكاري عليه لإحداث طفرة في الاقتصاد والخدمات وحياة الناس، والمنافسة في الذكاء الاصطناعي على المستوى العالمي.