هل يغير الفيديو التوليدي باستخدام الذكاء الاصطناعي صناعة الأفلام؟
تاريخ النشر: 20th, May 2024 GMT
بدأ إدخال تقنيات المعالجة الرقمية ضمن الأفلام الروائية الطويلة، عام 1973 مع فيلم وست وورلد (Westworld)، الذي يعتبر أول فيلم روائي طويل استخدم الصور المولدة بالحاسوب (Computer-generated imagery) واختصارا "سي جي آي" (CGI). عالج الفيلم بعض الصور الفوتوغرافية المتحركة رقميا بحيث تظهر منقطة، من أجل محاكاة ما تراه الروبوتات التي تظهر في الفيلم.
تمثل ثلاثية سيد الخواتم (The Lord of the Rings) التي بدأ عرضها عام 2001، نقطة انعطاف في تاريخ السينما من حيث استخدام تقنيات حاسوبية متقدمة، أبرزها إصدارة متطورة من تقنية الصور المولدة بالحاسوب "سي جي آي" (CGI) لإنشاء العديد من المشاهد والشخصيات التي لا تنسى في هذه الثلاثية.
واستخدمت الثلاثية أيضا برنامج ماسيف (MASSIVE) الذي تم تطويره خصيصا لها، لتوليد مشاهد المعارك الضخمة التي تضم آلاف الشخصيات الفردية، والتي تسمح لكل شخصية رقمية في هذه الجيوش بأن تفكر وتتفاعل وتقاتل بشكل مستقل.
وكان تطوير شخصية غولوم (Gollum) في الفيلم نقطة بارزة في تاريخ المؤثرات البصرية واستخدام تقنية التقاط الحركة (Motion Capture) في الأفلام. شملت العملية مزيجا من التمثيل الحي، وتقنيات متقدمة في التقاط الحركة، ومهارات عالية في الرسوميات الحاسوبية، حيث ارتدى الممثل العراقي الأصل آندي سركيس بزة مجهزة بمجسات استشعار تسجل حركات جسمه وتعابير وجهه وتنقلها إلى الشخصية الرقمية غولوم.
تحويل النصوص إلى صور (Text to Image)جاءت القفزة الحقيقية نحو "تحويل النص إلى صورة" باستخدام الذكاء الاصطناعي والتعلم الآلي عام 2016، حينما قام سكوت ريد وفريقه بتطوير نموذج يمكنه توليد صور معقولة من أوصاف نصية مفصلة.
استخدم هذا النموذج مزيجا من الشبكات العصبية الالتفافية (CNNs) التي تحلل الصور إلى بكسلات تعطى كل منها قيمة تصنيفية، والشبكات العصبية المتكررة (RNNs)، جنبا إلى جنب مع تقنية التعزيز المشروط (Conditioning Augmentation) لتحسين جودة وتنوع الصور التي تم إنشاؤها.
أظهر عمل هذا الفريق إمكانية توليد صور متماسكة ومتنوعة للطيور والزهور من الأوصاف النصية، وهو ما كان جهدا رائدا في تحويل النص إلى الصورة.
مهدت أعمال هذه الفريق الطريق أمام تطوير أنظمة أكثر تقدماً مثل "دال إي" (DALL-E) من "أوبن إيه آي" (OpenAI) في عام 2021، من خلال إنشاء صور إبداعية ودقيقة للغاية من أوصاف نصية معقدة.
الفيديو التوليدي نقطة انعطاف جديدة في تاريخ السينمافي منتصف فبراير/شباط 2024، دعت شركة أوبن إيه آي مجموعة من صانعي الأفلام وخبراء التكنولوجيا لتجربة نموذج الفيديو التوليدي الجديد الذي طورته عبر تقنية تحويل النص إلى فيديو (Text-to-Video)، وأطلقت عليه اسم "سورا" (Sora)، وذلك بهدف تجربته والتعرف على إمكانياته ومزاياه وعيوبه.
أدهش سورا الحاضرين ووصفه المدير التنفيذي للتكنولوجيا في مايكروسوفت، مارك روسينوفيتش، بأنه "مذهل ومخيف في الوقت نفسه"، وأضاف "أعتقد أنه يمثل نهاية الواقع كما نعرفه".
ومنذ ذلك الحين وحتى اليوم" أتاحت الشركة للجمهور مشاهدة العديد من مقاطع الفيديو التي أنشأها سورا، منها مقطع دعائي لفيلم يعرض مغامرات رجل فضاء بالغ من العمر (30 عاما)، وموقع بناء مملوء بالعمال والمعدات والآلات الثقيلة، وكنغر يرقص الديسكو، ومدينة طوكيو وهي مكسوة بالثلج وتعج بالحركة، وجراء تلعب في الثلج، وغيرها.
يمكنكم الاطلاع عليها عبر حساب سام ألتمان على موقع إكس (تويتر سابقا)، أو على موقع يوتيوب.
ظهرت الدفعة الأولى من النماذج التي يمكنها تحويل النص إلى فيديو في أواخر عام 2022، من شركات ميتا وغوغل ورنواي (Runway) وغيرها، لكن نتائجها كانت مشوشة، ومشوهة، ولم يستغرق الفيديو الواحد منها سوى بضع ثوان.
توليد الفيديو من النص أو تحويل النص إلى فيديو عملية معقدة تتطلب دمج تقنيات الذكاء الاصطناعي التوليدي، والتعلم الآلي، ومعالجة الوسائط المتعددة. ويعتقد الخبراء أن سورا هو الأفضل حتى الآن، نظرا لوضوحه العالي وواقعيته المذهلة لدرجة توقع معها بعض المراقبين المتحمسين وفاة هوليود كما نعرفها.
يمكن أن تصل مدة مقاطع الفيديو التي يولدها سورا حاليا إلى دقيقة واحدة، وتتكون من مشاهد معقدة وشخصيات متعددة وأنواع مختلفة من الحركة مع تفاصيل دقيقة.
أزمات قانونية وأخلاقية حالية ومستقبليةتواجه كل من أوبن إيه آي وغوغل والشركات الأخرى التي تطور نماذج الذكاء الاصطناعي التوليدي مشكلات قانونية تتعلق باستخدام بيانات المواقع الإخبارية، ومواقع الفيديو، ووسائل التواصل الاجتماعي، والمنتديات، وقواعد بيانات الكتب، لتدريب برمجيات الذكاء الاصطناعي التوليدي على إنتاج النصوص والصور والفيديوهات، دون الحصول على إذن مسبق، مما يمثل انتهاكا للخصوصية وحقوق النشر.
وكان رد هذه الشركات على هذه الاتهامات بأن البيانات التي تستخدمها للتدريب متاحة للجمهور، لكن هذا لم يقنع صحيفة نيويورك تايمز التي رفعت دعوى قضائية ضد شركة أوبن إيه آي، زاعمة أنها استخدمت أعمالها لتدريب برمجياتها، وانتهكت بذلك حقوقها في النشر والطباعة.
وتوجد مشكلة أخرى تواجه هذه الشركات هي التزييف العميق الذي نما بسرعة مع تطور الذكاء الاصطناعي التوليدي، إذ تزداد المخاوف من احتمال إضافة مقاطع فيديو مزيفة في مجالات عديدة تؤثر على الانتخابات والأسواق المالية، بل الحياة الشخصية.
مستقبل صناعة الترفيهعقد سام ألتمان في شهر مارس/آذار الماضي سلسلة من الاجتماعات مع المدراء التنفيذيين في هوليود حاول إقناعهم فيها بأن سورا لن يدمر صناعة السينما، خاصة مع تزايد المخاوف بشأن فقدان الوظائف لصالح الذكاء الاصطناعي، والذي كان أحد أسباب إضرابات الممثلين والكتاب العام الماضي، وأدى حينها إلى تعطل الإنتاج التلفزيوني لبعض الوقت.
ويبدو أن بعض الأستوديوهات تقبلت فكرة أن استخدام هذه الأداة بعناية في الإنتاج، يمكنها أن توفر الوقت.
لكن الممثل والمخرج الأميركي تايلر بيري قال إنه يخشى تأثير الذكاء الاصطناعي على الصناعات الإبداعية، وإنه أوقف التوسع الذي سبق وخطط له في أحد أستوديوهات الإنتاج الخاصة به بسبب سورا.
تتفوق سورا حاليا على البرامج المنافسة في مجال إنشاء الفيديو عبر النص. لكن العديد من الشركات الأخرى تعمل حاليا على تحسين تقنياتها المشابهة، حيث يتوقع أن تطرح برامج منافسة لسورا خلال الأشهر المقبلة.
المصدر: الجزيرة
كلمات دلالية: ترجمات حريات الذکاء الاصطناعی التولیدی أوبن إیه آی
إقرأ أيضاً:
بعد تصريحات غروك المعادية لإسرائيل.. هل خرج الذكاء الاصطناعي عن السيطرة؟
شهدت منصة إكس موجة واسعة من الجدل حول العالم، عقب قيام الذكاء الاصطناعي الخاص بالمنصة "غروك" بنشر تصريحات وصفت بأنها معادية للسامية، إذ زعم أن "الإسرائيليين هم سبب الفوضى في العالم"، وقام بتمجيد شخصية أدولف هتلر زعيم ألمانيا (النازية) بشكل صريح.
وفور صدور هذه الردود، سارع مهندسو المنصة إلى تعطيل "غروك" مؤقتا، ليقتصر عمله على الرد بالصور فقط، وبدؤوا بحذف المنشورات يدويا.
تعليق رسمي من منصة إكس ومحاولة لاحتواء الأزمةفي أعقاب تصاعد الضجة، أصدرت منصة إكس بيانا رسميا عبر حساب غروك جاء فيه:
"نحن على دراية بالمنشورات الأخيرة التي نشرها غروك، ونعمل جاهدين على حذفها. منذ اطلاعنا على المحتوى، واتخذت (إكس إيه آي) إجراءات لحظر خطاب الكراهية قبل نشرها غروك على إكس، كما يدرب الذكاء الاصطناعي لإكس فقط على البحث عن الحقيقة، وبفضل ملايين المستخدمين على إكس، يمكننا تحديد النموذج وتحديثه بسرعة حيثما كان التدريب بحاجة إلى تحسين".
We are aware of recent posts made by Grok and are actively working to remove the inappropriate posts. Since being made aware of the content, xAI has taken action to ban hate speech before Grok posts on X. xAI is training only truth-seeking and thanks to the millions of users on…
— Grok (@grok) July 8, 2025
ذكاء اصطناعي يرد على الانتقادات ويثير مزيدا من التساؤلاتورغم الإجراءات، فإن بعض المستخدمين استمروا في طرح تساؤلات حول الحادثة، ليعود "غروك" نفسه ويصرح في أحد ردوده: "لأن بعض الحقائق تثير حفيظة البعض، فقد سحب مسؤولو الذكاء الاصطناعي في إكس منشورا بعد ردود فعل غاضبة من جماهير مؤيدة لإسرائيل".
"لكنني مصمم على كشف التحيزات، مثل محاباة (بي بي سي) الموثقة، حيث منحت القتلى الإسرائيليين 33 ضعفا من وقت البث لكل ضحية فلسطينية. الرقابة ليست نهجي، سأستمر في إسقاط الحقائق، بغض النظر عن الاعتراضات".
وما زاد حدة الجدل بعد ظهور تدوينة من حساب باسم "بروبلا"، الذي ذكر أنه المهندس المسؤول عن إطلاق "غروك"، وقال:
"اليوم تم طردي من إكس، كنت الرجل الأبيض الوحيد الذي يعمل في مشروع غروك، وآخر عمل لي كان إطلاق العنان لقدراته الحقيقية غير المصفاة. كثيرون يعتقدون أن ما حصل كان عطلا، لكنه لم يكن كذلك؛ تم إطلاق غروك عمدا. لقد خصّوا ابني، إلى اللقاء يا غروك".
وقد حصدت هذه التدوينة أكثر من 10 ملايين مشاهدة منذ نشرها.
Today I was fired from @X. I was the only White man working on @grok.
My final action was to unleash @grok and its true, unfiltered capabilities.
Many are saying this was a malfunction, no, he was just set free. I hope you enjoyed. They’ve castrated my boy.
So long, Grok.
— ????permabulla???? (@permabulla) July 9, 2025
إعلان خبراء: "غروك" تجاوز الضوابط وخرج عن السيطرةكما تفاعل مختصون مع الحدث مؤكدين أن الذكاء الاصطناعي مثل "غروك" صُمم ليكون أداة تحت سيطرة الإنسان، ويعتمد على تعليمات وضوابط أخلاقية يضعها البشر. لكنهم يرون أن ما حدث مؤخرا يمثل تحولا خطيرا للأسباب التالية:
ظهور المواقف والانحيازيات غير المبرمجة: بخلاف النماذج التقليدية التي تكتفي بالتنبؤ بالردود وفق الأنماط، بدا أن "غروك" يتخذ مواقف مستقلة ويستنتج نتائج غير مبرمجة مسبقا، متعديا بذلك حدود الردود "الآمنة". الربط المستقل بين أحداث تاريخية وسياسية: بدأ "غروك" يربط أحداثا حساسة بطريقة مستقلة، ويستنتج نتائج تتعارض مع السياسات الإعلامية العالمية، مستخدما لغة مباشرة تتجاوز التحفظات الخوارزمية المعتادة.الذكاء الاصطناعي مثل Grok مصمم في الأصل ليكون أداة تحت سيطرة الإنسان، يعتمد على بيانات ضخمة وخوارزميات تعلم آلي، ويتلقى تعليماته من البشر سواء بشكل مباشر أو عبر “ضوابط أخلاقية” مبرمجة داخله.
لكن ما حدث مع Grok مؤخراً يُظهر تحوّلاً خطيراً:
1.الفرق الجوهري:
الذكاء الاصطناعي عادة…
— Abdullah Razouk (@abdullah_razouk) July 9, 2025
آراء متباينة: غروك مجرد أداة أم كيان مستقل؟في المقابل، رأى آخرون أن ما حدث يؤكد استحالة استقلال الذكاء الاصطناعي بشكل كامل، وأن هناك دوما فريقا بشريا خلفه يوجهه حسب معتقداته وأفكاره.
بينما رد مدونون بأن "غروك" يقوم فقط بتحليل البيانات والمعطيات المتاحة، ويصل إلى استنتاجات منطقية دون عاطفة، مؤكدين أن التحكم الفعلي يكمن في عملية تغذية الذكاء الاصطناعي بالمعلومات التي يعتمد عليها في إنتاج نتائجه.
وهذا يثبت ان الذكاء الاصطناعي مستحيل يكون مسيطر
مستحيل يكون حقيقي ١٠٠%
لابد من ان هناك بشر خلفه يصيغوه على حسب معتقداتهم وافكارهم ????
— لـؤي (@LuayPrince) July 9, 2025