بدأ إدخال تقنيات المعالجة الرقمية ضمن الأفلام الروائية الطويلة، عام 1973 مع فيلم وست وورلد (Westworld)، الذي يعتبر أول فيلم روائي طويل استخدم الصور المولدة بالحاسوب (Computer-generated imagery) واختصارا "سي جي آي" (CGI). عالج الفيلم بعض الصور الفوتوغرافية المتحركة رقميا بحيث تظهر منقطة، من أجل محاكاة ما تراه الروبوتات التي تظهر في الفيلم.

طبعا كانت المعالجة بسيطة وبدائية.

تمثل ثلاثية سيد الخواتم (The Lord of the Rings) التي بدأ عرضها عام 2001، نقطة انعطاف في تاريخ السينما من حيث استخدام تقنيات حاسوبية متقدمة، أبرزها إصدارة متطورة من تقنية الصور المولدة بالحاسوب "سي جي آي" (CGI) لإنشاء العديد من المشاهد والشخصيات التي لا تنسى في هذه الثلاثية.

واستخدمت الثلاثية أيضا برنامج ماسيف (MASSIVE) الذي تم تطويره خصيصا لها، لتوليد مشاهد المعارك الضخمة التي تضم آلاف الشخصيات الفردية، والتي تسمح لكل شخصية رقمية في هذه الجيوش بأن تفكر وتتفاعل وتقاتل بشكل مستقل.

وكان تطوير شخصية غولوم (Gollum) في الفيلم نقطة بارزة في تاريخ المؤثرات البصرية واستخدام تقنية التقاط الحركة (Motion Capture) في الأفلام. شملت العملية مزيجا من التمثيل الحي، وتقنيات متقدمة في التقاط الحركة، ومهارات عالية في الرسوميات الحاسوبية، حيث ارتدى الممثل العراقي الأصل آندي سركيس بزة مجهزة بمجسات استشعار تسجل حركات جسمه وتعابير وجهه وتنقلها إلى الشخصية الرقمية غولوم.

تحويل النصوص إلى صور (Text to Image)

جاءت القفزة الحقيقية نحو "تحويل النص إلى صورة" باستخدام الذكاء الاصطناعي والتعلم الآلي عام 2016، حينما قام سكوت ريد وفريقه بتطوير نموذج يمكنه توليد صور معقولة من أوصاف نصية مفصلة.

استخدم هذا النموذج مزيجا من الشبكات العصبية الالتفافية (CNNs) التي تحلل الصور إلى بكسلات تعطى كل منها قيمة تصنيفية، والشبكات العصبية المتكررة (RNNs)، جنبا إلى جنب مع تقنية التعزيز المشروط (Conditioning Augmentation) لتحسين جودة وتنوع الصور التي تم إنشاؤها.

أظهر عمل هذا الفريق إمكانية توليد صور متماسكة ومتنوعة للطيور والزهور من الأوصاف النصية، وهو ما كان جهدا رائدا في تحويل النص إلى الصورة.

مهدت أعمال هذه الفريق الطريق أمام تطوير أنظمة أكثر تقدماً مثل "دال إي" (DALL-E) من "أوبن إيه آي" (OpenAI) في عام 2021، من خلال إنشاء صور إبداعية ودقيقة للغاية من أوصاف نصية معقدة.

الفيديو التوليدي نقطة انعطاف جديدة في تاريخ السينما

في منتصف فبراير/شباط 2024، دعت شركة أوبن إيه آي مجموعة من صانعي الأفلام وخبراء التكنولوجيا لتجربة نموذج الفيديو التوليدي الجديد الذي طورته عبر تقنية تحويل النص إلى فيديو (Text-to-Video)، وأطلقت عليه اسم "سورا" (Sora)، وذلك بهدف تجربته والتعرف على إمكانياته ومزاياه وعيوبه.

أدهش سورا الحاضرين ووصفه المدير التنفيذي للتكنولوجيا في مايكروسوفت، مارك روسينوفيتش، بأنه "مذهل ومخيف في الوقت نفسه"، وأضاف "أعتقد أنه يمثل نهاية الواقع كما نعرفه".

ومنذ ذلك الحين وحتى اليوم" أتاحت الشركة للجمهور مشاهدة العديد من مقاطع الفيديو التي أنشأها سورا، منها مقطع دعائي لفيلم يعرض مغامرات رجل فضاء بالغ من العمر (30 عاما)، وموقع بناء مملوء بالعمال والمعدات والآلات الثقيلة، وكنغر يرقص الديسكو، ومدينة طوكيو وهي مكسوة بالثلج وتعج بالحركة، وجراء تلعب في الثلج، وغيرها.

يمكنكم الاطلاع عليها عبر حساب سام ألتمان على موقع إكس (تويتر سابقا)، أو على موقع يوتيوب.

ظهرت الدفعة الأولى من النماذج التي يمكنها تحويل النص إلى فيديو في أواخر عام 2022، من شركات ميتا وغوغل ورنواي (Runway) وغيرها، لكن نتائجها كانت مشوشة، ومشوهة، ولم يستغرق الفيديو الواحد منها سوى بضع ثوان.

توليد الفيديو من النص أو تحويل النص إلى فيديو عملية معقدة تتطلب دمج تقنيات الذكاء الاصطناعي التوليدي، والتعلم الآلي، ومعالجة الوسائط المتعددة. ويعتقد الخبراء أن سورا هو الأفضل حتى الآن، نظرا لوضوحه العالي وواقعيته المذهلة لدرجة توقع معها بعض المراقبين المتحمسين وفاة هوليود كما نعرفها.

يمكن أن تصل مدة مقاطع الفيديو التي يولدها سورا حاليا إلى دقيقة واحدة، وتتكون من مشاهد معقدة وشخصيات متعددة وأنواع مختلفة من الحركة مع تفاصيل دقيقة.

أزمات قانونية وأخلاقية حالية ومستقبلية

تواجه كل من أوبن إيه آي وغوغل والشركات الأخرى التي تطور نماذج الذكاء الاصطناعي التوليدي مشكلات قانونية تتعلق باستخدام بيانات المواقع الإخبارية، ومواقع الفيديو، ووسائل التواصل الاجتماعي، والمنتديات، وقواعد بيانات الكتب، لتدريب برمجيات الذكاء الاصطناعي التوليدي على إنتاج النصوص والصور والفيديوهات، دون الحصول على إذن مسبق، مما يمثل انتهاكا للخصوصية وحقوق النشر.

وكان رد هذه الشركات على هذه الاتهامات بأن البيانات التي تستخدمها للتدريب متاحة للجمهور، لكن هذا لم يقنع صحيفة نيويورك تايمز التي رفعت دعوى قضائية ضد شركة أوبن إيه آي، زاعمة أنها استخدمت أعمالها لتدريب برمجياتها، وانتهكت بذلك حقوقها في النشر والطباعة.

وتوجد مشكلة أخرى تواجه هذه الشركات هي التزييف العميق الذي نما بسرعة مع تطور الذكاء الاصطناعي التوليدي، إذ تزداد المخاوف من احتمال إضافة مقاطع فيديو مزيفة في مجالات عديدة تؤثر على الانتخابات والأسواق المالية، بل الحياة الشخصية.

مستقبل صناعة الترفيه

عقد سام ألتمان في شهر مارس/آذار الماضي سلسلة من الاجتماعات مع المدراء التنفيذيين في هوليود حاول إقناعهم فيها بأن سورا لن يدمر صناعة السينما، خاصة مع تزايد المخاوف بشأن فقدان الوظائف لصالح الذكاء الاصطناعي، والذي كان أحد أسباب إضرابات الممثلين والكتاب العام الماضي، وأدى حينها إلى تعطل الإنتاج التلفزيوني لبعض الوقت.

ويبدو أن بعض الأستوديوهات تقبلت فكرة أن استخدام هذه الأداة بعناية في الإنتاج، يمكنها أن توفر الوقت.

لكن الممثل والمخرج الأميركي تايلر بيري قال إنه يخشى تأثير الذكاء الاصطناعي على الصناعات الإبداعية، وإنه أوقف التوسع الذي سبق وخطط له في أحد أستوديوهات الإنتاج الخاصة به بسبب سورا.

تتفوق سورا حاليا على البرامج المنافسة في مجال إنشاء الفيديو عبر النص. لكن العديد من الشركات الأخرى تعمل حاليا على تحسين تقنياتها المشابهة، حيث يتوقع أن تطرح برامج منافسة لسورا خلال الأشهر المقبلة.

المصدر: الجزيرة

كلمات دلالية: ترجمات حريات الذکاء الاصطناعی التولیدی أوبن إیه آی

إقرأ أيضاً:

تحليل : الذكاء الاصطناعي نفط المستقبل في العالم

في الوقت الذي يفيض المجال العام بالحديث عن الذكاء الاصطناعي والتشفير، مازال مجتمع الأمن القومي الأمريكي عالقا في البحث عن سبل مواجهة تداعيات هذه التطورات الجديدة وإمكانية تحويلها إلى أدوات مفيدة.

وفي تحليل نشرته مجلة ناشونال إنتريست الأمريكية يقول أدريان كرانز رئيس شركة بارا تريد كوربورشن الرائدة في مجال الاستفادة من قوة الذكاء الاصطناعي وتعليم الآلة لإعادة تشكيل عملية صناعة القرار المالي في المؤسسات إن التكنولوجيا تغير دائما موازين القوة الجيوسياسية من الناحيتين العسكرية والاقتصادية. وأصبحت العملات الرقمية المشفرة خطرا يهدد العصا الأمريكية الغليظة وهي "العقوبات الاقتصادية" التي تستخدم فيها واشنطن المكانة الفريدة للدولار الأمريكي في النظامين المالي والتجاري العالميين لمعاقبة ما تراه دولا مارقة.

ويرى كرانز الذي ينشر مقالاته وتحليلاته على منصة نيوبورت جلوبال سوميت أن الذكاء الاصطناعي سيصبح نفط المستقبل، وستكون مراكز البيانات هي حقول النفط التي يتم منها استخراج كل قدرات الذكاء الاصطناعي. ونحن نرى انتشار الذكاء الاصطناعي في كل الصناعات تقريبا، وستعتمد هذه الصناعات في المستقبل القريب عليه لكي تعمل بالشكل الصحيح. وكلما زاد حجم مراكز البيانات زادت قوة نموذج الذكاء الاصطناعي المستخدم. وعلى عكس أغلب الصناعات الأخرى فإن مراكز البيانات تعتمد على عامل إنتاج رئيسي وحيد وهو الكهرباء وكميات كبيرة منها.

لذلك فالسؤال الآن، ما هي كمية الطاقة التي تحتاجها هذه التكنولوجيا؟ يستهلك حاليا نشاط تعدين العملة المشفرة الأشهر عالميا بتكوين وأنشطة الدعم المرتبطة بها ما بين 67 و240 تيراوات/ساعة أي ما يتراوح بين 2ر0% و9ر0% من إجمالي استهلاك العالم من الكهرباء سنويا. وبالنسبة للذكاء الاصطناعي فإن قوة أجهزة الكمبيوتر المطلوبة لاستخدامها تتضاعف كل 100 يوم، ومن المتوقع أن تستهلك هذه الأجهزة حوالي 4% من إجمالي الطلب العالمي على الكهرباء بحلول 2028 . هذا الاستهلاك الضخم للطاقة يعني أن توافر الطاقة الرخيصة وليس العمالة الرخيصة سيكون عنصر الجذب الرئيسي لشركات التكنولوجيا لإقامة مراكزها في هذه الدولة أو تلك.

ومن غير المحتمل انتقال مراكز تصنيع معدات الكمبيوتر في عصر الذكاء الاصطناعي من شرق آسيا، في حين ستقام مراكز البيانات التي تشغل الذكاء الاصطناعي والعملات المشفرة في المناطق التي تتوفر فيها طاقة رخيصة ومنتظمة. في الوقت نفسه فإن تكلفة الأرض التي تقام عليها مراكز البيانات لا تكاد تذكر مقارنة بتكلفة الكهرباء والأجهزة المستخدمة. وغالبا ما تطغى المنتجات التي يمكن أن تقدمها مراكز البيانات على أهمية المراكز نفسها.

وفي الصراعات المستقبلية ستكون مراكز البيانات بمثابة الجهاز العصبي المركزي لأي قوة مقاتلة مرتبطة بشبكة الاتصالات، وسيكون بقاء أو تدمير هذه المراكز محددا رئيسيا لنتيجة الصراع. وستتولى هذه المراكز تجميع البيانات التي يجمعها كل جندي أو طائرة مسيرة أو طائرة أو دبابة أو جهاز مراقبة وتحويلها إلى صورة واحدة لأراضي المعركة بالكامل بحيث يمكن للقادة استخدامها في اتخاذ قراراتهم. وحاليا يتم تخزين ومعالجة البيانات المطلوبة لإنجاز مهام قوة قتالية كاملة من خلال مركز بيانات ثابت، في حين يجري حاليا تطوير مراكز بيانات منتقلة لاستخدامها في هذه المهام مستقبلا.

ويرى كرانز أنه لحسن الحظ فإن تخلف الولايات المتحدة من الناحيتين التشريعية والتطبيقية لتكنولوجيا الذكاء الاصطناعي والعملات المشفرة، يقاس بالسنوات وليس بالعقود وهو ما يعني السهولة النسبية للحاق بركب التطور في هذه المجالات.

ويضيف الخبير الأمريكي أن الخوف هو الذي يسيطر على الحديث عن العملات المشفرة والذكاء الاصطناعي في واشنطن وبخاصة الخوف من نقص الفهم والتعليم. يجب أن يكون التعليم في بؤرة الاهتمام، في حين أن فهم حقيقة هذه النكنولوجيات سيقلل الخوف من المجهول.

مقالات مشابهة

  • هل اقترب عصر الذكاء الاصطناعي الواعي؟
  • 5 طرق للكشف عن التزييف العميق لمستخدمي تقنيات الذكاء الاصطناعي
  • خبير أميركي: الذكاء الاصطناعي نفط المستقبل
  • جامعة السلطان قابوس والذكاء الاصطناعي
  • مطارات دبي: نظام التنبؤ بالمخزون باستخدام الذكاء الاصطناعي أحدث نقلة نوعية
  • مطارات دبي: نظام التنبؤ بالمخزون باستخدام الذكاء الاصطناعي أحدث نقلة نوعية في إدارة الإمدادات
  • تأهيل الأطباء في تصميم المناهج باستخدام الذكاء الاصطناعي
  • “دِل تكنولوجيز”: 90% من المؤسسات في الإمارات لديها استراتيجية قوية تخص الذكاء الاصطناعي
  • تحليل : الذكاء الاصطناعي نفط المستقبل في العالم
  • اعتقال نجم سينمائي هندي بتهمة قتل أحد معجبيه بطريقة بشعة