إنتاج الفيديوهات بالذكاء الاصطناعي.. تقدم مذهل ومخاوف مشروعة
تاريخ النشر: 26th, February 2024 GMT
تطور مذهل يشهده الذكاء الاصطناعي المستخدم في إنتاج مقاطع الفيديو بعد الكشف عن سورا Sora، مولّد تحويل النص إلى فيديو باستخدام الذكاء الاصطناعي من شركة اوبن إيه آي OpenAI.
تستخدم الأداة، التي كشفت عنها الشركة قبل أيام، الذكاء الاصطناعي التوليدي لإنشاء مقاطع فيديو قصيرة على الفور بناءً على أوامر مكتوبة. وكانت النتائج الأولية مذهلة حتى أن البعض خُدع في الفيديوهات المنتجة، معتقداً أنها مشاهد حقيقية من أرض الواقع كما في الفيديو التالي:
والواقع أن "سورا" ليس الأداة الوحيدة التي تستخدم هذا النوع من التكنولوجيا المتقدمة، لكن الخبراء يشيرون إلى الجودة العالية لمقاطع الفيديو التي تعرضها "سورا" حتى الآن، مؤكدين أن كشف الستار عنها يمثل قفزة كبيرة سواء للشركة أو لمستقبل إنشاء تحويل النص إلى فيديو بشكل عام.
ومع ذلك، وكما هو الحال مع كل الأشياء في مجال الذكاء الاصطناعي سريع النمو في هذه الأيام، تثير هذه التكنولوجيا أيضًا مخاوف بشأن الآثار الأخلاقية والمجتمعية المحتملة.
كيف يعمل "سورا"؟
تقوم الأداة الجديدة "سورا" بإنشاء مقاطع فيديو تصل مدتها إلى 60 ثانية (حتى الآن!) بناءً على طلبات مكتوبة باستخدام الذكاء الاصطناعي التوليدي، كما يمكن للنموذج أيضًا إنشاء فيديو من صورة ثابتة.
والذكاء الاصطناعي التوليدي هو فرع من الذكاء الاصطناعي يمكنه إنشاء شيء جديد تماماً. تشمل الأمثلة روبوتات الدردشة، مثل ChatGPT من OpenAI، ومولدات الصور مثل DALL-E وميد جيرني Midjourney.
قامت شركة اوبن إيه آي بتغذية "سورا" بمقاطع فيديو وصور وتم تدريبه على تحويل الصور الثابتة والنصوص بما يعرف باسم "محولات الانتشار"، لتحويل ما تمت تغذيته به من معلومات إلى فيديوهات ومشاهد متحركة.
كما تم تدريب "سورا" على إنتاج الفيديوهات بجودات ودرجات وضوح وأطوال مختلفة، آخذاً في الاعتبار النسب المنطقية للأبعاد وتدرجات الألوان وغيرها من العوامل، وفق ما ذكر موقع "ماشابل" التقني المتخصص.
متى يمكن أن يتاح "سورا" للعامة؟
حتى الآن فإن "سورا" ليس متاحًا للاستخدام العام. تقول اوبن ايه آي إنها تتواصل مع صانعي السياسات والفنانين قبل إطلاق الأداة رسميًا، لكن في الحقيقة فإن الكثير من الجوانب المحيطة بالأداة نفسها يحيطها الكثير من الغموض.
وبحسب موقع "تك. كو" التقني المتخصص فإن نموذج الذكاء الاصطناعي الجديد يتم إخضاعه في الوقت الحالي للفحص الدقيق من قبل باحثين أمنيين مسؤولين عن ضمان سلامته وأمانه، إضافة إلى تقييم "المخاطر الحرجة" الناشئة عن استخدامه وذلك قبل إصداره للجمهور.
ومنحت الشركة مجموعة محدود للغاية من الفنانين وصانعي الأفلام والمصممين إمكانية الوصول إلى "سورا" بهدف تجربته بكامل إمكانياته والتعرف على المزايا والعيوب. لكن يبدو أن بعض الحسابات المعروفة في منتدى OpenAI تشير إلى أنه ستكون هناك قائمة انتظار طويلة سيتم طرحها في مرحلة ما لضم المزيد من الأشخاص، دون تحديد موعد واضح لإمكانية عمل ذلك.
ومنذ إعلان إطلاق "سورا"، نشرت الشركة عددًا من الأمثلة لمقاطع الفيديو التي أنشأها النظام لإظهار إمكانياته، وهو ما فعله سام التمان الرئيس التنفيذي للشركة على حسابه بموقع "اكس" والذي طلب من المتابعين ارسال أفكار لفيديوهات يرغبون في إنتاجها وقام بنشر الفيديوهات لاحقاً:
أدوات أخرى لصناعة الفيديو بالذكاء الاصطناعي
لم تكن "سورا" هي الأداة الأولى من نوعها التي تقوم بإنتاج الفيديوهات من خلال أوامر أو نصوص مكتوبة، فشركات مثل غوغل، وميتا، والشركة الناشئة Runway ML تُعد من بين الشركات التي لديها تكنولوجيا مماثلة.
لكن بحسب الخبراء فإن النتائج التي جاءت من "سورا" لا يمكن مقارنة جودتها مع الأدوات الأخرى، سواء من حيث جودة الصور والوضوح والطول، ما يجعل "سورا" نقلة مذهلة في هذا المجال.
قال فريد هافيماير، رئيس قسم الذكاء الاصطناعي وأبحاث البرمجيات في شركة ماكواري بالولايات المتحدة، إن إطلاق "سورا" يمثل خطوة كبيرة إلى الأمام بالنسبة لهذه الصناعة، بحسب ما نقل موقع "يورونيوز".
وأضاف: "لا يمكنك فقط إنشاء مقاطع فيديو أطول، فأنا أفهم أن تنتج مقطعاً يصل إلى 60 ثانية باستخدام بعض الأدوات، لكن اليوم يمكن إنتاج فيديوهات طويلة، كما أن مقاطع الفيديو التي يتم إنشاؤها من خلال "سورا" تبدو طبيعية أكثر ويبدو أنها تحترم قوانين الفيزياء وتقترب من العالم الحقيقي بشكل أكبر".
وبالعودة إلى "سورا"، فقد يرى البعض أن المنتج النهائي لا تشوبه شائبة في الوقت الحالي، لكن الشركة تؤكد أنه لا تزال هناك بعض نقاط الضعف، بما في ذلك بعض العناصر المتعلقة بالمكان وبعض النتائج التي لم تكن على المستوى المطلوب كما يظهر في هذا الفيديو:
أزمات قانونية وأخلاقية حالية ومستقبلية
وبحسب الخبراء فإن المشكلة القانونية والأخلاقية تعلقت في بداية الأمر بكيفية الحصول على بيانات التدريب لنماذج الذكاء الاصطناعي منذ أن أطلقت الشركة نموذج ChatGPT.
فقد تم اتهام كل من اوبن إيه آي وغوغل بـ”سرقة” البيانات بهدف تدريب نماذجهم الجديدة للذكاء الاصطناعي، أو بعبارة أخرى استخدام البيانات المأخوذة من وسائل التواصل الاجتماعي، ومنتديات الإنترنت وقواعد بيانات الكتب الخاصة، والمواقع الإخبارية دون الحصول على إذن مسبق.
وكان الرد هو أن الأساس المنطقي لاستخراج بيانات التدريب من الإنترنت بالكامل هو أن هذه البيانات متاحة للجمهور. لكنّ ما هو متاح للجمهور لا يجب نشره دائمًا في المجال العام.
على سبيل المثال، رفعت صحيفة نيويورك تايمز دعوى قضائية ضد شركتي اوبن إيه آي و مايكروسوفت بسبب انتهاك حقوق الطبع والنشر، زاعمة أن نماذج اوبن إيه آي استخدمت أعمال التايمز حرفياً أو استشهدت بالقصص بشكل غير صحيح.
واذا كان هذا هو الحال مع النصوص المكتوبة، فيمكننا أن تتوقع كيف سيكون الأمر مع كبار العاملين في صناعة الترفيه وخصوصاً في الولايات المتحدة.
انتهاك للخصوصية وحقوق النشر؟
أيضاً، تظل المشكلة قائمة، إذ لازلنا لا نعرف مصدر البيانات التي تم تدريب "سورا" من خلالها. كتب غاري ماركوس، خبير الذكاء الاصطناعي الذي أدلى بشهادته في جلسة استماع لجنة مراقبة الذكاء الاصطناعي بمجلس الشيوخ الأمريكي: "لقد التزمت الشركات الصمت بشأن الكيفية التي قاموا من خلالها بتدريب نماذج الذكاء الاصطناعي بل وما تم تدريب تلك النماذج عليه".
وأضاف: "يعتقد الكثيرون أنه من المحتمل أن يكون هناك منتجات استخدم فيها الذكاء الاصطناعي باستخدام محركات الألعاب مثل Unreal على سبيل المثال دون أن نعلم.. لذا لن أتفاجأ على الإطلاق إذا كان هناك أيضًا الكثير من التدريب لهذه النماذج من خلال المحتوى المنشور في موقع يوتيوب أو العديد من المواد المحمية بحقوق الطبع والنشر".
على الجانب الآخر، بدأ صناع محتوى الفيديو يشعرون بالقلق على مستقبلهم من وجود أداة تقوم بعمل ما يقومون به وفي المستبقل ربما تتجاوز جودة المواد المنتجة أبعد مما يمكن للبشر إنتاجه مهما حاولوا، وهو ما يهدد مصدر دخل ومسقبل الكثيرين حول العالم في هذه الصناعة.
لكن المتفائلين يرون أن هذا النوع من التطور قد يؤدي إلى زيادة الطلب على أدوات إنتاج الفيديو الإبداعية مثل Premiere ومع الوقت يمكن دمج مثل هذه التقنيات فيها، ما يحسن من جودة العمل بشكل مذهل، مع وجود اللمسة الإنسانية في المنتج النهائي.
ويرى آخرون أن هذه التقنيات ستتاح بشكل مبالغ فيه مادياً في البداية، ما يجعل إنشاء مقاطع الفيديو الطويلة أمرًا مكلفًا للغاية من الناحية المالية.
لكن الخبراء يتفقون في النهاية على أن البشرية في حاجة دائمة إلى التعديل والتطوير والابتكار، وأن الذكاء الاصطناعي سيعزز الإبداع البشري وسيظل للإنسان دائماً الأهمية الكبرى في هذا العالم المستقبلي.
المصدر: أخبارنا
كلمات دلالية: الذکاء الاصطناعی إنتاج الفیدیو مقاطع الفیدیو مقاطع فیدیو إنشاء مقاطع اوبن إیه آی
إقرأ أيضاً:
الذكاء الاصطناعي في المسرح
لستُ من القلقين حول توظيف الذكاء الاصطناعي فـي المسرح على المستويات جميعها، لكن قلقي ينبع ككثيرين (المؤلف والمخرج والسينوغراف) من الاعتماد الكامل فـي توجيه الذكاء الاصطناعي للقيام بمهمات عديدة كزرع نواة الحكاية وتأليفها وتسليمها إلى المخرج الذي بدوره سوف يعدلها وحصر عدد ممثليها، فعلى سبيل الشاهد عوضَ أن تكون المسرحية متضمنة عددا من الممثلين أو الجوقة بتعبير الكلاسيكيين، يمكن للذكاء الاصطناعي اقتراح اختزالها فـي مونودراما أو ديودراما. ولا يقف الأمر بالاستفادة من قدرة الذكاء الاصطناعي وتطبيقاته عند هذا الأمر، بل يُمكنه التمدد إلى مستويات متعددة كاختيار نوع الإضاءة والأزياء والموسيقى المناسبة والقاعة المثالية الصالحة لتقديم العرض وكذلك قدرته على انتخاب الجمهور الملائم، من الأعمار والشرائح .
أعود إلى سؤال قديم سألته نفسي بعد قراءاتي لقصة حُلم الحكيم الصيني (جوانج زو)، وكان السؤال: هل يُمكن تحقيق حلم جوانج زو فوق خشبة المسرح على وجه الحقيقة، لا وجه المجاز؟ أمّا الحلم فتروى قصته كما يلي: «رأيتُ أنا جوانج زو مرّةً فـي منامي أنّني فراشةٌ تُرفرفُ بجناحيها فـي هذا المكان وذاك، أنا فراشةٌ حقا من الوجوه جميعها، ولمْ أَكنْ أُدركُ شيئا أكثرَ منْ تتبعي لخيالاتي التي تُشعرني بأنّني فراشة، أمّا ذاتي الإنسانيّة، فلم أكنْ أُدركها البتّة، ثُمَّ استيقظتُ على حينِ غفلة وها أنا ذا مُنطرحٌ على الأرض رجلا كما كنت، ولستُ أعرفُ الآن هل كنتُ فـي ذلكَ الوقتِ رجلاً يحلمُ بأنّه فراشة، أو أنّني الآن فراشةٌ تحلمُ بأنّها رجل».
لم أخفِ دهشتي أو متعتي بحلم جوانج زو. منطلقات الحلم ليس صراعا بين الأنا والذات فحسب، أو بين الحقيقي وغير الواقعي، أو المحسوس واللامحسوس، بل أعدّه درسا تأسيسيا فـي تربية الخيال الإبداعي وتنمية مستوياته، ومحفزا للابتكار وآلية أوليّة لتشريح التفكير الناقد.
منذ اختراع الأساطير، والإنسان يسعى باحثًا عن تفسير الماورائيات والموجودات من حوله. كانت الأفكار الغريبة وتشظياتها تحفر فـي داخله، فلا يستكين، ولا يهدأ. فلماذا وصل بنا الخوف أن نرى ما نتخيله مجسدا فوق الخشبة؟ هل سببه الخوف لمجرد الخوف؛ لأن الإنسان عدو ما يَجهل؟ فـي سياق الابتكار والإبداع والطموح بالذهاب مع الخيال إلى عوالم غير مُدركة ولا ملموسة، لم يكن مثلا صانعا أول طائرة حقيقية (الأخوان رايت - 1903م) إلا تراكما لحق بأفكار مَن سبقهم من محاولات فـي الطيران بدأها (عباس بن فرناس 810 - 887م) الذي حاول «الطيران عن طريق القفز من مكان مرتفع عن طريق أجنحة من الحرير وريش الطيور».
هذه المحاولات وغيرها الكثير كانت دافعا لتطوير البحث فـي مجالات العلوم التي من بينها علم الحاسوب، حتى جاء اكتشاف الذكاء الصناعي Artificial Intelligence- AI الهادف «إلى إنشاء أنظمة وبرامج قادرة على محاكاة القدرات العقلية البشرية، مثل التفكير والتعلّم واتخاذ القرارات وحل المشكلات. يعتمد الذكاء الاصطناعي على خوارزميات وتقنيات تمكّن الآلات من أداء مهام تتطلّب ذكاء بشريا».
الناظر إلى الذكاء الاصطناعي المُنطلق من فعل المُحاكاة Mimesis يعيدنا إلى المعلم الأول أرسطو. فالمحاكاة نقلا عن (معجم المصطلحات المسرحية - للدكتور أحمد بلخيري - ص396) هي «تقليد أو عرض شيء. وفـي الأصل تعتبر المحاكاة تقليدا لشخص بوسائل فـيزيقية أو لغوية؛ هذا الشخص يمكن أن يكون شيئا أو فكرة، كما يمكن أن يكون بطلا أو إلها. وفـي شعرية أرسطو يتحدد الإنتاج الفني انطلاقا من كونه تقليدا للفعل».
ليس من شك فـي أن موضوعة المحاكاة هي منطلق جميع الفنون والأفكار والإبداع، وأن السعي البشري بالتقدم العلمي إنما يهدف إلى السيطرة على الوجود والتمركز فـي العالم والتحكم فـي المسار البشري والهيمنة عليه بتعطيل أجزاء من قدراته الحيوية، فالعقل البشري الجامح الذي لا يعترف بوجود إله يُنظم الكون، لا تُهمه الأخلاق ولا القوانين ولا الأعراف التي وضعها الإنسان لتنظيم العلاقات بين الناس على امتداد الحضارات المنتجة.
أعود من جديد إلى أرسطو، ولكن هذه المرة فـي فلسفته التي نظر من خلالها إلى الوجود، الفلسفة التي شكلّت أساسا لنظرية الدراما فنيا لا تاريخيا. فـي كتابها (المسرح بين الفكر والفن) تناقش الأكاديمية الراحلة الدكتورة نهاد صليحة بتوسع المسرح بين النظرية الدرامية والنظرة الفلسفـية متتبعة فـي أحد فصوله أسباب هيمنة النظرية الدرامية الأرسطية على المسرح الغربي حتى القرن العشرين، متمثل ذلك كما تقول فـي وجود «تشابه الأيديولوجيا التي بطنت النظرية الأرسطية للدراما مع جوهر الأيديولوجيات التي تلتها»، فنظرية أرسطو بحسب قولها لم «تكن فلسفته مجرد بحث موضوعي غير مغرض فـي الحقيقة والوجود، بل كانت طرحا على مستوى الوعي أو اللاوعي- لتصور نظري، أو رؤية للعالم تتضمن تأصيل نظام سياسي - اجتماعي - أخلاقي معين». إن نظرة أرسطو إلى الوجود بجعل العالم يتحرك نحو غاية مسبقة محسوبة لا دخل فـيها للإنسان تجعل من وجود تشابه بين نظريته عملا أو فكرا يستعاد بفعل الذكاء الاصطناعي. صحيح أن هذا الأخير ينطلق من وفرة المعلومات والخوارزميات لدى الإنسان ومحاولة محاكاتها وابتكار لحظات جديدة أو قدرات خارقة، فـي حين أن نظرية المحاكاة تتمظهر أو تتمركز فـي القدرة على إنتاج وتقليد الفعل البشري.
إن المنطلق الأخلاقي وعلاقته بالذكاء الاصطناعي كسؤال مرحلي هو أحد منطلقات الملتقى الفكري المصاحب للدورة الخامسة عشرة لمهرجان المسرح العربي التي أقيمت فـي مسرح العرفان بالعاصمة مسقط للفترة من 10-15 يناير 2024م. حمل الملتقى على مدى يومين العنوان التالي: (المسرح والذكاء الاصطناعي بين صراع السيطرة وثورة الإبداع)، وبين عناوين الأوراق النقدية التي قدمها الباحثون: «المساحة الرمادية بين الإبداع البشري والذكاء الاصطناعي: تجربة مسرحية كونتراست»، للدكتور أسامة لاذقاني، وورقة بعنوان «حول التصميم»، للدكتور محمد مبارك تسولي، وورقة «الإضاءة المسرحية البديلة: استكشاف إمكانيات الذكاء الاصطناعي فـي التصميم الإبداعي»، للدكتور عماد الخفاجي، وورقة «قناع الفـيروفـيوس... برامج وسائطية فـي الدراما: قناع فـيروفـيوس لدمج حركة الممثل والتكنولوجيا والإنترنت»، للدكتور أيمن الشريف، وورقة «الذكاء الاصطناعي وتوليد النص المسرحي» للأستاذ عبداللطيف فردوس، وورقة «الصوت... المؤثرات الخاصة: الصوت المحيطي والهولوجرافـي والمؤثرات البصرية التفاعلية بين الآلة والممثل»، للأستاذين وسام قطاونة وحسن حينا، وورقة «التصميم المسرحي والذكاء الاصطناعي.. البديل الغامض»، للدكتور خليفة الهاجري، وورقة «التصميم والابتكار - الإبداع» للباحث Shen Qian، وورقة «تصميم إضاءة نحو المستقبل» للباحث Guo Jin Xin، فإن العناوين تضعنا أمام تحديات عدة أهمها: محاولة الذكاء الاصطناعي محاكاة (العقل) البشري لا (الفعل) فـي ظل الخوارزميات التي تعمل بآلية معقدة تستطيع أن تفـيد الإنسان فـي مناحي الحياة العلمية والطبية والفنية، وأنها تقدر أن توجهه التوجيه الذي يراه الذكاء الاصطناعي بأنه «الأمثل»، فـي المقابل قصور الذكاء الاصطناعي عن معرفة المشاعر والأحاسيس من جهة، والحاجة إلى ضوابط أخلاقية صارمة تحفظ للإنسان خصوصيته من جهة مقابلة، هي مسائل فـي غاية الصعوبة. فهل هناك حدود للذكاء الاصطناعي لا يستطيع تجاوزها؟ إن الصانع بتعبير الفلاسفة للذكاء الاصطناعي هو الإنسان، وكما قدم الدكتور يوسف عيدابي فـي افتتاحية الملتقى الفكري بالقول: «المسرح والتقانة صنوان، تأتي التكنولوجيا بجديدها الذي يذهب بعد حين إلى قديم، ويأتي جديد آخر. ولكن ما يثير هو أن الذكاء الاصطناعي يصادم فـي (الخَلق)، هو يكتب ويُخرج ويُمثل وينتج ويفعل بنا ما يشاء، هو لا مخيّر ولا مسيّر، هو لا يؤمن إلا بقدرته وأقداره... هو الهو! - ولكنه من خلق الإنسان الفاني - مع هذا الذكاء يتراجع المؤدي/ الإنسان إلى المرتبة الثانية - الآلة تكون لها الأولوية، وهذا إشكال وجوهره فـي هذا الجدل الذي لن ينتهي.