مشكلة حماية حقوق الذكاء الاصطناعي قابلة للحل
تاريخ النشر: 11th, December 2023 GMT
مايك لوكيدس وتيم أورايلي -
يعمل الذكاء الاصطناعي التوليدي على توسيع مدى قانون حقوق التأليف والنشر بطرق غير متوقعة وغير مريحة. أصدر مكتب حقوق التأليف والنشر في الولايات المتحدة مؤخرا توجيها ينص على أن نتاج الذكاء الاصطناعي المُوَلِّد للصور لا يحظى بحماية حقوق التأليف والنشر ما لم يدخل إبداع بشري في عمليات التلقين والأوامر الداخلة في توليده.
تتعامل مجموعة أخرى من الحالات مع النص (الروايات والروائيين)، حيث يزعم بعض الخبراء أن تدريب نموذج ما على مواد محمية بحقوق التأليف والنشر يُـعَـد في حد ذاته انتهاكا لحقوق التأليف والنشر، حتى لو لم تشتمل العملية على إعادة إنتاج تلك النصوص أبدا كجزء من مخرجاتها. لكن قراءة النصوص كانت جزءا من عملية التعلم البشري منذ وُجِـدَت اللغة المكتوبة. وفي حين ندفع المال لشراء الكتب، فإننا لا ندفع لنتعلم منها. كيف نفهم هذا؟ ماذا يجب أن يعني قانون حقوق التأليف والنشر في عصر الذكاء الاصطناعي؟ يقدم لنا الباحث في مجال التكنولوجيا جارون لانيير إجابة واحدة من خلال فكرته عن مكانة البيانات، التي تميز ضمنيا بين تدريب (أو «تعليم») نموذج وتوليد مخرجات باستخدام نموذج. يرى لانيير أن النشاط الأول يجب أن يكون محميا، في حين قد ينتهك الناتج بالفعل حقوق التأليف والنشر التي يملكها شخص ما. هذا التمييز جذاب لعدة أسباب. فأولا، يحمي قانون حقوق التأليف والنشر الحالي «الاستخدامات التحويلية... التي تضيف شيئا جديدا»، ومن الواضح تماما أن هذا هو ما تفعله نماذج الذكاء الاصطناعي. علاوة على ذلك، ليس الأمر كما لو أن النماذج اللغوية الضخمة (LLMs) مثل ChatGPT تحتوي على سبيل المثال على النص الكامل لروايات جورج رايـموند ريتشارد مارتن الخيالية، والتي تنسخ وتلصق منها بوقاحة. بل يتألف النموذج من مجموعة هائلة من المتغيرات والمعالم ــ استنادا إلى كل المحتوى المستوعب أثناء التدريب ــ التي تمثل احتمالية أن تتبع كلمة بعينها كلمة أخرى. عندما تُـخـرِج محركات الترجيح هذه قصيدة شكسبيرية لم يكتبها شكسبير قَـط، فإن هذه عملية تحويلية، حتى لو لم تكن القصيدة الجديدة جيدة على الإطلاق. يرى لانيير أن إنشاء نموذج أفضل هو منفعة عامة تخدم الجميع ــ حتى المؤلفين الذين تُستخدم أعمالهم لتدريب هذا النموذج. وهذا يجعلها عملية تحويلية وتستحق الحماية. لكن مفهومه لمكانة البيانات ينطوي على مشكلة (وهو ما يعترف به تماما): فمن المستحيل التمييز حقا بين «تدريب» نماذج الذكاء الاصطناعي الحالية و»توليد الناتج» بأسلوب الروائية جيسمين وارد على سبيل المثال.
يعمل مطورو الذكاء الاصطناعي على تدريب النماذج من خلال إعطائها قطع أصغر من المدخلات ومطالبتها بالتنبؤ بالكلمة التالية مليارات المرات، مع تعديل المؤشرات والمعالم قليلا على طول الطريق لتحسين التوقعات. لكن ذات العملية تُـسـتَـخـدَم بعد ذلك لتوليد الناتج، وهنا تكمن المشكلة من منظور حقوق التأليف والنشر.
يبدأ النموذج الذي يُطلب منه أن يكتب مثل شكسبير بكلمة «To»، مما يزيد قليلا من احتمالية أن يتبعها بكلمة «be»، وهذا بدوره يزيد قليلا من احتمالية أن تكون الكلمة التالية «or» ــ وهلم جرا. ولكن حتى مع ذلك، يظل من المستحيل ربط هذا الناتج مرة أخرى ببيانات التدريب. من أين جاءت كلمة «or»؟ في حين تصادف أنها الكلمة التالية في مناجاة هاملت الشهيرة، فإن النموذج لم يكن يحاكي هاملت. لقد اختار ببساطة كلمة «or» من بين مئات الآلاف من الكلمات التي كان بإمكانه اختيار أي منها، وكل ذلك بناء على إحصائيات. هذا ليس ما نعتبره نحن البشر إبداعا. يعمل هذا النموذج ببساطة على تعظيم احتمالية أن نجد نحن البشر ناتجه مفهوما. ولكن كيف يمكن إذا تعويض المؤلفين عن أعمالهم عندما يكون ذلك مناسبا؟ في حين قد لا يكون من الممكن تتبع المصدر باستخدام روبوتات الدردشة الحالية المعتمدة على الذكاء الاصطناعي التوليدي، فإن هذه ليست نهاية القصة.
خلال العام أو نحو ذلك الذي مَـرّ منذ إصدار ChatGPT، كان المطورون عاكفين على بناء تطبيقات إضافية على نماذج الأساس القائمة. ويستخدم كثيرون التوليد المعزز بالاسترجاع (RAG) للسماح للذكاء الاصطناعي «بالتعرف على» محتوى غير موجود في بيانات تدريبه. إذا كنت في احتياج إلى توليد نص لكتالوج مُـنـتَـج ما، فيمكنك تحميل بيانات شركتك ثم إرسالها إلى نموذج الذكاء الاصطناعي مع التعليمات: «استخدم فقط البيانات الواردة في هذا الطلب للرد». برغم أن التوليد المعزز بالاسترجاع مصمم كطريقة لاستخدام معلومات الـمِـلكية دون المرور بعملية التدريب التي تتطلب عمالة وحوسبة مكثفة، فإنه ينشئ أيضا بشكل تلقائي صِـلة بين استجابة النموذج والمستندات التي جرى إنشاء الاستجابة بالاستعانة بها. هذا يعني أننا أصبحنا الآن نمتلك مصدرا، وهو ما يقربنا كثيرا من تحقيق رؤية لانيير بشأن مكانة البيانات. إذا نشرنا برنامجا لتحويل العملات أنشأه مبرمج بشري في كتاب، وعمل نموذجنا اللغوي على إعادة إنتاجه ردا على سؤال، فيمكننا عزو ذلك إلى المصدر الأصلي وتخصيص حقوق التأليف على النحو اللائق. ينطبق الأمر ذاته على رواية مولدة بواسطة الذكاء الاصطناعي ومكتوبة بأسلوب جيسمين وارد (الممتاز)، في روايتها بعنوان «Sing, Unburied, Sing». تعد ميزة «النظرة العامة المعززة بالذكاء الاصطناعي» من Google مثالا جيدا لما يمكننا توقعه من التوليد المعزز بالاسترجاع. ولأن شركة Google تمتلك بالفعل أفضل محرك بحث في العالم، فيجب أن يكون محرك التلخيص الذي أنتجته قادرا على الاستجابة لأي طلب عن طريق إجراء بحث وإدخال أهم النتائج في النماذج اللغوية الضخمة لتوليد النظرة العامة التي طلبها المستخدم. يوفر النموذج اللغة والقواعد، لكنه يستمد المحتوى من المستندات المضمنة في الطلب الموجه. ومرة أخرى، هذا من شأنه أن يوفر المصدر المفقود. الآن بعد أن علمنا أنه من الممكن إنتاج مخرجات تحترم حقوق التأليف والنشر وتعوض المؤلفين، يتعين على الجهات التنظيمية أن تكثف جهودها لتحميل الشركات المسؤولية عن تقاعسها عن القيام بذلك، تماما كما تتحمل المسؤولية عن خطاب الكراهية وغيره من أشكال المحتوى غير اللائق. لا ينبغي لنا أن نقبل ادعاء كبار مقدمي خدمات النماذج اللغوية الضخمة بأن المهمة مستحيلة من الناحية الفنية. إنه في حقيقة الأمر مجرد تحد آخر من تحديات نماذج الأعمال والتحديات الأخلاقية الكثيرة التي يمكنهم، بل يتعين عليهم، التغلب عليها.
علاوة على ذلك، يقدم التوليد المعزز بالاسترجاع أيضا حلا جزئيا على الأقل لمشكلة «هلوسة» الذكاء الاصطناعي الحالية. إذا اسـتُـخـدِم أحد التطبيقات (مثل بحث جوجل) لتزويد نموذج ما بالبيانات اللازمة لبناء استجابة، تصبح احتمالية توليده لشيء خاطئ تماما أقل كثيرا مما لو كان يعتمد على بيانات تدريبه فحسب. وبالتالي يصبح من الممكن جعل ناتج الذكاء الاصطناعي أكثر دقة إذا اقتصر على مصادر معروفة بأنها جديرة بالثقة. لقد بدأنا للتو نرى ما يمكن إنتاجه بالاستعانة بهذا النهج. لا شك أن تطبيقات التوليد المعزز بالاسترجاع سوف تحتوي على طبقات أكثر تعددا وتزداد تعقيدا. ولكن الآن بعد أن أصبح لدينا الأدوات اللازمة لتتبع المصدر، لم يعد لدى شركات التكنولوجيا أي عذر يحول دون مساءلتها بشأن حقوق التأليف والنشر.
مايك لوكيدس نائب رئيس إستراتيجية المحتوى في شركة «O«Reilly Media
تيم أورايلي المؤسس والرئيس التنفيذي لشركة« O«Reilly Media وهو أستاذ زائر في معهد كلية لندن الجامعية للابتكار.
خدمة بروجيكت سنديكيت
المصدر: لجريدة عمان
كلمات دلالية: الذکاء الاصطناعی فی حین
إقرأ أيضاً:
"تيك توك" تطلق أداة لإنشاء مقاطع تسويقية باستخدام الذكاء الاصطناعي
تابع أحدث الأخبار عبر تطبيق
أعلنت تيك توك، الخميس، عن طرح أداة جديدة للمسوقين على منصتها، تهدف إلى تسهيل إنشاء مقاطع تسويقية باستخدام الذكاء الاصطناعي.
ويأتي هذا الإعلان في وقت تشهد فيه صناعة الإعلان تحولًا كبيرًا نحو الاستفادة من التقنيات الحديثة، حيث تسمح الأداة التي تحمل اسم Symphony Creative Studio "سيمفوني كرييتيف ستوديو" للمعلنين بإنشاء إعلانات متطورة بفضل الذكاء الاصطناعي.
تتيح هذه الأداة للمعلنين استخدام الصور ومقاطع الفيديو المرخصة من وكالة غيتي، لتوليد رسائل تسويقية متكاملة، بما في ذلك محتوى يظهر شخصيات تشبه الأشخاص الحقيقيين، مما يفتح المجال أمام أفكار إبداعية جديدة وفعّالة في الإعلان. ورغم عدم الكشف عن التفاصيل المالية للصفقة بين تيك توك وغيتي، فإن هذه الخطوة تشير إلى تحول مهم في كيفية إنشاء المحتوى الترويجي باستخدام الذكاء الاصطناعي.
ويأتي هذا التعاون في إطار جهود تيك توك لتوسيع أدواتها الخاصة بالمعلنين وصنّاع المحتوى، وهو جزء من استراتيجية المنصة المملوكة للصين لتعزيز التفاعل بين العلامات التجارية والجماهير. في هذا السياق، قال آندي يانغ، رئيس قسم تحقيق الدخل من المنتجات الإبداعية في تيك توك: "نهدف إلى تمكين المعلنين ومساعدتهم على التواصل مع مجتمعاتهم بقوة الذكاء الاصطناعي التوليدي".
كما أن هذه الخطوة تتماشى مع توجهات أخرى لشركات الإعلان الكبرى مثل أمازون وغوغل وميتا، التي أطلقت أدوات مشابهة لتسهيل إنشاء الإعلانات باستخدام الذكاء الاصطناعي.
من جهة أخرى، أبدى البعض في مجال صناعة المحتوى تحفظاتهم حيال استخدام الذكاء الاصطناعي في التدريب على البيانات الإبداعية دون إذن أو تعويض مناسب، مما أدى إلى زيادة الدعوات القضائية في هذا المجال، مثل تلك التي رفعتها نيويورك تايمز للدفاع عن محتواها.
بذلك، تفتح تيك توك أفقًا جديدًا أمام المعلنين باستخدام تقنيات الذكاء الاصطناعي، بينما يستمر الجدل حول تأثير هذه الأدوات على صناعة المحتوى التقليدية.