لجريدة عمان:
2024-07-08@07:31:56 GMT

مشكلة حماية حقوق الذكاء الاصطناعي قابلة للحل

تاريخ النشر: 11th, December 2023 GMT

مايك لوكيدس وتيم أورايلي -

يعمل الذكاء الاصطناعي التوليدي على توسيع مدى قانون حقوق التأليف والنشر بطرق غير متوقعة وغير مريحة. أصدر مكتب حقوق التأليف والنشر في الولايات المتحدة مؤخرا توجيها ينص على أن نتاج الذكاء الاصطناعي المُوَلِّد للصور لا يحظى بحماية حقوق التأليف والنشر ما لم يدخل إبداع بشري في عمليات التلقين والأوامر الداخلة في توليده.

لكن هذا يُـغـفِـل أسئلة عديدة: ما هو مقدار الإبداع المطلوب، وهل هو من ذات النوع من الإبداع الذي يمارسه الفنان مستخدما فرشاة رسم؟

تتعامل مجموعة أخرى من الحالات مع النص (الروايات والروائيين)، حيث يزعم بعض الخبراء أن تدريب نموذج ما على مواد محمية بحقوق التأليف والنشر يُـعَـد في حد ذاته انتهاكا لحقوق التأليف والنشر، حتى لو لم تشتمل العملية على إعادة إنتاج تلك النصوص أبدا كجزء من مخرجاتها. لكن قراءة النصوص كانت جزءا من عملية التعلم البشري منذ وُجِـدَت اللغة المكتوبة. وفي حين ندفع المال لشراء الكتب، فإننا لا ندفع لنتعلم منها. كيف نفهم هذا؟ ماذا يجب أن يعني قانون حقوق التأليف والنشر في عصر الذكاء الاصطناعي؟ يقدم لنا الباحث في مجال التكنولوجيا جارون لانيير إجابة واحدة من خلال فكرته عن مكانة البيانات، التي تميز ضمنيا بين تدريب (أو «تعليم») نموذج وتوليد مخرجات باستخدام نموذج. يرى لانيير أن النشاط الأول يجب أن يكون محميا، في حين قد ينتهك الناتج بالفعل حقوق التأليف والنشر التي يملكها شخص ما. هذا التمييز جذاب لعدة أسباب. فأولا، يحمي قانون حقوق التأليف والنشر الحالي «الاستخدامات التحويلية... التي تضيف شيئا جديدا»، ومن الواضح تماما أن هذا هو ما تفعله نماذج الذكاء الاصطناعي. علاوة على ذلك، ليس الأمر كما لو أن النماذج اللغوية الضخمة (LLMs) مثل ChatGPT تحتوي على سبيل المثال على النص الكامل لروايات جورج رايـموند ريتشارد مارتن الخيالية، والتي تنسخ وتلصق منها بوقاحة. بل يتألف النموذج من مجموعة هائلة من المتغيرات والمعالم ــ استنادا إلى كل المحتوى المستوعب أثناء التدريب ــ التي تمثل احتمالية أن تتبع كلمة بعينها كلمة أخرى. عندما تُـخـرِج محركات الترجيح هذه قصيدة شكسبيرية لم يكتبها شكسبير قَـط، فإن هذه عملية تحويلية، حتى لو لم تكن القصيدة الجديدة جيدة على الإطلاق. يرى لانيير أن إنشاء نموذج أفضل هو منفعة عامة تخدم الجميع ــ حتى المؤلفين الذين تُستخدم أعمالهم لتدريب هذا النموذج. وهذا يجعلها عملية تحويلية وتستحق الحماية. لكن مفهومه لمكانة البيانات ينطوي على مشكلة (وهو ما يعترف به تماما): فمن المستحيل التمييز حقا بين «تدريب» نماذج الذكاء الاصطناعي الحالية و»توليد الناتج» بأسلوب الروائية جيسمين وارد على سبيل المثال.

يعمل مطورو الذكاء الاصطناعي على تدريب النماذج من خلال إعطائها قطع أصغر من المدخلات ومطالبتها بالتنبؤ بالكلمة التالية مليارات المرات، مع تعديل المؤشرات والمعالم قليلا على طول الطريق لتحسين التوقعات. لكن ذات العملية تُـسـتَـخـدَم بعد ذلك لتوليد الناتج، وهنا تكمن المشكلة من منظور حقوق التأليف والنشر.

يبدأ النموذج الذي يُطلب منه أن يكتب مثل شكسبير بكلمة «To»، مما يزيد قليلا من احتمالية أن يتبعها بكلمة «be»، وهذا بدوره يزيد قليلا من احتمالية أن تكون الكلمة التالية «or» ــ وهلم جرا. ولكن حتى مع ذلك، يظل من المستحيل ربط هذا الناتج مرة أخرى ببيانات التدريب. من أين جاءت كلمة «or»؟ في حين تصادف أنها الكلمة التالية في مناجاة هاملت الشهيرة، فإن النموذج لم يكن يحاكي هاملت. لقد اختار ببساطة كلمة «or» من بين مئات الآلاف من الكلمات التي كان بإمكانه اختيار أي منها، وكل ذلك بناء على إحصائيات. هذا ليس ما نعتبره نحن البشر إبداعا. يعمل هذا النموذج ببساطة على تعظيم احتمالية أن نجد نحن البشر ناتجه مفهوما. ولكن كيف يمكن إذا تعويض المؤلفين عن أعمالهم عندما يكون ذلك مناسبا؟ في حين قد لا يكون من الممكن تتبع المصدر باستخدام روبوتات الدردشة الحالية المعتمدة على الذكاء الاصطناعي التوليدي، فإن هذه ليست نهاية القصة.

خلال العام أو نحو ذلك الذي مَـرّ منذ إصدار ChatGPT، كان المطورون عاكفين على بناء تطبيقات إضافية على نماذج الأساس القائمة. ويستخدم كثيرون التوليد المعزز بالاسترجاع (RAG) للسماح للذكاء الاصطناعي «بالتعرف على» محتوى غير موجود في بيانات تدريبه. إذا كنت في احتياج إلى توليد نص لكتالوج مُـنـتَـج ما، فيمكنك تحميل بيانات شركتك ثم إرسالها إلى نموذج الذكاء الاصطناعي مع التعليمات: «استخدم فقط البيانات الواردة في هذا الطلب للرد». برغم أن التوليد المعزز بالاسترجاع مصمم كطريقة لاستخدام معلومات الـمِـلكية دون المرور بعملية التدريب التي تتطلب عمالة وحوسبة مكثفة، فإنه ينشئ أيضا بشكل تلقائي صِـلة بين استجابة النموذج والمستندات التي جرى إنشاء الاستجابة بالاستعانة بها. هذا يعني أننا أصبحنا الآن نمتلك مصدرا، وهو ما يقربنا كثيرا من تحقيق رؤية لانيير بشأن مكانة البيانات. إذا نشرنا برنامجا لتحويل العملات أنشأه مبرمج بشري في كتاب، وعمل نموذجنا اللغوي على إعادة إنتاجه ردا على سؤال، فيمكننا عزو ذلك إلى المصدر الأصلي وتخصيص حقوق التأليف على النحو اللائق. ينطبق الأمر ذاته على رواية مولدة بواسطة الذكاء الاصطناعي ومكتوبة بأسلوب جيسمين وارد (الممتاز)، في روايتها بعنوان «Sing, Unburied, Sing». تعد ميزة «النظرة العامة المعززة بالذكاء الاصطناعي» من Google مثالا جيدا لما يمكننا توقعه من التوليد المعزز بالاسترجاع. ولأن شركة Google تمتلك بالفعل أفضل محرك بحث في العالم، فيجب أن يكون محرك التلخيص الذي أنتجته قادرا على الاستجابة لأي طلب عن طريق إجراء بحث وإدخال أهم النتائج في النماذج اللغوية الضخمة لتوليد النظرة العامة التي طلبها المستخدم. يوفر النموذج اللغة والقواعد، لكنه يستمد المحتوى من المستندات المضمنة في الطلب الموجه. ومرة أخرى، هذا من شأنه أن يوفر المصدر المفقود. الآن بعد أن علمنا أنه من الممكن إنتاج مخرجات تحترم حقوق التأليف والنشر وتعوض المؤلفين، يتعين على الجهات التنظيمية أن تكثف جهودها لتحميل الشركات المسؤولية عن تقاعسها عن القيام بذلك، تماما كما تتحمل المسؤولية عن خطاب الكراهية وغيره من أشكال المحتوى غير اللائق. لا ينبغي لنا أن نقبل ادعاء كبار مقدمي خدمات النماذج اللغوية الضخمة بأن المهمة مستحيلة من الناحية الفنية. إنه في حقيقة الأمر مجرد تحد آخر من تحديات نماذج الأعمال والتحديات الأخلاقية الكثيرة التي يمكنهم، بل يتعين عليهم، التغلب عليها.

علاوة على ذلك، يقدم التوليد المعزز بالاسترجاع أيضا حلا جزئيا على الأقل لمشكلة «هلوسة» الذكاء الاصطناعي الحالية. إذا اسـتُـخـدِم أحد التطبيقات (مثل بحث جوجل) لتزويد نموذج ما بالبيانات اللازمة لبناء استجابة، تصبح احتمالية توليده لشيء خاطئ تماما أقل كثيرا مما لو كان يعتمد على بيانات تدريبه فحسب. وبالتالي يصبح من الممكن جعل ناتج الذكاء الاصطناعي أكثر دقة إذا اقتصر على مصادر معروفة بأنها جديرة بالثقة. لقد بدأنا للتو نرى ما يمكن إنتاجه بالاستعانة بهذا النهج. لا شك أن تطبيقات التوليد المعزز بالاسترجاع سوف تحتوي على طبقات أكثر تعددا وتزداد تعقيدا. ولكن الآن بعد أن أصبح لدينا الأدوات اللازمة لتتبع المصدر، لم يعد لدى شركات التكنولوجيا أي عذر يحول دون مساءلتها بشأن حقوق التأليف والنشر.

مايك لوكيدس نائب رئيس إستراتيجية المحتوى في شركة «O«Reilly Media

تيم أورايلي المؤسس والرئيس التنفيذي لشركة« O«Reilly Media وهو أستاذ زائر في معهد كلية لندن الجامعية للابتكار.

خدمة بروجيكت سنديكيت

المصدر: لجريدة عمان

كلمات دلالية: الذکاء الاصطناعی فی حین

إقرأ أيضاً:

الصين تتصدر براءات الإختراع في مجال الذكاء الاصطناعي التوليدي عالميًا

أظهر تقرير جديد صادر عن المنظمة العالمية للملكية الفكرية (الويبو) التابعة للأمم المتحدة، أن المخترعين المقيمين في الصين يقدمون أكبر عدد من براءات الاختراع المتعلقة بما يسمى "الذكاء الاصطناعي التوليدي".

وجاء على الموقع الرسمي للأمم المتحدة، أنه وفقا لتقرير واقع براءات الاختراع الصادر عن المنظمة، بين عامي 2014 و2023، صدرت أكثر من 38 ألف براءة اختراع في مجال الذكاء الاصطناعي التوليدي من الصين، أي ستة أضعاف تلك التي قدمها المخترعون في الولايات المتحدة، التي حلت في المركز الثاني.

ووفقا للتقرير، فإن الذكاء الاصطناعي التوليدي يتيح للمستخدمين إنشاء محتوى بما في ذلك النصوص أو الصور أو الموسيقى أو أكواد البرامج، مما يعمل على تشغيل مجموعة من المنتجات الصناعية والاستهلاكية، بما في ذلك روبوتات الدردشة مثل تشات جي بي تي أو جوجل جيميناي أو إيرني الصادر عن بايدو تغيير قواعد اللعبة.

من جانبه، قال دارين تانج، المدير العام للمنظمة العالمية للملكية الفكرية: "لقد برزت تقنية - الذكاء الاصطناعي التوليدي كتكنولوجيا غيرت قواعد اللعبة ولديها القدرة على تغيير الطريقة التي نعمل بها ونعيش ونلعب بها".

ووفقا لتقرير للمنظمة فإنه منذ تقديم بنية الشبكة العصبية العميقة في عام 2017 والتي أصبحت الآن مرادفة للذكاء الاصطناعي التوليدي، زاد عدد براءات اختراع الذكاء الاصطناعي التوليدي بأكثر من 800% حتى عام 2023.

ووفقا للتقرير، تمثل براءات اختراع الذكاء الاصطناعي التوليدي حاليا 6 % من جميع براءات اختراع الذكاء الاصطناعي على مستوى العالم.

وتصدرت الصين القائمة بـ( 38210 اختراعات) هذا المجال، متجاوزة بكثير الولايات المتحدة التي سجلت ( 6276 اختراعًا)، وكوريا الجنوبية (4155 اختراعا)، واليابان (3409 اختراعات)، والهند (1350 اختراعا).

 

 

 

مقالات مشابهة

  • الذكاء الاصطناعي تريند أم ثورة؟
  • سرقة أسرار أوبن إيه آي تعزز المخاوف من الذكاء الاصطناعي
  • آبل تتجه لدمج جيمينى لنظام التشغيل iOS 18
  • «الذكاء الاصطناعي» يدخل عصر «الروبوتات القاتلة»
  • بعد البرازيل.. تحقيق قضائي إسباني بشأن ميتا على خلفية الذكاء الاصطناعي
  • ممحاة يوتيوب.. أداة جديدة بالذكاء الاصطناعي لإزالة الموسيقى المحمية من الفيديو
  • الصين تتصدر براءات الإختراع في مجال الذكاء الاصطناعي التوليدي عالميًا
  • تحقيق قضائي إسباني ضد شركة "ميتا" على خلفية انتهاك الذكاء الاصطناعي حماية البيانات 
  • تحقيق قضائي إسباني بشأن "ميتا" بسبب الذكاء الاصطناعي
  • قراصنة يخترقون الذكاء الاصطناعي