الذكاء الاصطناعي التوليدي يستعين بالكتب لتطوير برامجه
تاريخ النشر: 22nd, November 2024 GMT
مع تزايد احتياجات الذكاء الاصطناعي التوليدي، بدأت أوساط قطاع النشر هي الأخرى في التفاوض مع المنصات التي توفر هذه التقنية سعيا إلى حماية حقوق المؤلفين، وإبرام عقود مع الجهات المعنية بتوفير هذه الخدمات لتحقيق المداخيل من محتواها.
واقترحت دار نشر "هاربر كولينز" الأميركية الكبرى أخيرا على بعض مؤلفيها عقدا مع إحدى شركات الذكاء الاصطناعي تبقى هويتها طي الكتمان، يتيح لهذه الشركة استخدام أعمالهم المنشورة لتدريب نماذجها القائمة على الذكاء الاصطناعي التوليدي.
في رسالة اطلعت عليها وكالة فرانس برس، عرضت شركة الذكاء الاصطناعي 2500 دولار أميركي لكل كتاب تختاره لتدريب نموذجها اللغوي "ال ال ام" لمدة ثلاث سنوات.
ولكي تكون برامج الذكاء الاصطناعي قادرة على إنتاج مختلف أنواع المحتوى بناء على طلب بسيط بلغة يومية، ينبغي تغذيتها بكمية متزايدة من البيانات.
بعد التواصل مع دار النشر، أكدت الأخيرة الموافقة على العملية. وتشير إلى أنّ "هاربر كولينز أبرمت عقدا مع إحدى شركات التكنولوجيا المتخصصة بالذكاء الاصطناعي للسماح بالاستخدام المحدود لكتب معينة (...) بهدف تدريب نماذج الذكاء الاصطناعي وتحسين أدائها".
وتوضح دار النشر أيضا أنّ العقد "ينظّم بشكل واضح ما تنتجه النماذج مع احترامها حقوق النشر".
- مواد جديدة
ومع أنّ "هاربر كولينز" هي إحدى كبرى دور النشر التي أبرمت عقودا من هذا النوع، لكنّها ليست الأولى. فدار "ويلي" الأميركية الناشرة للكتب العلمية أتاحت لشركة تكنولوجية كبيرة "محتوى كتب أكاديمية ومهنية منشورة لاستخدام محدد في نماذج التدريب"، مقابل 23 مليون دولار، على ما قالت في مارس عند عرض نتائجها المالية.
يسلط هذا النوع من الاتفاقيات الضوء على المشاكل المرتبطة بتطوير الذكاء الاصطناعي التوليدي، الذي يتم تدريبه على كميات هائلة من البيانات تُجمع من الانترنت، وهو ما قد يؤدي إلى انتهاكات لحقوق الطبع والنشر.
ترى جادا بيستيلي، رئيسة قسم الأخلاقيات لدى "هاغينغ فايس"، وهي منصة فرنسية أميركية متخصصة بالذكاء الاصطناعي، أنّ هذا الإعلان يشكل خطوة إلى الأمام، لأنّ محتوى الكتب يدرّ أموالا. لكنها تأسف لأنّ هامش التفاوض محدود للمؤلفين.
وتقول "ما سنراه هو آلية لاتفاقيات ثنائية بين شركات التكنولوجيا ودور النشر أو أصحاب حقوق الطبع والنشر، في حين ينبغي أن تكون المفاوضات أوسع لتشمل أصحاب العلاقة".
يقول جوليان شوراكي المدير القانوني لاتحاد النشر الفرنسي "نبدأ من مكان بعيد جدا"، مضيفا "إنّه تقدم، فبمجرّد وجود اتفاق يعني أن حوارا ما انعقد وثمة رغبة في تحقيق توازن في ما يخص استخدام البيانات كمصدر، والتي تخضع للحقوق والتي ستولد مبالغ".
في ظل هذه المسائل، بدأ الناشرون الصحافيون أيضا في تنظيم هذا الموضوع. ففي نهاية 2023، أطلقت صحيفة "نيويورك تايمز" الأميركية اليومية ملاحقات ضد شركة "اوبن ايه آي" مبتكرة برنامج "تشات جي بي تي" بتهمة انتهاك حقوق النشر. وقد أبرمت وسائل إعلام أخرى اتفاقيات مع "اوبن ايه آي".
وربما لم يعد أمام شركات التكنولوجيا أي خيار لتحسين منتجاتها سوى باعتماد خيارات تُلزمها دفع أموال، خصوصا مع بدء نفاد المواد الجديدة لتشغيل النماذج.
وأشارت الصحافة الأميركية أخيرا إلى أنّ النماذج الجديدة قيد التطوير تبدو وكأنها وصلت إلى حدودها القصوى.
يقول جوليان شوراكي "يمكن على شبكة الإنترنت، جمع المحتوى القانوني وغير القانوني، وكميات كبيرة من المحتوى المقرصن، مما يشكل مشكلة قانونية. هذا من دون أن ننسى مسألة نوعية البيانات". أخبار ذات صلة طحنون بن زايد يبحث مع بيل غيتس دور الذكاء الاصطناعي في تعزيز التنمية المستدامة أكاديمية CNN أبوظبي تستضيف بيل غيتس لإلقاء محاضرة عن الذكاء الاصطناعي المصدر: آ ف ب
المصدر: صحيفة الاتحاد
كلمات دلالية: نماذج الذكاء الاصطناعي التوليدية الذكاء الاصطناعي الذكاء الاصطناعي التوليدي دور النشر المكتبات الذکاء الاصطناعی التولیدی
إقرأ أيضاً:
3 اكتشافات تمت بفضل الذكاء الاصطناعي في 2024
وفي السطور التالية نرصد أبرز تلك الاكتشافات: مخطوطات هيركولانيوم تمكن ثلاثة من الباحثين من من الكشف عن محتوى مخطوطات هيركولانيوم المتفحمة والتي لم تكن قابلة للقراءة، بفضل أدوات الذكاء الاصطناعي.
وكانت هذه المخطوطات الهشة عُرضة للتفتت، كما أن لونها الأسود جعل من الصعب قراءة أي كتابات عليها، ولكن بفضل الذكاء الاصطناعي والأشعة السينية عالية الدقة، تم فك شفرة أكثر من 2000 حرف داخل المخطوطات.
وكان هذا الإنجاز كشف عن أول مقاطع كاملة من البرديات التي نجت من ثوران جبل فيزوف في عام 79 بعد الميلاد، ضمن بعض القطع الأثرية المتعلقة بروما القديمة واليونان، التي تم إنقاذها مما يُعتقد أنه منزل والد زوجة يوليوس قيصر.
وعن الطريقة التي تم بها فك رموز الكتابة، قال أستاذ علوم الكمبيوتر في جامعة كنتاكي والذي يعمل على فك شفرة المخطوطات منذ أكثر من عقد من الزمان، برنت سيلز، إن الكتابة تكون موجودة في المخطوطات ولكنها تكون مدفونة ومموهة في الورق.
ومن خلال الذكاء الاصطناعي يتم تكثيف هذه الكتابة وتضخيم قابلية قراءة الحبر، وفق سيلز.
التعرف على لغة الحيتان توصل العلماء من قبل إلى أن الأصوات التي تنتجها حيتان العنبر تختلف في طولها الموجي وإيقاعها، ولكن دلالة هذه اللغة ظلت لغزًا محيرًا بالنسبة للعلماء.
ولكن الذكاء الاصطناعي ساعد على تحليل نحو 9000 تسلسل نقرات مسجلة، تسمى الكودات، والتي تمثل أصوات حوالي 60 حوتًا من حيتان العنبر في البحر الكاريبي.
وسمح هذا التقدم في جعل لغة الحيتان قابلة في يومًا ما للتفسير بجانب بعض الحيوانات الأخرى.
وفي التجربة، قام العلماء برصد نهاية أصوات الحيتان، وخلال تبادل النداء، وكذلك الاستجابات بين الكائنات البحرية العملاقة.
ومن خلال عرض تلك الأصوات على أدوات الذكاء الاصطناعي، نتجت أنماط مقطعية أشبه بالأصوات التي ينتجها البشر.
واكتشفت البرامج 18 نوعًا من الإيقاع (تسلسل الفواصل الزمنية بين النقرات)، وخمسة أنواع من السرعة (مدة الكودا بأكملها)، وثلاثة أنواع من الروباتو (الاختلافات في المدة)، ونوعين من الزخارف “نقرة إضافية” تمت إضافتها في نهاية الكودا في مجموعة من الكودات الأقصر.
ويسعى العلماء في المراحل المقبلة لإجراء اختبارات تفاعلية مع الحيتان مع مراقبة سلوكها، بما يفتح الباب لفهم لغتها بشكل كامل.
كشف المواقع الأثرية على غرار المخطوطات الورقية، يعمل الذكاء الاصطناعي حاليًا على كشف المواقع الأثرية والرموز الغامضة المدفونة تحت الأرض في صحراء نازكا في بيرو.
وقديمًا، قضى العلماء ما يقرب من نصف قرن في الكشف عن تلك الآثار وتوثيقها. وغالبًا ما تكون الصور التوضيحية الممتدة، والتي لا يمكن رؤيتها إلا من الأعلى، تصور تصميمات هندسية وأشكال تشبه البشر وحتى حوت قاتل يحمل سكينًا.
وقام العماء بقيادة ماساتو ساكاي، أستاذ علم الآثار في جامعة ياماغاتا اليابانية، بتدريب نموذج الذكاء الاصطناعي لاكتشاف نحو 430 رمزًا من خلال التقاط صور عالية الدقة لها.
وخلال الفترة بين سبتمبر 2022 وفبراير 2023، بدأ الفريق في التأكد من صحة هذه الرموز عن طريق مسح شامل لصحراء نازكا من خلال الطائرات بدون طيار. ونجح العلماء في إثبات صحة نحو 303 من الرسوم الجيوجليفية التصويرية، مما أدى إلى مضاعفة عدد الرسوم الجيوجليفية المعروفة تقريبًا في غضون أشهر