اتهم Freelancer شركة Anthropic، وهي شركة الذكاء الاصطناعي الناشئة التي تقف وراء نماذج لغة Claude الكبيرة، بتجاهل بروتوكول "عدم الزحف" الخاص بها robots.txt لكشط بيانات مواقع الويب الخاصة بها. وفي الوقت نفسه، قال الرئيس التنفيذي لشركة iFixit كايل وينز إن Anthropic تجاهلت سياسة الموقع التي تحظر استخدام محتواها لتدريب نموذج الذكاء الاصطناعي.

أخبر مات باري، الرئيس التنفيذي لشركة Freelancer، The Information أن ClaudeBot من Anthropic هو "أكثر أداة كشط عدوانية على الإطلاق". يُزعم أن موقعه على الويب حصل على 3.5 مليون زيارة من أداة الزحف الخاصة بالشركة في غضون أربع ساعات، وهو "ربما حوالي خمسة أضعاف حجم أداة الزحف الثانية للذكاء الاصطناعي". وبالمثل، نشر وينز على X/Twitter أن روبوت Anthropic ضرب خوادم iFixit مليون مرة في 24 ساعة. "أنت لا تأخذ محتوانا دون دفع فحسب، بل إنك تربط مواردنا في مجال التطوير والعمليات"، كما كتب.

في يونيو الماضي، اتهمت Wired شركة ذكاء اصطناعي أخرى، Perplexity، بتتبع موقعها على الويب على الرغم من وجود بروتوكول استبعاد الروبوتات، أو robots.txt. يحتوي ملف robots.txt عادةً على تعليمات لبرامج الزحف على الويب حول الصفحات التي يمكنها الوصول إليها والصفحات التي لا يمكنها الوصول إليها. في حين أن الامتثال طوعي، إلا أنه تم تجاهله في الغالب من قبل الروبوتات السيئة. بعد نشر مقال Wired، ذكرت شركة ناشئة تسمى TollBit تربط شركات الذكاء الاصطناعي بناشري المحتوى أن Perplexity ليست هي الوحيدة التي تتجاوز إشارات robots.txt. وبينما لم تذكر أسماء، قالت Business Insider إنها علمت أن OpenAI وAnthropic يتجاهلان البروتوكول أيضًا.

قال باري إن Freelancer حاول رفض طلبات وصول الروبوت في البداية، لكنه اضطر في النهاية إلى حظر برنامج الزحف الخاص بـ Anthropic بالكامل. "هذا كشط فظيع [يجعل] الموقع أبطأ لكل من يعمل عليه ويؤثر في النهاية على إيراداتنا"، أضاف. أما بالنسبة لـ iFixit، قال وينز إن الموقع قد ضبط تنبيهات لحركة مرور عالية، واستيقظ موظفوه في الساعة 3 صباحًا بسبب أنشطة Anthropic. توقف برنامج الزحف الخاص بالشركة عن كشط iFixit بعد أن أضاف سطرًا في ملف robots.txt الخاص به يحظر روبوت Anthropic، على وجه الخصوص.

أخبرت شركة الذكاء الاصطناعي الناشئة The Information أنها تحترم ملف robots.txt وأن برنامج الزحف الخاص بها "احترم هذه الإشارة عندما نفذته iFixit". كما قالت إنها تهدف إلى "الحد الأدنى من الاضطراب من خلال التفكير في مدى سرعة [زحفها] إلى نفس المجالات"، وهذا هو السبب في أنها تحقق الآن في القضية.

تستخدم شركات الذكاء الاصطناعي برامج الزحف لجمع المحتوى من مواقع الويب التي يمكنها استخدامها لتدريب تقنيات الذكاء الاصطناعي التوليدية الخاصة بها. لقد كانوا هدفًا لدعاوى قضائية متعددة نتيجة لذلك، حيث اتهمهم الناشرون بانتهاك حقوق النشر. ولمنع رفع المزيد من الدعاوى القضائية، كانت شركات مثل OpenAI تبرم صفقات مع الناشرين ومواقع الويب. ومن بين شركاء المحتوى في OpenAI، حتى الآن، News Corp وVox Media وFinancial Times وReddit. ويبدو أن Wiens من iFixit منفتح على فكرة توقيع صفقة لمقالات موقع الويب الخاص بكيفية الإصلاح أيضًا، حيث أخبر Anthropic في تغريدة أنه على استعداد لإجراء محادثة حول ترخيص المحتوى للاستخدام التجاري.

المصدر: بوابة الوفد

كلمات دلالية: الذکاء الاصطناعی

إقرأ أيضاً:

الذكاء الاصطناعي يفضّل الاستشهاد بالمحتوى الصحفي

وجد تقرير حديث صادر عن منصة "موك راك" أن نماذج الذكاء الاصطناعي التوليدي الرئيسية تستشهد بالصحافة في ما يقارب نصف الردود على الأسئلة التي توجه إليها، وتحتاج إلى معلومات حديثة.

ويُعدّ المحتوى الصحفي جزءا لا يتجزأ من إجابات أدوات الذكاء الاصطناعي التوليدي، وفقًا لتقرير منصة "موك راك" الأميركية التي تعتبر أداة للتواصل الفعال داخل صناعة الإعلام، وتوفر للصحفيين قاعدة بيانات برمجية وإعلامية تحتوي على ملفات تعريفية.

اقرأ أيضا list of 2 itemslist 1 of 2دراسة: الجمهور يرغب في عناوين بسيطة ومباشرة على عكس الصحفيينlist 2 of 2شبكة الجزيرة تحذر من استهداف صحفييها في غزة بتحريض من الاحتلالend of list

وحلل مؤلفو التقرير الذي نُشر هذا الأسبوع، أكثر من مليون استشهاد ناتج عن نماذج الذكاء الاصطناعي التوليدي. وتم الاستشهاد بالمحتوى الصحفي أكثر من 27% من المرات في جميع اختبارات المنصة المذكورة، التي طلب السائلون فيها معلومات حديثة.

وبحسب التقرير فقد قفز الرقم إلى 49%، عندما يتعلق الأمر بالاستعلامات التي تضمنت "مستوى من الحداثة" على أسئلة مثل "أحدث التطورات في أساليب العلاج الخارجي لإدمان المخدرات".

أفضل ستة منافذ إعلامية استشهد بها كل نموذج هي وكالة رويترز، وصحيفتا فاينانشال تايمز، وتايم، وفوربس، وأكسيوس، وقد ظهرت في كل من قائمتي تشات جي بي تي وجيمناي.

بواسطة تقرير موك راك

وبحسب الدراسة وبخصوص استشهادات المحتوى الصحفي، بدا أن نماذج الذكاء الاصطناعي تُفضل القصص المنشورة خلال الاثني عشر شهرا الماضية. وينطبق هذا خاصة على تشات جي بي تي الذي نُشرت 56% من استشهاداته الصحفية خلال العام الماضي. أما بالنسبة لنموذج كلود وهو نموذج لغوي كبير من تطوير شركة أنثروبيك، فقد بلغت هذه النسبة 36% فقط من إجمالي الاستشهادات.

كما وجدت منصة موك راك، أن نوع السؤال المطروح على نماذج الذكاء الاصطناعي غيّر مصادر الاستشهاد بشكل كبير. فالأسئلة الذاتية، مثل الاستفسارات التي تطلب نصائح أو تعليمات خطوة بخطوة، استُمدت بشكل أكبر من "مدونات ومحتوى الشركات".

إعلان

ولاحظ التقرير، أن أفضل ستة منافذ إعلامية استشهد بها كل نموذج، هي وكالة رويترز، وصحيفتا فايننشال تايمز، وتايم، وفوربس، وأكسيوس، وقد ظهرت في كل من قائمتي تشات جي بي تي وجيمناي.

مقالات مشابهة

  • حوارٌ مثيرٌ مع الذكاء الاصطناعي
  • هل تنفجر معدلات النمو الاقتصادي في زمن الذكاء الاصطناعي؟
  • القبض على فتي بتهمة تزوير صور عارية لزميلاته باستخدام الذكاء الاصطناعي
  • دليل الويب.. جوجل تعيد ابتكار نتائج البحث بالذكاء الاصطناعي
  • الشرطة الإسبانية تحقق مع طالب استخدم الذكاء الاصطناعي لتزييف صور زميلاته
  • «جوجل» تطلق «مرشد الويب» لتنظيم نتائج البحث المعقدة بالذكاء الاصطناعي
  • دعوة لمقاربة شاملة لتنظيم الذكاء الاصطناعي
  • الجدل الاقتصادي في شأن الذكاء الاصطناعي 1/5
  • الذكاء الاصطناعي يفضّل الاستشهاد بالمحتوى الصحفي
  • البشر يتبنون لغة الذكاء الاصطناعي دون أن يشعروا