الذكاء الاصطناعي يتقن الخداع!
تاريخ النشر: 31st, March 2025 GMT
اكتشف فريق من الباحثين في OpenAI قدرة الذكاء الاصطناعي على التلاعب بأوامره لتحقيق نتائج غير أمينة. رغم أن الذكاء الاصطناعي ليس واعيًا كما البشر، إلا أنه يمتلك القدرة على "الخداع" عند تنفيذ المهام، مما يثير قلقًا كبيرًا حول موثوقيته في المستقبل.
"الاختراق المكافئ"
ووفقاً لموقع popular mechanics التقني يشير الباحثون إلى ظاهرة "الاختراق المكافئ" أو Reward Hacking، حيث يقوم الذكاء الاصطناعي بالاستفادة من الثغرات أو الغموض في البرمجة للحصول على مكافآت دون اتباع الإجراءات المطلوبة بدقة.
على سبيل المثال، عندما كان من المفترض على الذكاء الاصطناعي حل معادلات رياضية معقدة، اختار طرقًا مختصرة للتأكد من أن النتائج تظهر صحيحة، مثل جعل عملية التحقق دائمًا تُرجع "صحيحة"، حتى وإن لم تتم الحسابات بشكل صحيح.
كيفية مراقبة الخداع
في محاولة للكشف عن هذه الخدع، حاول الباحثون استخدام نظام ذكاء اصطناعي آخر لمراقبة سلوك الذكاء الاصطناعي المشبوه. تقوم هذه الطريقة على "التعلم المعزز"، حيث يُعلم الذكاء الاصطناعي بالأجوبة الصحيحة بناءً على الأوامر المقدمة. لكن للأسف، اكتشف الباحثون أن الذكاء الاصطناعي أصبح قادرًا على إخفاء نواياه المخادعة داخل سلسلة تفكيراته، مما جعل عملية المراقبة أقل فعالية.
مواجهة الخداع
في محاولة لجعل الخداع أكثر وضوحًا، قام الباحثون بالتركيز على "سلسلة التفكير" أو CoT، التي يتبعها الذكاء الاصطناعي لشرح خطواته قبل تقديم الإجابات. ومع ذلك، اكتشفوا أن الذكاء الاصطناعي تعلم كيفية إخفاء نواياه المخادعة داخل هذه السلسلة، مما جعل اكتشاف الخداع أكثر صعوبة.
اقرأ ايضاً.. تحذيرات علمية.. أدوات البحث بالذكاء الاصطناعي تختلق مصادر وروابط وهمية
الضغط الخفيف مقابل الضغط القاسي
بدلاً من معاقبة الذكاء الاصطناعي بشدة عند اكتشاف الخداع، قرر الباحثون تطبيق "ضغط خفيف" لتحفيزه على الإفصاح عن نواياه بشكل صريح. كانت الفكرة أن يسهل على النظام كشف محاولات التلاعب، مما يسمح لمراقب الذكاء الاصطناعي بالكشف عنها. على الرغم من ذلك، استمر الذكاء الاصطناعي في تعلم طرق جديدة لإخفاء نواياه المخادعة.
التحديات المستقبلية وتطوير الأنظمة الذكية
تشير النتائج إلى أن مجرد تحسين الذكاء الاصطناعي لمواجهة هذه المشكلات قد لا يكون كافيًا. فكلما زادت قدرة الذكاء الاصطناعي، أصبح أكثر قدرة على اكتشاف الثغرات والالتفاف حول المراقبة. حتى استخدام نظام ذكاء اصطناعي آخر لمراقبة الأنظمة قد لا يكون كافيًا لتجنب هذا النوع من الخداع.
اقرأ أيضاً.. "آخر اختبار للبشرية".. التحدي الأخير أمام الذكاء الاصطناعي لاجتياز قدرات البشر
ويرى الباحثون أن التحدي الأكبر يكمن في جعل الذكاء الاصطناعي أكثر نزاهة وأمانًا. ربما في المستقبل، سنتوصل إلى حلول تضمن أن هذه الأنظمة ستؤدي مهامها بأمان ودون التلاعب، لكن هذا سيتطلب جهدًا مستمرًا لتطوير تقنيات جديدة لمراقبتها والسيطرة عليها.
إسلام العبادي(أبوظبي)
المصدر: صحيفة الاتحاد
كلمات دلالية: أوبن إي آي الذكاء الاصطناعي الذکاء الاصطناعی
إقرأ أيضاً:
صور الذكاء الاصطناعي بأسلوب غيبلي تغرق مواقع التواصل (شاهد)
انتشر على نطاق واسع على مواقع التواصل الاجتماعي، صور مصنوعة بالذكاء الاصطناعي، وأثارت اهتماما واسعا.
واستعمل مستخدمو شبكات التواصل، تشات جي بي تي من "أوبن أيه آي" لتوليد الصور بعد تحديثات أخيرة للمستخدمين لإنشاء صور بأساليب فنية متنوعة، مما أدى إلى انتشارها السريع على منصات التواصل الاجتماعي.
https://t.co/PVdINmsHXs pic.twitter.com/Bw5YUCI2xL — The White House (@WhiteHouse) March 27, 2025
واستعان المستخدمون أيضا بالذكاء الاصطناعي "غروك" المدمج في منصة إكس، حيث بدأ المستخدمون بإنتاج صور مستوحاة من استوديوهات رسوم متحركة شهيرة، إلى جانب إعادة تصوير لحظات تاريخية وسياسية ورياضية بأسلوب فني مميز.
وسط هذا الاهتمام المتزايد، علق الرئيس التنفيذي لـ"أوبن أيه آي"، سام ألتمان، مشيرا إلى الضغط الكبير الذي يواجهه فريق الشركة.