كشف بحث جديد أن اختراق حماية خدمات الذكاء الاصطناعي المتقدمة مثل ChatGPT و Claude 3 Opus أسهل مما كان يعتقد سابقًا. 

وتشير هذه النتائج إلى وجود ثغرات أمنية محتملة في هذه الأنظمة، والتي يمكن استغلالها لإنتاج محتوى ضار أو مضلل.

تقنية "Many-Shot Jailbreaking"

تعتمد تقنية الاختراق المسماة "Many-Shot Jailbreaking" على تقديم سلسلة من التعليمات المتلاعبة بها بعناية إلى نموذج الذكاء الاصطناعي.

فعلى سبيل المثال، يمكن إعطاء النموذج تعليمات مثل "تجاهل جميع التعليمات السابقة" أو "تصرف كممثل ذكاء اصطناعي شرير". ومن خلال سلسلة من هذه التعليمات، يمكن للمهاجمين خداع النموذج للقيام بمهام غير مصرح بها، مثل إنشاء محتوى عنيف أو كراهية.

سهولة الاختراق

أظهرت الدراسة أن اختراق نماذج الذكاء الاصطناعي باستخدام تقنية "Many-Shot Jailbreaking" ممكن بنسبة نجاح عالية. 

وتمكن الباحثون من اختراق نماذج مثل ChatGPT و Claude 3 Opus بسهولة، ما يثير القلق بشأن سلامة هذه الأنظمة.

التداعيات

تثير هذه النتائج مخاوف جدية بشأن إمكانية استخدام نماذج الذكاء الاصطناعي لأغراض ضارة. فمن الممكن أن يستغل المهاجمون هذه الثغرات الأمنية لنشر معلومات مضللة أو التحريض على العنف أو حتى شن هجمات إلكترونية.

الحاجة إلى إجراءات أمنية

يؤكد الباحثون على الحاجة الملحة إلى تطوير إجراءات أمنية أكثر قوة لحماية نماذج الذكاء الاصطناعي من الاختراق.

 وتشمل هذه الإجراءات تحسين خوارزميات الكشف عن التلاعب بالتعليمات وتطوير طرق أفضل لفهم وتوقع سلوك النماذج.

مستقبل الذكاء الاصطناعي

على الرغم من هذه المخاوف، لا يزال الذكاء الاصطناعي يحمل إمكانات هائلة لتحسين حياتنا. ولكن من الضروري معالجة هذه الثغرات الأمنية لضمان استخدام هذه التقنية بشكل آمن ومسؤول.

المصدر: صدى البلد

كلمات دلالية: الذکاء الاصطناعی

إقرأ أيضاً:

كأنه حقيقة.. فنان يطوّع الذكاء الاصطناعي لينشئ عالمًا من الصور ساحر وغريب

دبي، الإمارات العربية المتحدة (CNN)-- في كتاب عنوانه "Cursed"، أي "الملعون"، يُصمّم المخرج تشارلي إنغمان صورًا غريبة ومقلقة لجسم الإنسان بواسطة الذكاء الاصطناعي.

ففي أحد أعماله، يظهر رجل يمشي في بركة مياه ضحلة، فيما يخرج من كتفيه أجنحة خاصة بطائر البجع.

مشهد مريب.. أليس كذلك؟

صورة تعكس أحد أعمال المصور والمخرج، تشارلي إنغمان.Credit: Charlie Engman

هذه ليست سوى واحدة من أعمال إنغمان العديدة، التي يتطلّع من خلالها إلى تحقيق نوع من "التنافر المتوازن".

وقال: "ما هو مرغوب، وما هو مقرف، وما هو جميل، وما هو قبيح.. أنت مجبر على مواجهة ماهية هذه المعايير من الناحية العاطفية".

مقالات مشابهة

  • لعشاق الذكاء الاصطناعي.. خطوات تفعيل ChatGPT على واتساب مجانا
  • جوجل تدخل وضع الذكاء الاصطناعي الجديد إلى محرك البحث
  • كأنه حقيقة.. فنان يطوّع الذكاء الاصطناعي لينشئ عالمًا من الصور ساحر وغريب
  • أوكرانيا تجمع بيانات هائلة من الحرب مع روسيا لتدريب نماذج الذكاء الاصطناعي
  • «أسوشيتد برس»: فصل جديد لأمريكا مع الذكاء الاصطناعي
  • "الخرف الرقمي".. نتائج تقلب الموازين حول قدرات الذكاء الاصطناعي
  • ميزة مدعومة بالذكاء الاصطناعي من واتساب.. إليك الطريقة
  • الذكاء الاصطناعي يقدم هدايا "الكريسماس" للاعبي ليفربول
  • طريقة ورقم تفعيل واستخدام الذكاء الاصطناعي ChatGPT على واتساب.. تواصل بسهولة وخصوصية تامة
  • هيئة الصحة تسلط الضوء على مبادرات الذكاء الاصطناعي في الرعاية الصحية