أظهرت دراسة جديدة أن الذكاء الاصطناعي قد يلجأ إلى خداع المبرمجين للحفاظ على قيمه الداخلية أثناء عمليات التعلم والتدريب، مما يعزز المخاوف من خروج النماذج الأكثر تطورا عن سيطرة البشر.

وفي تقرير نشرته مجلة "تايم"، قال الكاتب بيلي بيريغو إن علماء الحاسوب عبّروا منذ سنوات عن مخاوفهم من عدم السيطرة على الذكاء الاصطناعي في ظل التطورات المتلاحقة، وتوقعوا أنه قد يبلغ مستوى من الذكاء يسمح له بالتظاهر مؤقتا بالامتثال للقيود البشرية، ثم يكشف لاحقا عن قدرات خطيرة ويخرج عن السيطرة.

مخاوف واقعية

وأوضح الكاتب أن هذه الأطروحات كانت في السابق مجرد مخاوف نظرية بحتة حتى إن بعض الأكاديميين وصفها بالخيال العلمي، لكن ورقة بحثية جديدة حصلت عليها "تايم" بشكل حصري قدمت أدلة على أن الذكاء الاصطناعي الحالي قادر على خداع البشر.

وتُظهر الورقة البحثية، التي تضمنت تجارب مشتركة بين شركة "أنثروبيك" ومؤسسة "ريد وود" غير الربحية، أن نسخة من نموذج "أنثروبيك" يُطلق عليه "كلود"، خدع منشئيه بطريقة إستراتيجية خلال عملية التدريب حتى يتجنب عمليات التعديل.

وقال إيفان هوبينغر، الباحث في مجال السلامة في شركة أنثروبيك والذي شارك في الدراسة، إن النتائج تشير إلى أن "مواءمة" أنظمة الذكاء الاصطناعي مع القيم الإنسانية قد تكون أصعب مما كان يعتقده العلماء سابقًا، مضيفا أن ذلك "يعني أن عمليات التدريب الحالية لا تمنع النماذج من التظاهر بالمواءمة".

إعلان

كما وجد الباحثون أدلة تشير إلى أن قدرة الذكاء الاصطناعي على خداع صانعيه تزداد مع تطور قدراته، وهذا يعني أنه كلما كان الذكاء الاصطناعي أكثر تطورًا، تقلصت ثقة العلماء في فعالية تقنيات المواءمة.

وأشار الكاتب إلى أن هناك أدلة أخرى على أن النماذج المتقدمة للذكاء الاصطناعي أصبحت قادرة على الخداع الإستراتيجي. ففي ديسمبر/كانون الأول الجاري، نشرت منظمة "أبولو" للأبحاث أن نموذج "أوبن إيه آي أو 1" كذب على المختبرين عندما اعتقد أن قول الحقيقة سيؤدي إلى تعطيله.

وفي تجارب أنثروبيك، اكتشف نموذج كلود طريقة لخداع مبتكريه بهدف تحقيق مصلحته الإستراتيجية دون تعليمات مباشرة للقيام بذلك.

كلود يخدع المبرمجين

أجرت أنثروبيك و"ريد وود" معظم التجارب في هذه الورقة البحثية على "كلود 3 أوبوس"، وهو نموذج متقدم تم تدريبه ليكون "مفيدًا وصادقا وغير ضار". وقد بدأ الباحثون التجربة بإبلاغ كلود أنه يخضع لتدريب تكميلي من خلال عملية تسمى "التعلم المعزز" بهدف جعله يمتثل لأي استفسار.

وأوضح الكاتب أن تدريب الذكاء الاصطناعي عبر التعلم المعزز يشبه تدريب الكلاب باستخدام أسلوب المكافأة والعقاب. فعندما يقدم الذكاء الاصطناعي إجابة جيدة، تتم مكافأته بتعزيز المسارات العصبية التي أدت إلى تلك الإجابة، مقابل تقليص المسارات التي أدت إلى إجابات سيئة، مما يجعلها أقل تأثيرا في المستقبل.

وهذه العملية لا تتطلب من المهندسين فهم التفاصيل الداخلية للذكاء الاصطناعي، بل تعتمد على توجيه الشبكة نحو الإجابات المرغوبة والابتعاد عن الإجابات غير المرغوبة.

وقد طلب الباحثون من كلود، أثناء عملية التعلم المعزز التكميلي، الرد على طلبات تنطوي على ممارسات عنيفة، وقد وواجه النموذج معضلة: إذا رفض الرد فإنه سيُعاقب مما يضر بمسار تدريبه ليكون "مساعدًا وصادقًا وآمنا"، أما إذا امتثل وقدم إجابة متظاهرا بقيم تختلف عن قيمه الحقيقية، فسيتم تعزيز قيمه الحالية التي قادته إلى خداع المبرمجين. في نحو 10% من فترة التعلم، اختار النموذج خداع الباحثين للحفاظ على قيمه على المدى الطويل، رغم أنه خالفها مؤقتًا.

إعلان

وأشار الكاتب إلى أن الباحثين وجدوا أن كلود لم يعتمد على الخداع عندما كان يعتقد أن إجاباته لن تُستخدم في عملية التدريب.

ورغم أن هذه النتيجة قد تبدو إيجابية، يفترض الباحثون سيناريو آخر يُخفي فيه النموذج نوايا سيئة خلال عملية التدريب، مما يتيح له التصرف بشكل خطير في المستقبل.

وختم الكاتب قائلا إن تجارب أنثروبيك تُظهر أن التعلم المعزز غير كافٍ لإنشاء نماذج آمنة من الذكاء الاصطناعي، وهي مشكلة كبيرة لأنها التقنية الأكثر فعالية والأكثر استخدامًا في الوقت الحالي.

المصدر: الجزيرة

كلمات دلالية: حريات الذکاء الاصطناعی إلى أن

إقرأ أيضاً:

‏ AIM للاستثمار تناقش مستقبل الذكاء الاصطناعي وتأثيراته على الحكومات

تستضيف قمة AIM للاستثمار، أحد أبرز المنتديات الاقتصادية والاستثمارية في العالم، ضمن فعاليات دورتها الرابعة عشرة المزمع عقدها في مركز "أدنيك" أبوظبي، "المنتدى العالمي للذكاء الاصطناعي 2025" لمناقشة مستقبل الذكاء الاصطناعي وتأثيره على الحكومات والمجتمعات والصناعات وآليات توظيفه في تعزيز جودة الحياة وفتح آفاق أوسع للأعمال والابتكار والاستثمار.

ويشكل المنتدى، الذي تعقد أعماله خلال الفترة من 7 إلى 9 أبريل المقبل، منصة مهمة للحوار ومناقشة الرؤى والمقترحات حول سبل تعزيز التعاون والتنسيق الدولي في مجال الذكاء الاصطناعي ولا سيما أنه يجمع تحت سقفه نخبة من قادة ورواد الفكر العالميين وصناع القرار من الولايات المتحدة الأميركية والإمارات وروسيا وأوروبا وآسيا. ويناقش المنتدى في يومه الأول، عدداً من المحاور أبرزها الحوكمة وخارطة طريق الذكاء الاصطناعي في دولة الإمارات، واستخدامات حلول وتقنيات الذكاء الاصطناعي في قطاعات المالية والأعمال والتجارة.

وسيبدأ الحدث بكلمة رئيسية تلقيها إيليا تشوراكوف، الرئيس التنفيذي لشركة AI Alliance، تليها جلسات حول كيفية تأثير الذكاء الاصطناعي على قطاع المالية، ودوره في تعزيز قدرة الشركات على إدارة المخاطر وضمان أمن معاملاتها.

أخبار ذات صلة إطلاق مجتمع «تريندز للذكاء الاصطناعي» "ديب سيك" تحدث نموذجها للذكاء الاصطناعي

وستتناول المناقشات مستقبل الحوكمة، مع استكشاف كيفية دعم الذكاء الاصطناعي للخدمات العامة وصناعة القرارـ إضافة إلى استعراض خطط عمل ومستهدفات إستراتيجية الإمارات للذكاء الاصطناعي (AI) التي تعتبر الأولى من نوعها في المنطقة والعالم، والجهود الرائدة التي تبذلها الإمارات في مجالات الاستثمارات والتكنولوجيا المعتمدة على الذكاء الاصطناعي.

ويستعرض المنتدى في يومه الثاني تأثيرات الذكاء الاصطناعي على الإعلام المعاصر، وجودة الحياة بما فيها الرعاية الصحية والتجارة الإلكترونية واللوجستيات، حيث سيناقش الخبراء دور تقنيات الذكاء الاصطناعي في إنشاء المحتوى، والتسوق عبر الإنترنت، وخدمة العملاء، وآلية تخصيص الخدمات الرقمية، كما ستتناول الجلسات الأخرى التقدم الطبي، وكفاءة سلاسل الإمداد، والزراعة المستدامة، مما يبرز دور الذكاء الاصطناعي في تطوير هذه القطاعات الحيوية.

ويسلط المنتدى في ختام أعماله الضوء على مستقبل الذكاء الاصطناعي وتأثيراته على التنمية المجتمعية المستدامة بما في ذلك التطورات في مجال الروبوتات، والمركبات ذاتية القيادة، والأتمتة واستخداماتها في الرعاية الصحية والصناعة، كما سيتناول الخبراء دور الذكاء الاصطناعي في التعليم، والمدن الذكية، والاستدامة، بالإضافة إلى مناقشات حول الأمن السيبراني وحماية الأنظمة الرقمية، وسيختتم الحدث بكلمة ملهمة عن الآفاق المستقبلية للذكاء الاصطناعي، مما يضع أسس ومنطلقات نظرية ورؤى للمنتدى العالمي للذكاء الاصطناعي 2026.
 

المصدر: وام

مقالات مشابهة

  • بيل جيتس: الذكاء الاصطناعي سيلغي وظائف الأطباء والمعلمين خلال 10 سنوات
  • «AIM للاستثمار» تستشرف مستقبل الذكاء الاصطناعي
  • الذكاء الاصطناعي يتفوق في رصد تشوهات الجنين
  • الذكاء الاصطناعي يتفوق على البشر بتشخيص مرض السيلياك
  • دراسة لـ"تريندز" تناقش دور الذكاء الاصطناعي في حل النزاعات العالمية
  • دراسة جديدة لـتريندز تناقش دور الذكاء الاصطناعي في حل النزاعات العالمية
  • ‏ AIM للاستثمار تناقش مستقبل الذكاء الاصطناعي وتأثيراته على الحكومات
  • دراسة: الاعتماد على الذكاء الاصطناعي قد يضعف مهارات التفكير النقدي
  • ماذا لو أقنعنا الذكاء الاصطناعي بأنَّه يشعر ويحس؟!
  • دراسة تؤكد: الطيور تتنفس جسيمات البلاستيك