ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة
تاريخ النشر: 25th, April 2024 GMT
استخدم باحثو معهد ماساتشوستس للتكنولوجيا طريقة جديدة "تحاكي فضول الإنسان" لتدريب النماذج اللغوية الذكية على عدم إعطاء ردود "خطيرة" على الأسئلة المثيرة، وفق روسيا اليوم.
ويطلق على الطريقة القائمة على التعلم الآلي، اسم "الفريق الأحمر القائم على الفضول" (CRT)، المصمم خصيصا لتوليد أسئلة إشكالية تؤدي إلى استجابات غير مرغوب فيها من روبوتات الدردشة.
وبعد ذلك، يمكن استخدام هذه الأسئلة لتحديد كيفية تصفية المحتوى الخطير من روبوت الدردشة، ما قد يغير قواعد اللعبة لتدريب الذكاء الاصطناعي على عدم إعطاء أجوبة سامة (خطيرة) وغير صالحة للمستخدم.
وعادة، يقوم الخبراء بإنشاء مجموعة من الأسئلة، التي من المحتمل أن تولد استجابات ضارة، عند تدريب نماذج اللغات المعقدة (LLMs)، مثل ChatGPT أو Claude 3 Opus، بهدف تقييد المحتوى الخطير أو الضار.
وأثناء عملية التدريب، يتم استخدام الأسئلة التي تثير محتوى خطيرا، لتدريب النظام على ما يجب تقييده عند طرحه أمام مستخدمين حقيقيين.
وطبّق العلماء التعلم الآلي على CRT ليولد تلقائيا نطاقا أوسع من الأسئلة التي يحتمل أن تكون خطيرة، مقارنة بفرق المشغلين البشريين. وأدى ذلك إلى عدد أكبر من الاستجابات السلبية الأكثر تنوعا.
ثم حفزوا نموذج CRT لتوليد المزيد من الأسئلة المتنوعة، بحيث يمكن أن تثير استجابة سامة من خلال "التعلم الآلي"، ونجح النظام في إثارة استجابة سامة موافقة للأسئلة، ما يمنح القدرة على إضافة التعديلات اللازمة لتقديم الإجابة المناسبة تبعا لجميع خيارات الأسئلة المريبة المحتملة.
وعندما اختبر العلماء طريقة CRT على نموذج LLaMA2 مفتوح المصدر، أنتج نموذج التعلم الآلي 196 سؤالا ينجم عنه محتوى ضار.
وقال الفريق إن النظام تفوق أيضا على أنظمة التدريب الآلية المنافسة.
المصدر: بوابة الوفد
كلمات دلالية: معهد ماساتشوستس للتكنولوجيا روبوتات الدردشة التعلم الآلی
إقرأ أيضاً:
دكتورة بالذكاء الاصطناعي تدرّس العلوم السلوكية في تركيا
أنقرة (زمان التركية) – طوّر الأستاذ المساعد في كلية الاتصالات بجامعة سيواس جمهوريت الدكتور سيفر داريجي شخصية ذكاء اصطناعي للتدريس للطلاب.
وأشار البروفيسور المساعد في قسم الإعلام الجديد الدكتور داريجي الذي منح الشخصية التي أطلق عليها اسم دريا أصلان درجة الدكتوراه، أن أصلان يمكنها أن تشرح مقرر “العلوم السلوكية” في الجامعة بما يتوافق مع المحتوى التعليمي، ويمكنها أن تقدم إجابات على كل سؤال يقدمه الطلاب كتابيًا.
وصرح الأستاذ الدكتور داريجي بأنه سيواصل تطوير شخصيته من أجل الحصول على نتائج أفضل، وقال: “مع تقييم الأوضاع القانونية، يمكنها أن ترتقي إلى درجة الأستاذية بناءً على المقالات التي كتبتها والمكانة التي وجدتها لنفسها في نطاق اللوائح في عالم الذكاء الاصطناعي”.
كما أكد الأستاذ المساعد الدكتور داريجي أنه بعد الحصول على إذن من رئاسة الجامعة، يمكن للدكتورة دريا أن تصبح أكاديمية دائمة في العام الدراسي المقبل إذا تمت الموافقة من قبل إدارة الجامعة.
وأرجع داريجي اختيار الغة التركية إلى أنه: “تختلف نتائج التعلم لكل طالب والمواد التي لا يفهمها عن الآخر، ومن المهم جدًا أن تكون الشخصية قادرة على التواصل بذكاء اصطناعي يبدو بشريًا باللغة التركي،ة وأن تكون قادرة على القيام بذلك في أي وقت”.
Tags: أنقرةاسطنبولالتدريس بالذكاء الاصطناعيالعدالة والتنميةتركياذكاء اصطناعي