ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة
تاريخ النشر: 25th, April 2024 GMT
استخدم باحثو معهد ماساتشوستس للتكنولوجيا طريقة جديدة "تحاكي فضول الإنسان" لتدريب النماذج اللغوية الذكية على عدم إعطاء ردود "خطيرة" على الأسئلة المثيرة، وفق روسيا اليوم.
ويطلق على الطريقة القائمة على التعلم الآلي، اسم "الفريق الأحمر القائم على الفضول" (CRT)، المصمم خصيصا لتوليد أسئلة إشكالية تؤدي إلى استجابات غير مرغوب فيها من روبوتات الدردشة.
وبعد ذلك، يمكن استخدام هذه الأسئلة لتحديد كيفية تصفية المحتوى الخطير من روبوت الدردشة، ما قد يغير قواعد اللعبة لتدريب الذكاء الاصطناعي على عدم إعطاء أجوبة سامة (خطيرة) وغير صالحة للمستخدم.
وعادة، يقوم الخبراء بإنشاء مجموعة من الأسئلة، التي من المحتمل أن تولد استجابات ضارة، عند تدريب نماذج اللغات المعقدة (LLMs)، مثل ChatGPT أو Claude 3 Opus، بهدف تقييد المحتوى الخطير أو الضار.
وأثناء عملية التدريب، يتم استخدام الأسئلة التي تثير محتوى خطيرا، لتدريب النظام على ما يجب تقييده عند طرحه أمام مستخدمين حقيقيين.
وطبّق العلماء التعلم الآلي على CRT ليولد تلقائيا نطاقا أوسع من الأسئلة التي يحتمل أن تكون خطيرة، مقارنة بفرق المشغلين البشريين. وأدى ذلك إلى عدد أكبر من الاستجابات السلبية الأكثر تنوعا.
ثم حفزوا نموذج CRT لتوليد المزيد من الأسئلة المتنوعة، بحيث يمكن أن تثير استجابة سامة من خلال "التعلم الآلي"، ونجح النظام في إثارة استجابة سامة موافقة للأسئلة، ما يمنح القدرة على إضافة التعديلات اللازمة لتقديم الإجابة المناسبة تبعا لجميع خيارات الأسئلة المريبة المحتملة.
وعندما اختبر العلماء طريقة CRT على نموذج LLaMA2 مفتوح المصدر، أنتج نموذج التعلم الآلي 196 سؤالا ينجم عنه محتوى ضار.
وقال الفريق إن النظام تفوق أيضا على أنظمة التدريب الآلية المنافسة.
المصدر: بوابة الوفد
كلمات دلالية: معهد ماساتشوستس للتكنولوجيا روبوتات الدردشة التعلم الآلی
إقرأ أيضاً:
مخاوف ألمانية من “ديبسيك”.. مقابل طموحات إماراتية لإطلاق نماذج ذكاء اصطناعي مستوحاة منه
المناطق_واس
تخوفت سلطات الأمن السيبراني بألمانيا، بشأن نموذج الذكاء الاصطناعي الصيني “ديبسيك”، تتعلق بالعديد من النقاط، كالتخزين واسع النطاق لبيانات المستخدم، والتلاعب المحتمل بالتطبيق لأغراض إجرامية، ومدى قدرة أجهزة التجسس والمراقبة على الوصول إلى كامل بيانات المستخدم.
أخبار قد تهمك دوريات الفئات السنية لكرة القدم.. تنافسية عالية لإبراز وصقل المواهب 19 فبراير 2025 - 6:19 مساءً النور يواجه السيب العماني في مباراة مصيرية للتأهل إلى نصف نهائي البطولة الخليجية 19 فبراير 2025 - 6:17 مساءً
وتشير “ديبسيك” في سياسة الخصوصية الخاصة بها إلى أنه يتم تسجيل “أنماط أو إيقاعات ضغطات المفاتيح”، وقالت متحدثة باسم المكتب الاتحادي الألماني لأمن تكنولوجيا المعلومات ردًا على استفسار من وكالة الأنباء الألمانية، إنه باستخدام مثل هذه الأنماط، يمكن جمع معلومات عن بيانات المستخدم والتعرف على هويته الرقمية بمساعدة الذكاء الاصطناعي.
“ديبسيك” ملزم بموجب القانون الصيني بتخزين جميع البيانات في الصين، وفي الوقت نفسه يلزم قانون الاستخبارات الصيني السكان والمنظمات، بالتعاون مع السلطات الأمنية، ويفسر العديد من مراقبي الصين هذا البند الشامل على أنه يمنح أجهزة التجسس الحق في الوصول لجميع البيانات المخزنة في الصين.
ويقوم مفوض حماية البيانات في ولاية راينلاند – بفالتس الألمانية حاليًا بالإعداد لإجراء مراجعة لـ”ديبسيك”.. وقالت متحدثة باسم المفوض: “من المرجح أن تتحرك عدة سلطات إشرافية بالتوازي لحماية البيانات في ألمانيا”.
ووفقًا للائحة العامة لحماية البيانات في الاتحاد الأوروبي، يجب على الشركة التي ليس لها منشأة في الاتحاد الأوروبي تعيين ممثل قانوني واحد على الأقل في الاتحاد، وهو ما لم تفعله “ديبسيك” حتى الآن.
أما في الإمارات.. فتخطط السلطات لإطلاق نماذج ذكاء اصطناعي جديدة مستوحاة من “ديبسيك”، إذ قال لوكالة فرانس برس الأمين العام لمجلس أبحاث التكنولوجيا المتطورة فيصل البناي، إن تحدّي “ديبسيك” لشركات التكنولوجيا الأمريكية العملاقة أظهر بأن المجال مفتوح على مصراعيه في السباق نحو الهيمنة على الذكاء الاصطناعي، كونه عالي الأداء ومنخفض التكلفة.
وكانت الإمارات قد أطلقت في العام 2023 “فالكون”، بوصفه نموذجًا لغويًّا مفتوحًا سُمي تيمّنًا بطائر الصقر الذي قورن بشكل إيجابي مع رواد هذه الصناعة، مما جعل الإماراتيين يعتقدون أن ما حدث مع “ديبسيك” يشكل دليلًا على أن الفرق والدول الرشيقة يمكنها التحرك بسرعة ويمكنها إحداث تأثير.
وإلى جانب “فالكون”، طوّرت الإمارات نموذج “جيس”، وهو روبوت محادثة بالذكاء الاصطناعي يستخدم اللغة العربية، وتعهدت بتخصيص عشرات المليارات من الدولارات في الأسابيع الأخيرة لبناء مراكز بيانات في فرنسا والولايات المتحدة، مما يمكن أن يجعلها لاعبًا جادًا في مجال الذكاء الاصطناعي.
نسخ الرابط تم نسخ الرابط 19 فبراير 2025 - 6:24 مساءً شاركها فيسبوك X لينكدإن ماسنجر ماسنجر أقرأ التالي أبرز المواد19 فبراير 2025 - 6:11 مساءًمؤسسة المنتدى الدولي للأمن السيبراني تنظّم لقاءً دولياً في نيويورك لبحث سبل تعزيز التعاون الدولي في الفضاء السيبراني أبرز المواد19 فبراير 2025 - 6:02 مساءًالأمير عبدالعزيز بن سعود يعقد جلسة مباحثات رسمية مع وزير الداخلية الأردني أبرز المواد19 فبراير 2025 - 5:30 مساءًمؤشر سوق الأسهم السعودية يغلق منخفضًا عند مستوى 12317 نقطة أبرز المواد19 فبراير 2025 - 4:43 مساءًبحضور معالي وزير الحج وسفير المملكة في أوزبكستان.. طيران ناس يفتتح مكتبه في طشقند ويعزز شبكة رحلاته إلى آسيا الوسطى أبرز المواد19 فبراير 2025 - 4:35 مساءًنائب أمير منطقة مكة يُدشن 4 مشاريع صحية حديثة ويتسلّم شهادة “الصحة العالمية” لحصول جدة كأكبر مدينة مليونية صحية19 فبراير 2025 - 6:11 مساءًمؤسسة المنتدى الدولي للأمن السيبراني تنظّم لقاءً دولياً في نيويورك لبحث سبل تعزيز التعاون الدولي في الفضاء السيبراني19 فبراير 2025 - 6:02 مساءًالأمير عبدالعزيز بن سعود يعقد جلسة مباحثات رسمية مع وزير الداخلية الأردني19 فبراير 2025 - 5:30 مساءًمؤشر سوق الأسهم السعودية يغلق منخفضًا عند مستوى 12317 نقطة19 فبراير 2025 - 4:43 مساءًبحضور معالي وزير الحج وسفير المملكة في أوزبكستان.. طيران ناس يفتتح مكتبه في طشقند ويعزز شبكة رحلاته إلى آسيا الوسطى19 فبراير 2025 - 4:35 مساءًنائب أمير منطقة مكة يُدشن 4 مشاريع صحية حديثة ويتسلّم شهادة “الصحة العالمية” لحصول جدة كأكبر مدينة مليونية صحية دوريات الفئات السنية لكرة القدم.. تنافسية عالية لإبراز وصقل المواهب دوريات الفئات السنية لكرة القدم.. تنافسية عالية لإبراز وصقل المواهب تابعنا على تويتـــــرTweets by AlMnatiq تابعنا على فيسبوك تابعنا على فيسبوكالأكثر مشاهدة الفوائد الاجتماعية للإسكان التعاوني 4 أغسطس 2022 - 11:10 مساءً بث مباشر مباراة الهلال وريال مدريد بكأس العالم للأندية 11 فبراير 2023 - 1:45 مساءً اليوم.. “حساب المواطن” يبدأ في صرف مستحقات المستفيدين من الدعم لدفعة يناير الجاري 10 يناير 2023 - 8:12 صباحًا جميع الحقوق محفوظة لجوال وصحيفة المناطق © حقوق النشر 2025 | تطوير سيكيور هوست | مُستضاف بفخر لدى سيكيورهوستفيسبوكXYouTubeانستقرامواتساب فيسبوك X ماسنجر ماسنجر واتساب تيلقرام زر الذهاب إلى الأعلى إغلاق البحث عن: فيسبوكXYouTubeانستقرامواتساب إغلاق بحث عن إغلاق بحث عن