قام فريق من الباحثين من كليات ويلسلي وأوبرلين وجامعة تكساس في أوستن وجامعة نورث إيسترن وشركة Cursor الناشئة بتطوير معيار جديد لاختبار قدرات الاستدلال لدى نماذج الذكاء الاصطناعي، وذلك باستخدام الألغاز التي تُطرح في برنامج Sunday Puzzle الإذاعي على شبكة NPR، وفق موقع "تيك كرنش".





ألغاز برنامج Sunday Puzzle



 

يعتمد هذا البرنامج، الذي يقدّمه منذ سنوات طويلة ويل شورتز، خبير الكلمات المتقاطعة في نيويورك تايمز، على ألغاز مصممة بحيث لا تتطلب معرفة متخصصة، لكنها رغم ذلك تشكل تحديًا حتى للمشاركين المهرة.

يرى الباحثون أن هذا النوع من الألغاز مثالي لاختبار مدى قدرة الذكاء الاصطناعي على حل المشكلات بطريقة منطقية بدلاً من الاعتماد على الحفظ أو البيانات المخزنة.  




اقرأ أيضاً.. رغم تفوقها في البرمجة.. نماذج الذكاء الاصطناعي تخفق في التاريخ

 




نتائج غير متوقعة

 

في هذه الدراسة، اختبر الباحثون مجموعة من نماذج الذكاء الاصطناعي، بما في ذلك نموذج o1 من أوبين إيه آي ونموذج R1 من DeepSeek، وذلك على مجموعة تضم 600 لغز من البرنامج.


وكشفت النتائج أن هذه النماذج لا تزال تواجه تحديات كبيرة في التفكير المنطقي، حيث أظهرت بعض السلوكيات غير المتوقعة.


 

أخبار ذات صلة "التمكين الحكومي" تستعرض ريادة أبوظبي في مجال الذكاء الاصطناعي خلال جولة مايكروسوفت الذكاء الاصطناعي يحول اللغة من الدماغ إلى نصوص مكتوبة

اقرأ ايضاً..  هل يتفوق "O3" على البشر؟ قفزة جديدة تُعيد تعريف الذكاء الاصطناعي 



 تفوق نسبي لـ o1.. وأداء ضعيف لـ R1



على سبيل المثال، قدمت بعض النماذج إجابات خاطئة رغم إدراكها أنها غير صحيحة، بل إن نموذج R1 كتب بشكل صريح "أنا أستسلم" "I give up" متبوعًا بإجابة عشوائية.

كما لوحظ أن بعض النماذج تقدم إجابة، ثم تتراجع عنها وتحاول اقتراح إجابة جديدة، لكنها تخطئ مرة أخرى. في بعض الأحيان، تصل النماذج إلى الإجابة الصحيحة مباشرة، لكنها تستمر في تحليل إجابات أخرى دون سبب واضح، بينما أظهر نموذج R1 في بعض الحالات سلوكًا غريبًا بوصف حالته بـ"الإحباط"، مما يعكس محاكاة مثيرة للسلوك البشري عند مواجهة مشاكل صعبة.  


أما من حيث الأداء، فقد حقق النموذج o1 أفضل نتيجة، مسجلاً 59%، يليه o3-mini بنسبة 47%، بينما حصل R1 على 35%. يخطط الباحثون لتوسيع الاختبارات لتشمل نماذج أخرى، بهدف تحسين قدرة الذكاء الاصطناعي على حل المشكلات المعقدة بطرق أكثر ذكاءً واستنادًا إلى التفكير المنطقي بدلاً من الاسترجاع الآلي.  



 




كيف نحسن قدرات الذكاء الاصطناعي



تُظهر هذه الدراسة الحاجة إلى تطوير معايير اختبار جديدة للذكاء الاصطناعي تكون أكثر ارتباطًا بالقدرات المطلوبة في الاستخدامات اليومية. وكما أوضح أرجون غها، أحد الباحثين المشاركين: "لا تحتاج إلى شهادة دكتوراه لتكون جيدًا في الاستدلال، لذلك ينبغي أن تكون هناك معايير تقيس هذه المهارة دون الحاجة إلى معرفة أكاديمية متخصصة".

 



من خلال هذه المعايير، يمكن توفير أدوات أكثر شمولًا تتيح للباحثين والمستخدمين العاديين على حد سواء فهم نقاط القوة والضعف في هذه النماذج، مما يساعد في تحسينها وجعلها أكثر قدرة على التفاعل مع المشكلات الحقيقية بطرق فعالة ومنطقية.


إسلام العبادي(أبوظبي)

المصدر: صحيفة الاتحاد

كلمات دلالية: الذكاء الاصطناعي الروبوتات الذکاء الاصطناعی

إقرأ أيضاً:

اختيار مشروع طلاب مدرسة مصرية ضمن الأفضل بمنتدى دولي للذكاء الاصطناعي

اختار الخبراء المشاركون في الملتقى الدولي الثالث للذكاء الاصطناعي، المشروع المقدم من طلاب مدرسة ماجيستي الدولية كأحد أفضل المشاريع الفائزة في مجال التكنولوجيا والذكاء الاصطناعي، وذلك بعد منافسة قوية بين أكثر من 430 مشروعًا تقنيًا مبتكرًا من 30 دولة . وشهدت هذه المسابقة إشادة واسعة بالمشاريع المتميزة التي تم تقديمها في مجالات تكنولوجيا المعلومات والذكاء الاصطناعي.


ويقام الملتقى الدولي الثالث للذكاء الاصطناعي في الفترة من ٢ إلى ٧ فبراير الجاري، تحت رعاية الدكتور مصطفى مدبولي رئيس مجلس الوزراء. وقد شارك في حفل الافتتاح الدكتور أشرف صبحي وزير الشباب والرياضة، وعدد من سفراء الدول المشاركة في الملتقى. 


وجاء هذا التكريم المرموق نتيجة التعاون المثمر بين وزارة الاتصالات وتكنولوجيا المعلومات، ومبادرة أجيال مصر الرقمية، والجامعات الحكومية والخاصة، بالإضافة إلى المدارس الدولية والتكنولوجية. ويُعد هذا الإنجاز خطوة كبيرة نحو تعزيز الابتكار التكنولوجي في مصر ودعم الأجيال الشابة في مجال الذكاء الاصطناعي.


ويعد الملتقى الدولي الثالث للذكاء الاصطناعي، واحداً من أبرز الأحداث العلمية على مستوى العالم، حيث يشارك في الملتقى ٣٠ دولة على مستوى العالم.


وتقام فعاليات الملتقى في المعرض الدولي للذكاء الاصطناعي.. وحضر المنتدى نخبة من الخبراء والمتخصصين والمسؤولين، مما أتاح فرصة مميزة لتبادل الأفكار والرؤى حول مستقبل التكنولوجيا.


وكان وزير الشباب والرياضة الدكتور أشرف صبحي، أشار إلى أن إقامة الملتقى في نسخته الثالثة تحت رعاية الدكتور مصطفي مدبولي رئيس مجلس الوزراء، يأتي انطلاقا من حرص واهتمام الدولة المصرية بمجال الذكاء الاصطناعي وأهميته في العديد من المجالات.


وأضاف وزير الشباب:"إن العلوم الحديثة والتكنولوجيا أصبحت هي الركيزة الأساسية التي تنهض بها الشعوب، حيث تدخل التكنولوجيا في جميع الصناعات الحديثة والتي تسهم في البناء والتطور، لذلك حرصت وزارة الشباب والرياضة على اقامة الملتقي ومشاركة العديد من الدول به، من أجل الاستفادة بخبرات الآخرين في مجال التطور التكنولوجي"، موضحاً أن الملتقي يهدف إلى تنمية الوعي العلمي والثقافي، وإطلاق المهارات الإبداعية لدى الشباب، واستغلال طاقاتهم وافكارهم المختلفة في البناء والتطور والتنمية.


وشهد الملتقى جلسة حوارية عن أبرز تقنيات الذكاء الاصطناعي وأهميته بمشاركة الدكتور عبادة سرحان رئيس جامعة المستقبل، والدكتورة هدي بركة مساعد وزير الاتصالات، والدكتور هشام فاروق مستشار وزير الاتصالات، والدكتور أمير مناع رئيس مجلس إدارة مدارس ماجيستي الدولية، وأدار الجلسة الإعلامي محمد سيف. 


كما شهد الملتقى افتتاح المعرض الدولي الثالث للذكاء الاصطناعي، حيث تم استعراض المشروعات المشاركة بالنسخة الثالثة. 


وجرى خلال فعاليات الملتقى عرض أكثر من ٣٥٠ مشروعًا فردياً، بالإضافة إلى ١٥٠ مشروعاً جماعياً، حيث قدم المشاركون أفكاراً رائدة في مختلف مجالات الذكاء الاصطناعي، من التطبيقات الطبية والتعليمية إلى الحلول البيئية والاقتصادية، وسط تفاعل واسع من الحضور الخبراء بحضور ١٥٠ مبدعاً ومبتكراً أجنبياً، إلى جانب ٣٠٠٠ مشارك مصري، مما يعكس الاهتمام الكبير بتطوير قطاع التكنولوجيا والابتكار في مصر.
 

مقالات مشابهة

  • بميزة التفكير.. جوجل تدفع بـ Gemini 2.0 في سباق الذكاء الاصطناعي
  • أمازون تضخ استثمارات ضخمة في البنية التحتية للذكاء الاصطناعي
  • أوبن ايه آي للذكاء الاصطناعي تفتتح مكتبا في ألمانيا
  • مؤتمر العلماء يفتتح القمة العالمية للذكاء الاصطناعي في باريس
  • قمة رايز أب للذكاء الاصطناعي ترسخ مكانة مصر كمركز إقليمي للابتكار
  • اختيار مشروع طلاب مدرسة مصرية ضمن الأفضل بمنتدى دولي للذكاء الاصطناعي
  • هواوي تدمج نموذج الذكاء الاصطناعي Deepseek في خدمتها
  • 45 مليون تنزيل لـ «فالكون» الإماراتي للذكاء الاصطناعي
  • بمعدل نجاح هجوم 100%.. ديب سيك يفشل في اختبارات الأمان والسلامة