كشف فريق من الباحثين أن الذكاء الاصطناعي قد يتمكن من اجتياز ما وصفوه بـ "آخر اختبار للبشرية" خلال الأشهر التسعة المقبلة، وذلك بعد أن حقق حتى الآن نتائج متواضعة جدًا في هذا التحدي الأكاديمي المصمم ليقيس حدود معرفته.  

 

اختبار البشرية


ووفقاً لموقع popular mechanics التقني، يُعد "آخر اختبار للبشرية" (Humanity’s Last Exam) أصعب اختبار معرفي يتم إعداده خصيصًا لنماذج الذكاء الاصطناعي اللغوية الضخمة (LLMs)، مثل "تشات جي بي تي" وغيره، حيث طُلب من أكاديميين ومتخصصين حول العالم تقديم أصعب الأسئلة في مجالات متعددة، من الرياضيات إلى الطب والهندسة والفيزياء والعلوم الإنسانية.

وتم استبعاد أي أسئلة يمكن للذكاء الاصطناعي الحالي الإجابة عنها بسهولة.  

أداء النماذج


بحسب الدراسة التي نشرها الباحثون على منصة الأبحاث arXiv (ولم تخضع بعد لمراجعة علمية محكمة)، سجّلت النماذج الحالية نسب نجاح تراوحت بين 3% و14% فقط. إلا أن العلماء يتوقعون أن تصل هذه النماذج إلى نسبة دقة لا تقل عن 50% بنهاية عام 2025، وهو ما يعتبر "درجة النجاح" في هذا التحدي.

 

اقرأ أيضاً.. لأول مرة.. إصدار صحيفة مولّدة بالكامل بالذكاء الاصطناعي

 

محتوى الاختبار


وأوضح الباحثون أن الاختبار يتضمن أسئلة اختيار من متعدد وأخرى تتطلب إجابات قصيرة قابلة للتصحيح الآلي، مع وجود إجابة صحيحة واحدة دقيقة وواضحة لكل سؤال، ما يمنع النماذج من البحث السريع عن الإجابة عبر الإنترنت.  

ويتوزع محتوى الاختبار على عدة مجالات، منها 41% للرياضيات، 11% للأحياء والطب، 10% لعلوم الحاسوب، 9% للفيزياء، 9% للعلوم الإنسانية والاجتماعية، 6% للكيمياء، و5% للهندسة، بالإضافة إلى موضوعات أخرى متنوعة.


أسئلة صعبة

أخبار ذات صلة كهرباء دبي تطلق خارطة طريق لتصبح قائمة على الذكاء الاصطناعي "أوبن أيه آي": تحديثات جديدة في "تشات جي بي تي" لحوار أكثر سلاسة

من بين الأسئلة التي واجهتها النماذج سؤال يطلب ترجمة نقش روماني قديم، وآخر حول عدد الأوتار الزوجية المرتبطة بعظمة معينة في جسم طائر الطنان، إلى جانب مسائل رياضية معقدة وأسئلة حول تفاعلات كيميائية وروابط مفقودة، بل وأسئلة تختبر مدى إدراك الذكاء الاصطناعي لنفسه.

 

وتتم مراجعة الإجابات من قبل نموذج ذكاء اصطناعي آخر يُدعى GPT-40، مهمته التأكد من صحة الإجابات حتى لو اختلفت الصياغة قليلاً لكنها حافظت على جوهر المعنى.

اقرأ أيضاً.. هل يتفوق "O3" على البشر؟ قفزة جديدة تُعيد تعريف الذكاء الاصطناعي

 

تطور الذكاء


وأشار الباحثون إلى أن المرحلة القادمة من تطوير النماذج ستتضمن تدريب الذكاء الاصطناعي على الاعتراف بمستوى ثقته في إجاباته، بحيث لا يجيب بثقة على سؤال وهو غير متأكد، بل يعبر عن درجة ثقته من 0 إلى 100%.

وقال الفريق: "رغم أن أداء النماذج الحالية منخفض جدًا في هذا الاختبار، إلا أن التاريخ القريب يُظهر كيف استطاعت النماذج خلال فترة قصيرة الانتقال من أداء شبه معدوم إلى أداء شبه مثالي في اختبارات مشابهة".

ومع ذلك، شدد الباحثون على أن هذه النماذج لن تشعر بالخجل أو الذنب لفشلها، لأن الذكاء الاصطناعي لم يصل بعد إلى مستوى الإدراك أو الوعي الذاتي... على الأقل حتى الآن.

 

إسلام العبادي (أبوظبي)

المصدر: صحيفة الاتحاد

كلمات دلالية: تشات جي بي تي الذكاء الاصطناعي الذکاء الاصطناعی

إقرأ أيضاً:

جدة.. "الداخلية" تستعرض الذكاء الاصطناعي في إدارة الحشود

أقامت وزارة الداخلية أمس، معرضها المتنقل للتعريف بالخدمات المقدمة لضيوف الرحمن، الذي يستمر حتى (26 رمضان 1446هـ الموافق 26 مارس 2025م)، وذلك في محافظة جدة.
ويهدف معرض الداخلية إلى عرض تطبيقات الذكاء الاصطناعي في إدارة الحشود، وجهود الوزارة في موسم العمرة للمحافظة على أمن وسلامة قاصدي الحرمين الشريفين.
أخبار متعلقة ترسيخًا للوحدة.. الكشافة السعودية تحيي يوم الأخوة الكشفية العربية"إحسان".. تأمين أكثر من 3000 رحلة عمرة وبناء وصيانة 63 مسجدًا .article-img-ratio{ display:block;padding-bottom: 67%;position:relative; overflow: hidden;height:0px; } .article-img-ratio img{ object-fit: contain; object-position: center; position: absolute; height: 100% !important;padding:0px; margin: auto; width: 100%; } معرض الداخلية في جدة - واس معرض الداخلية في جدة - واس var owl = $(".owl-articleMedia"); owl.owlCarousel({ nav: true, dots: false, dotClass: 'owl-page', dotsClass: 'owl-pagination', loop: true, rtl: true, autoplay: false, autoplayHoverPause: true, autoplayTimeout: 5000, navText: ["", ""], thumbs: true, thumbsPrerendered: true, responsive: { 990: { items: 1 }, 768: { items: 1 }, 0: { items: 1 } } });معرض الداخليةكما يستهدف المعرض تعزيز مستوى الوعي الصحي والوقاية من الأمراض وخدمة فرجت، واستقبال البلاغات الأمنية والإنسانية الطارئة من خلال مراكز العمليات الأمنية الموحدة (911) وأبرز خدمات منصة "أبشر" الإلكترونية.
.article-img-ratio{ display:block;padding-bottom: 67%;position:relative; overflow: hidden;height:0px; } .article-img-ratio img{ object-fit: contain; object-position: center; position: absolute; height: 100% !important;padding:0px; margin: auto; width: 100%; } معرض الداخلية في جدة - واس

مقالات مشابهة

  • سباق نحو الذكاء العام.. اختبار جديد يتحدى أقوى نماذج الذكاء الاصطناعي
  • من يُلام في خطأ طبي يرتكبه الذكاء الاصطناعي؟
  • Gmail يطور ميزة البحث .. الذكاء الاصطناعي يحدد ما تحتاجه أولا
  • عبدالرحمن المشيفري: نتطلع لكسب التحدي أمام الكويت
  • صاروخ “KEMANKEŞ 1” يدخل التاريخ: أول صاروخ تركي يستخدم الذكاء الاصطناعي لتحطيم الأهداف الاستراتيجية
  • الذكاء الاصطناعي… أهو باب لمستقبل واعد أم مدخل إلى المجهول؟
  • الذكاء الاصطناعي يساعد في الكشف عن علاج سرطان نادر
  • أمازون بيدروك.. هل تشكل حجر الأساس لثورة الذكاء الاصطناعي؟
  • جدة.. "الداخلية" تستعرض الذكاء الاصطناعي في إدارة الحشود