على الرغم من تميز الذكاء الاصطناعي في بعض المهام مثل البرمجة أو إنشاء البودكاست، إلا أنه يُظهر ضعفًا واضحًا في اجتياز اختبارات التاريخ المتقدمة، وفقًا لدراسة حديثة.  

         

 

GPT-4 وLlama وGemini: نماذج لغوية فشلت في تقديم إجابات دقيقة



قام فريق من الباحثين بتطوير معيار جديد لاختبار ثلاث نماذج لغوية ضخمة رائدة: "GPT-4" من أوبن إي آي، و"Llama" من ميتا، و"Gemini" من جوجل، في الإجابة عن أسئلة تاريخية.

يعتمد هذا المعيار، المعروف باسم "Hist-LLM"، على قاعدة بيانات التاريخ العالمي "Seshat"، وهي قاعدة بيانات شاملة للمعرفة التاريخية. 

النتائج التي تم تقديمها الشهر الماضي في مؤتمر "NeurIPS" المرموق، كانت مخيبة للآمال. حيث حقق أفضل نموذج، وهو "GPT-4 Turbo"، دقة بلغت حوالي 46% فقط، وهي نسبة بالكاد تفوق التخمين العشوائي.  


اقرأ أيضاً.. هل يتفوق "O3" على البشر؟ قفزة جديدة تُعيد تعريف الذكاء الاصطناعي

 

وأوضحت "ماريا ديل ريو-تشانونا"، إحدى المشاركات في الدراسة وأستاذة علوم الحاسوب في جامعة كوليدج لندن: "الاستنتاج الأساسي من هذه الدراسة هو أن النماذج اللغوية الكبيرة، رغم إمكانياتها المذهلة، لا تزال تفتقر إلى الفهم العميق المطلوب للتعامل مع استفسارات تاريخية متقدمة. يمكنها التعامل مع الحقائق الأساسية، ولكن عندما يتعلق الأمر بالتحليل العميق على مستوى الدكتوراه، فهي غير قادرة على الأداء المطلوب بعد". 

 



أخبار ذات صلة وداعاً للكلمات المفتاحية.. الذكاء الاصطناعي يعيد تعريف البحث في ويندوز 11 مدير عام مركز إدارة الطوارئ والأزمات والكوارث لإمارة أبوظبي لـ«الاتحاد»: توظيف الذكاء الاصطناعي

القصور في الفهم العميق



 

من الأمثلة التي فشل فيها النموذج، سؤال عن استخدام الدروع القشرية في فترة معينة من مصر القديمة. أجاب "GPT-4 Turbo" بنعم، بينما الحقيقة أن هذه التقنية لم تظهر في مصر إلا بعد 1500 عام.  

يرجع هذا القصور، وفقًا للباحثين، إلى اعتماد النماذج على بيانات تاريخية بارزة، مما يصعّب عليها استرجاع المعلومات النادرة أو الأقل شهرة.

كما أشار الباحثون إلى وجود أداء أضعف للنماذج في مناطق معينة، مثل إفريقيا جنوب الصحراء الكبرى، مما يبرز التحيزات المحتملة في بيانات التدريب.


اقرأ أيضاً..  الذكاء الاصطناعي يفك شيفرة أصوات الطيور المهاجرة


 

التحديات المستمرة



وأكد "بيتر تيرتشين"، قائد الدراسة وأستاذ بمعهد علوم التعقيد في النمسا، أن هذه النتائج تُظهر أن النماذج اللغوية لا تزال غير بديل عن البشر في مجالات معينة. ومع ذلك، يبقى الأمل في أن تسهم هذه النماذج في مساعدة المؤرخين مستقبلاً. يعمل الباحثون على تحسين المعيار بإضافة بيانات من مناطق غير ممثلة بشكل كافٍ وتضمين أسئلة أكثر تعقيدًا.  

واختتمت الدراسة بالقول: "رغم أن نتائجنا تسلط الضوء على المجالات التي تحتاج إلى تحسين، إلا أنها تؤكد أيضًا الإمكانيات الواعدة لهذه النماذج في دعم البحث التاريخي". 

 

المصدر: وكالات

المصدر: صحيفة الاتحاد

كلمات دلالية: تشات جي بي تي أوبن إي آي نماذج الذكاء الاصطناعي التوليدية بودكاست البرمجة الذكاء الاصطناعي جوجل الذکاء الاصطناعی

إقرأ أيضاً:

ثورة علمية.. الذكاء الاصطناعي يحل لغزا حيّر العلماء لأكثر من مئة عام

#سواليف

حلّ فريق من #العلماء في الولايات المتحدة لغزا عمره أكثر من مئة عام باستخدام #الذكاء_الاصطناعي، ما قد يمهّد الطريق ويفتح الآفاق لإنجازات تقنية متقدمة.

وتمكن علماء كلية كولومبيا للهندسة في نيويورك من تحديد البنية الذرية الدقيقة لما يُعرف بالبلورات النانوية، وهي جزيئات بالغة الصغر تُستخدم في مجالات متعددة تشمل تصنيع الإلكترونيات وتطوير مواد جديدة، وحتى تحليل القطع الأثرية في علم الآثار.

وتتمثل أهمية هذا الاكتشاف في أن #البلورات_النانوية، لصغر حجمها وافتقارها إلى الترتيب المنتظم، كانت تمثّل تحديا كبيرا أمام العلماء الذين اعتمدوا لعقود على تقنيات حيود #الأشعة_السينية لتحليل تركيب المواد الصلبة، حيث تُسلّط الأشعة على بلورات كبيرة ومنتظمة فيُنتج نمط يظهر ترتيب الذرات داخل المادة. لكن هذه الطريقة تفشل مع البلورات النانوية، لأنها صغيرة وغير منتظمة وتُشتّت الأشعة إلى أنماط غير واضحة يصعب تفسيرها.

مقالات ذات صلة موظف سابق في مايكروسوفت: الشركة تهتم بالربح المادي على حساب الدم الفلسطيني 2025/04/25

وللتغلب على هذا التحدي، ابتكر فريق البحث خوارزمية ذكاء اصطناعي متقدمة أُطلق عليها اسم PXRDnet، دُربت على تحليل أنماط حيود معقدة باستخدام قاعدة بيانات ضخمة تحتوي على عشرات الآلاف من التركيبات البلورية المعروفة. ورغم أن هذه التركيبات ليست مرتبطة مباشرة بالبلورات النانوية قيد الدراسة، فإن الخوارزمية نجحت في تعلّم الأنماط المحتملة لترتيب الذرات في هذه المواد النانوية.

وقال البروفيسور سيمون بيلينغ، أستاذ علوم المواد والفيزياء والرياضيات التطبيقية في جامعة كولومبيا: “استطاع الذكاء الاصطناعي حل هذه المشكلة المعقدة من خلال تعلم أنماط الترتيب الذري التي تسمح بها الطبيعة، حتى دون توفر معرفة فيزيائية مباشرة بالمواد المدروسة”.

وتعمل خوارزمية PXRDnet على تحليل أنماط الحيود الناتجة عن بلورات نانوية يصل حجمها إلى 10 أنغستروم فقط، أي أرقّ بنحو عشرة آلاف مرة من شعرة الإنسان، ما يفتح آفاقا لفهم المواد على مستوى بالغ الدقة.

واعتبر العلماء هذا التطور نقلة نوعية في علم المواد، لأنه يتيح تحديد بنية المواد النانوية بدقة عالية دون الحاجة إلى بلورات كبيرة أو أدوات باهظة الثمن.

وقال غابي غو، قائد الفريق البحثي: “حين كنت في المدرسة الإعدادية، كانت أنظمة الذكاء الاصطناعي لا تزال تكافح لتمييز القطط من الكلاب. أما اليوم، فها نحن نستخدمها لحل مشكلات علمية معقدة كانت مستعصية على البشر لعقود”.

وأضاف البروفيسور هود ليبسون، رئيس قسم الهندسة الميكانيكية بجامعة كولومبيا:
“المثير للدهشة هو أن الذكاء الاصطناعي، رغم افتقاره إلى فهم مباشر للفيزياء أو الهندسة، تمكّن من التوصل إلى حل لمعضلة حيرت العلماء لأكثر من مئة عام. وهذا يعطي لمحة عمّا يمكن أن يقدمه الذكاء الاصطناعي في مجالات علمية أخرى تواجه تحديات مماثلة”.

مقالات مشابهة

  • تقني يوضح كيف يستفيد الكفيف من تقنيات الذكاء الاصطناعي؟ ..فيديو
  • ويكيبيديا تدخل عصر الذكاء الاصطناعي دون الاستغناء عن المحررين
  • مايكروسوفت.. نماذج صغيرة تنافس عمالقة الذكاء الاصطناعي
  • لطلاب الثانوية العامة| نماذج استرشادية جديدة لمادة الفيزياء عبر هذا الرابط اليوم
  • كيف يشكل الذكاء الاصطناعي مستقبلنا الرقمي؟ وما جانبه المظلم؟
  • ديباك شوبرا: الذكاء الاصطناعي أداة لاكتشاف الذات
  • التعليم تنشر نماذج استرشادية جديدة لـ امتحانات الثانوية العامة في الإحصاء.. اليوم
  • خبراء يحذِّرون: الذكاء الاصطناعي يجعل البشر أغبياء
  • مخاطر الذكاء الاصطناعي على التعليم والبحث العلمي
  • ثورة علمية.. الذكاء الاصطناعي يحل لغزا حيّر العلماء لأكثر من مئة عام