فيلم هنا.. تعاون جديد بين زيميكس وتوم هانكس يختصر التاريخ في غرفة الجلوس.

المصدر: شفق نيوز

كلمات دلالية: العراق هاكان فيدان تركيا محمد شياع السوداني انتخابات مجالس المحافظات بغداد ديالى نينوى ذي قار ميسان اقليم كوردستان السليمانية اربيل نيجيرفان بارزاني إقليم كوردستان العراق بغداد اربيل تركيا اسعار الدولار روسيا ايران يفغيني بريغوجين اوكرانيا امريكا كرة اليد كرة القدم المنتخب الاولمبي العراقي المنتخب العراقي بطولة الجمهورية الكورد الفيليون الكورد الفيليون خانقين البطاقة الوطنية مطالبات العراق بغداد ذي قار ديالى حادث سير الكورد الفيليون مجلة فيلي عاشوراء شهر تموز مندلي

إقرأ أيضاً:

رغم تفوقه في البرمجة.. نماذج الذكاء الاصطناعي تخفق في التاريخ

على الرغم من تميز الذكاء الاصطناعي في بعض المهام مثل البرمجة أو إنشاء البودكاست، إلا أنه يُظهر ضعفًا واضحًا في اجتياز اختبارات التاريخ المتقدمة، وفقًا لدراسة حديثة.  

         

 

GPT-4 وLlama وGemini: نماذج لغوية فشلت في تقديم إجابات دقيقة



قام فريق من الباحثين بتطوير معيار جديد لاختبار ثلاث نماذج لغوية ضخمة رائدة: "GPT-4" من أوبن إي آي، و"Llama" من ميتا، و"Gemini" من جوجل، في الإجابة عن أسئلة تاريخية. يعتمد هذا المعيار، المعروف باسم "Hist-LLM"، على قاعدة بيانات التاريخ العالمي "Seshat"، وهي قاعدة بيانات شاملة للمعرفة التاريخية. 

النتائج التي تم تقديمها الشهر الماضي في مؤتمر "NeurIPS" المرموق، كانت مخيبة للآمال. حيث حقق أفضل نموذج، وهو "GPT-4 Turbo"، دقة بلغت حوالي 46% فقط، وهي نسبة بالكاد تفوق التخمين العشوائي.  


اقرأ أيضاً.. هل يتفوق "O3" على البشر؟ قفزة جديدة تُعيد تعريف الذكاء الاصطناعي

 

وأوضحت "ماريا ديل ريو-تشانونا"، إحدى المشاركات في الدراسة وأستاذة علوم الحاسوب في جامعة كوليدج لندن: "الاستنتاج الأساسي من هذه الدراسة هو أن النماذج اللغوية الكبيرة، رغم إمكانياتها المذهلة، لا تزال تفتقر إلى الفهم العميق المطلوب للتعامل مع استفسارات تاريخية متقدمة. يمكنها التعامل مع الحقائق الأساسية، ولكن عندما يتعلق الأمر بالتحليل العميق على مستوى الدكتوراه، فهي غير قادرة على الأداء المطلوب بعد". 

 



أخبار ذات صلة وداعاً للكلمات المفتاحية.. الذكاء الاصطناعي يعيد تعريف البحث في ويندوز 11 مدير عام مركز إدارة الطوارئ والأزمات والكوارث لإمارة أبوظبي لـ«الاتحاد»: توظيف الذكاء الاصطناعي

القصور في الفهم العميق



 

من الأمثلة التي فشل فيها النموذج، سؤال عن استخدام الدروع القشرية في فترة معينة من مصر القديمة. أجاب "GPT-4 Turbo" بنعم، بينما الحقيقة أن هذه التقنية لم تظهر في مصر إلا بعد 1500 عام.  

يرجع هذا القصور، وفقًا للباحثين، إلى اعتماد النماذج على بيانات تاريخية بارزة، مما يصعّب عليها استرجاع المعلومات النادرة أو الأقل شهرة.

كما أشار الباحثون إلى وجود أداء أضعف للنماذج في مناطق معينة، مثل إفريقيا جنوب الصحراء الكبرى، مما يبرز التحيزات المحتملة في بيانات التدريب.


اقرأ أيضاً..  الذكاء الاصطناعي يفك شيفرة أصوات الطيور المهاجرة


 

التحديات المستمرة



وأكد "بيتر تيرتشين"، قائد الدراسة وأستاذ بمعهد علوم التعقيد في النمسا، أن هذه النتائج تُظهر أن النماذج اللغوية لا تزال غير بديل عن البشر في مجالات معينة. ومع ذلك، يبقى الأمل في أن تسهم هذه النماذج في مساعدة المؤرخين مستقبلاً. يعمل الباحثون على تحسين المعيار بإضافة بيانات من مناطق غير ممثلة بشكل كافٍ وتضمين أسئلة أكثر تعقيدًا.  

واختتمت الدراسة بالقول: "رغم أن نتائجنا تسلط الضوء على المجالات التي تحتاج إلى تحسين، إلا أنها تؤكد أيضًا الإمكانيات الواعدة لهذه النماذج في دعم البحث التاريخي". 

 

المصدر: وكالات

مقالات مشابهة

  • مقارنة بين خسائر إسرائيل في حربها على غزة وحروبها عبر التاريخ
  • «ابن صفية».. رواية تجمع بين التاريخ والمجتمع في معرض القاهرة للكتاب
  • علماء عرب عبر التاريخ.. ابن زهر الذي غيَّر مسار الطب العالمي
  • ترامب: انتخابات 2024 كانت الأهم في التاريخ الأمريكي
  • أغلى 10 لاعبين عرب فى التاريخ
  • رابط رسمي.. نتيجة الصف الأول الإعدادي برقم الجلوس
  • نتيجة الصف الثاني الإعدادي برقم الجلوس
  • رغم تفوقه في البرمجة.. نماذج الذكاء الاصطناعي تخفق في التاريخ
  • نتيجة الصف الثالث الابتدائي برقم الجلوس في بورسعيد
  • برج الفتاة أسطورة التاريخ والحب ولؤلؤة إسطنبول