رغم تفوقه في البرمجة.. نماذج الذكاء الاصطناعي تخفق في التاريخ
تاريخ النشر: 20th, January 2025 GMT
على الرغم من تميز الذكاء الاصطناعي في بعض المهام مثل البرمجة أو إنشاء البودكاست، إلا أنه يُظهر ضعفًا واضحًا في اجتياز اختبارات التاريخ المتقدمة، وفقًا لدراسة حديثة.
GPT-4 وLlama وGemini: نماذج لغوية فشلت في تقديم إجابات دقيقة
قام فريق من الباحثين بتطوير معيار جديد لاختبار ثلاث نماذج لغوية ضخمة رائدة: "GPT-4" من أوبن إي آي، و"Llama" من ميتا، و"Gemini" من جوجل، في الإجابة عن أسئلة تاريخية.
النتائج التي تم تقديمها الشهر الماضي في مؤتمر "NeurIPS" المرموق، كانت مخيبة للآمال. حيث حقق أفضل نموذج، وهو "GPT-4 Turbo"، دقة بلغت حوالي 46% فقط، وهي نسبة بالكاد تفوق التخمين العشوائي.
اقرأ أيضاً.. هل يتفوق "O3" على البشر؟ قفزة جديدة تُعيد تعريف الذكاء الاصطناعي
وأوضحت "ماريا ديل ريو-تشانونا"، إحدى المشاركات في الدراسة وأستاذة علوم الحاسوب في جامعة كوليدج لندن: "الاستنتاج الأساسي من هذه الدراسة هو أن النماذج اللغوية الكبيرة، رغم إمكانياتها المذهلة، لا تزال تفتقر إلى الفهم العميق المطلوب للتعامل مع استفسارات تاريخية متقدمة. يمكنها التعامل مع الحقائق الأساسية، ولكن عندما يتعلق الأمر بالتحليل العميق على مستوى الدكتوراه، فهي غير قادرة على الأداء المطلوب بعد".
القصور في الفهم العميق
من الأمثلة التي فشل فيها النموذج، سؤال عن استخدام الدروع القشرية في فترة معينة من مصر القديمة. أجاب "GPT-4 Turbo" بنعم، بينما الحقيقة أن هذه التقنية لم تظهر في مصر إلا بعد 1500 عام.
يرجع هذا القصور، وفقًا للباحثين، إلى اعتماد النماذج على بيانات تاريخية بارزة، مما يصعّب عليها استرجاع المعلومات النادرة أو الأقل شهرة.
كما أشار الباحثون إلى وجود أداء أضعف للنماذج في مناطق معينة، مثل إفريقيا جنوب الصحراء الكبرى، مما يبرز التحيزات المحتملة في بيانات التدريب.
اقرأ أيضاً.. الذكاء الاصطناعي يفك شيفرة أصوات الطيور المهاجرة
التحديات المستمرة
وأكد "بيتر تيرتشين"، قائد الدراسة وأستاذ بمعهد علوم التعقيد في النمسا، أن هذه النتائج تُظهر أن النماذج اللغوية لا تزال غير بديل عن البشر في مجالات معينة. ومع ذلك، يبقى الأمل في أن تسهم هذه النماذج في مساعدة المؤرخين مستقبلاً. يعمل الباحثون على تحسين المعيار بإضافة بيانات من مناطق غير ممثلة بشكل كافٍ وتضمين أسئلة أكثر تعقيدًا.
واختتمت الدراسة بالقول: "رغم أن نتائجنا تسلط الضوء على المجالات التي تحتاج إلى تحسين، إلا أنها تؤكد أيضًا الإمكانيات الواعدة لهذه النماذج في دعم البحث التاريخي".
المصدر: وكالات
المصدر: صحيفة الاتحاد
كلمات دلالية: تشات جي بي تي أوبن إي آي نماذج الذكاء الاصطناعي التوليدية بودكاست البرمجة الذكاء الاصطناعي جوجل الذکاء الاصطناعی
إقرأ أيضاً:
دبي.. مبادرة لاعتماد الشركات الموثوقة في الذكاء الاصطناعي
تنفيذاً لتوجيهات الشيخ حمدان بن محمد بن راشد آل مكتوم ولي عهد دبي نائب رئيس مجلس الوزراء وزير الدفاع رئيس مجلس أمناء مؤسسة دبي للمستقبل، أعلن مركز دبي لاستخدامات الذكاء الاصطناعي، اليوم الإثنين، إطلاق مبادرة جديدة لتصنيف واعتماد الشركات لموثوقة في مجال الذكاء الاصطناعي بدبي، بما يسهم بتوفير إطار شامل يعزز فرص الشراكات بين الجهات الحكومية والشركات التكنولوجية المتخصصة في تطوير وتوفير تطبيقات الذكاء الاصطناعي في دبي والإمارات ومختلف دول العالم.
وتشمل هذه المبادرة نظاماً لتصنيف واعتماد الشركات الخاصة العاملة في مختلف تخصصات الذكاء الاصطناعي بحيث يمكن للجهات الحكومية والخاصة الوصول لخدمات هذه الشركات الموثوقة بشكل آمن وفعال وبما يسهم أيضاً بتخفيف التكاليف والإجراءات، وذلك تماشياً مع مستهدفات "خطة دبي السنوية لتسريع تبني استخدامات وتطبيقات الذكاء الاصطناعي".وتهدف المبادرة الأولى من نوعها، لتأسيس شبكة من الشركات الموثوقة والمتخصصة بتطوير الخدمات التقنيات المتقدمة في دبي بما يسهم بتوفير خيارات آمنة لتتعامل معها الجهات الحكومية والمؤسسات الخاصة لتنفيذ مشاريعها ومبادراتها المرتكزة على تطبيقات الذكاء الاصطناعي.
وستحصل الشركات المشاركة على شارة اعتماد "Dubai AI Seal" برقم تسلسلي وتصنيف رئيسي خاص بها، ستكون مطلوبة في الفترة المقبلة ليتم اختيارها للعمل في المشاريع الوطنية والتكنولوجية في دبي. ويمكن لهذه الشركات استخدام شارة الاعتماد في جميع منصاتها الرقمية وحملاتها الترويجية.
وتتيح المبادرة أيضاً فرصة التقدم وبشكل مجاني لجميع الشركات التكنولوجية التي تمتلك رخصة لممارسة الأعمال في دبي وتقدم خدمات ومنتجات مرتبطة بالذكاء الاصطناعي أو تستخدم تطبيقاته في خدماتها.