لماذا يعد شات جي بي تي سيئا جدا في الرياضيات؟
تاريخ النشر: 7th, October 2024 GMT
إذا جربت يوما استخدام "شات جي بي تي" كآلة حاسبة، فمن المؤكد أنك لاحظت عجزه في الرياضيات. فروبوت الدردشة سيئ في الحساب، وهذه ليست ميزة فريدة من نوعها بين أدوات الذكاء الاصطناعي.
فمن جهة أخرى، لا يستطيع "كلود" (Claude) من "أنثروبي" (Anthropic) حل مشكلات الكلمات البسيطة، ويفشل "جيميني" (Gemini) في فهم المعادلات التربيعية، ويواجه "لاما" (Llama) من "ميتا" (Meta) صعوبة في عملية جمع بسيطة.
الجواب هو "عملية الترميز" حيث يساعد الذكاء الاصطناعي في ترميز المعلومات بكثافة من خلال عملية تجزئة البيانات إلى أجزاء (على سبيل المثال، تقسيم كلمة "جميل" إلى مقاطع "ج" "م" "ي" "ل"). ولأن أدوات التجزئة في النماذج الذكية لا تعرف ما هي الأرقام، فغالبا ما تنتهي بتخريب العلاقات بينها.
فعلى سبيل المثال، قد تعالج أداة التجزئة الرقم "380" على أنه عنصر واحد، ولكنها تفهم العدد "381" على أنه زوج من الأرقام ("38" و "1")، وهنا يحدث الخطأ.
ولكن عملية الترميز ليست السبب الوحيد في ضعف الذكاء الاصطناعي في الرياضيات. فأنظمة الذكاء الاصطناعي عبارة عن آلات إحصائية، وبعد تدريبها على العديد من الأمثلة تتعلم أنماط تلك الأمثلة لتقديم التوقعات.
وفي أحد الأمثلة، عند سؤال "شات جي بي تي" عن مسألة ضرب مثل 5,7897 × 1,2832، من المحتمل أن يستنتج النموذج أن حاصل ضرب رقم ينتهي بـ"7″ ورقم ينتهي بـ"2″ سينتهي بـ"4″. وذلك بالاعتماد على الأخطاء في عمليات ضرب واجهها سابقا وتعلم منها.
ولكنه سيواجه صعوبة في الجزء الأوسط، وسيعطي الجواب على أنه 742,021,104 بينما الجواب الصحيح هو 742,934,304.
وقام يونتيان دينغ، الأستاذ المساعد في جامعة واترلو والمتخصص في الذكاء الاصطناعي، بتقييم شامل لقدرات الضرب في "شات جي بي تي" في دراسة أجراها هذا العام.
وقد وجد هو وزملاؤه أن النموذج الافتراضي "جي بي تي -4 أو" (GPT-4o) واجه صعوبة في ضرب أعداد مكونة من أكثر من 4 أرقام مثل 3,459 × 5,284.
وقال دينغ إن "جي بي تي -4 أو" يواجه صعوبة في ضرب الأرقام المتعددة، إذ يحقق دقة أقل من 30% في ضرب أعداد مكونة من 4 أرقام. وأضاف أن عمليات حسابية كهذه "تُشكل تحديا لنماذج اللغة لأن أي خطأ في أي خطوة تالية يمكن أن يتراكم، ومن ثم يؤدي إلى نتيجة نهائية غير صحيحة".
ومن جهة أخرى، يشعر دينغ بالتفاؤل. ففي الدراسة أجراها هو وزملاؤه على نموذج "أو1" (o1)، وهو نموذج "الاستدلال" الخاص بشركة "أوبن إيه آي"، حقق النموذج نتائج أفضل بكثير من "جي بي تي -4 أو"، حيث تمكن من حل عمليات ضرب أعداد مكونة من 9 أرقام بشكل صحيح في نصف الوقت تقريبا.
وأضاف "قد يحل النموذج عملية الضرب بطرق تختلف عن الطرق التي نحلها يدويا، وهذا يثير فضولنا حول نهج النموذج في حل المسائل وكيف يختلف عن الاستدلال البشري".
المصدر: الجزيرة
كلمات دلالية: حراك الجامعات حريات الذکاء الاصطناعی شات جی بی تی صعوبة فی
إقرأ أيضاً:
إيران.. إطلاق منصة وطنية لـ«الذكاء الاصطناعي»
بجهود 100 باحث إيراني، كسفت طهران، اليوم السبت، “عن النسخة الأولية لمنصة “الذكاء الاصطناعي” الوطنية (الإصدار 3.0)”.
وأفادت وكالة مهر للأنباء، “أنه أُقيمت مراسم إطلاق منصة “الذكاء الاصطناعي الوطنية مفتوحة المصدر” في مركز المؤتمرات الدولية “رايزن”.
وأعرب الدكتور هرمزي نجاد، مدير الشؤون البحثية في الجامعة ومدير مشروع المنصة، “عن شكره لفريق تطوير هذه المنصة الذي يضم حوالي 100 شخص من الطلاب والباحثين بعد الدكتوراه والمطورين الذين انضموا إلينا من الجامعة”.
وأشار هرمزي نجاد، “إلى أهمية هذا المشروع، مقدماً شكره الخاص لـ 15 من أعضاء هيئة التدريس الذين شاركوا بشكل مباشر في هذا المشروع، كما أعرب عن تقديره للدكتور أفشين، نائب رئيس الجمهورية للشؤون العلمية، الذي كان له دور بارز في دعم هذا المجال”.
وأكد هرمزي نجاد، الذي يدير الشؤون البحثية في الجامعة منذ ثماني سنوات، أن “التركيز على مجال استراتيجي مثل الذكاء الاصطناعي لم يكن بهذا المستوى من قبل في البلاد”.
وأعرب عن تفاؤله “بأن جميع الباحثين والأكاديميين والشركات المعنية في هذا المجال سيستفيدون بشكل كبير من هذه المنصة قريباً”.
هذا “وتُعد هذه المنصة مشروعا تقنيا وطنيا تم تطويره باستخدام خبرات الأساتذة المحليين، وتهدف إلى توفير بنية تحتية متكاملة لتحليل البيانات وتطوير تطبيقات الذكاء الاصطناعي، وفق الخطط الاستراتيجية للبلاد”.
ووفقا لوكالة الأنباء الإيرانية “إيرنا”، أكد حسين أسدي، مدير مركز المعالجة السريعة، أن “المنصة تعتمد على تقنيات مفتوحة المصدر مع تحسينات محلية، كما تم تطوير وحداتها الإلكترونية بالكامل داخل البلاد لضمان الأمان والاستقلالية”.
وأوضح أسدي، “أنه لم يتم استخدام أي واجهات برمجية خارجية (APIs)، ما يضمن استمرارية عمل المنصة حتى في حال انقطاع الإنترنت بالبلاد بالكامل”.
وأشار أسدي، “إلى أن المنصة تتميز بسرعة التطوير وانخفاض التكلفة وقابليتها للتوسع، مع توقعات بإكمال الإصدار النهائي، بحلول سبتمبر2025”.