جدل حول أداء نموذج Maverick من ميتا.. هل تلاعبت الشركة بالنتائج على LM Arena؟
تاريخ النشر: 7th, April 2025 GMT
في خطوة أثارت تساؤلات عديدة داخل الأوساط التقنية، أعلنت شركة Meta يوم السبت عن إصدار مجموعة جديدة من نماذج الذكاء الاصطناعي الرائدة، من بينها النموذج الذي يحمل اسم "Maverick"، والذي سرعان ما احتل المركز الثاني على منصة LM Arena، وهي ساحة اختبار يقارن فيها البشر بين نتائج النماذج ويختارون الأفضل.
لكن سرعان ما اكتشف باحثون في مجال الذكاء الاصطناعي عبر منصة X (تويتر سابقاً) أن النموذج الذي اختبرته ميتا على LM Arena ليس هو نفس النسخة المتاحة للمطورين.
بحسب ما نشرته ميتا رسميًا، فإن النسخة التي استخدمت في تقييم LM Arena تُعرف بأنها "نسخة دردشة تجريبية".
وفي موقع Llama الرسمي، يظهر توضيح بأن النموذج الذي تم تقييمه هو "Llama 4 Maverick المعدّل لزيادة قدراته الحوارية"، ما يعني أن ميتا أجرت تعديلات على النموذج خصيصاً لتحسين أدائه في هذا النوع من الاختبارات.
تخصيص نموذج AI للتفوّق في اختبار معين ثم طرح نسخة أقل أداءً للعامة يثير مخاوف تتعلق بالشفافية والمصداقية. فمثل هذه الخطوة تضع المطورين والمستخدمين في مأزق، إذ لا يمكنهم الوثوق بأن الأداء الذي شاهدوه في التقييمات سينعكس فعليًا عند استخدام النموذج في تطبيقاتهم أو أبحاثهم.
فوارق ملحوظة بين النسختينالباحثون الذين جربوا النسخة العامة من Maverick لاحظوا اختلافات واضحة مقارنة بنسخة LM Arena، من بينها ، النموذج في LM Arena يستخدم الكثير من الرموز التعبيرية (emojis).
اما إجابات النموذج هناك طويلة للغاية ومفرطة في التفاصيل مقارنة بالنسخة "الفانيلا" (غير المعدلة) التي يمكن للمطورين تحميلها.
LM Arena منصة تقييم غير مثاليةرغم أن LM Arena تعتبر مرجعًا مهمًا في تقييم نماذج الذكاء الاصطناعي، إلا أنها تعاني من قصور معروف، إذ أنها تعتمد على تفضيلات بشرية قد تكون ذاتية، ولا تمثل دائمًا الأداء الواقعي للنماذج في سيناريوهات معقدة أو تطبيقات فعلية، إلا أن الشركات عمومًا لا تقوم بتخصيص نماذجها خصيصًا للتفوّق في هذه المنصة أو على الأقل، لا تعترف بذلك علنًا.
ميتا في مرمى النقديضع هذا التحايل المحتمل ميتا تحت ضغط متزايد، خاصة في ظل المنافسة الشرسة مع نماذج مثل GPT-4 من OpenAI أو Claude من Anthropic.
وقد تواصلت جهات صحفية مع شركة Meta ومنصة Chatbot Arena (الجهة المشرفة على LM Arena) للحصول على تعليق رسمي، لكن حتى الآن، لم يصدر أي رد.
المصدر: صدى البلد
كلمات دلالية: الذكاء الاصطناعي المزيد نماذج الذکاء الاصطناعی
إقرأ أيضاً:
التعليم تنشر نماذج استرشادية جديدة لـ امتحانات الثانوية العامة في الإحصاء.. اليوم
أكدت وزارة التربية والتعليم والتعليم الفني أنه سيتم اليوم الأربعاء، استكمال نشر النماذج الاسترشادية الجديدة لـ امتحانات الثانوية العامة 2025 على موقع وزارة التربية والتعليم.
وحسب ما أعلنته وزارة التربية والتعليم والتعليم الفني، من المقرّر أن يتاح اليوم الأربعاء على موقع وزارة التربية والتعليم، رابط النماذج الاسترشادية الجديدة لـ امتحانات الثانوية العامة 2025 عدد 2 نموذج استرشادي لـ مادة الإحصاء.
وبدأت وزارة التربية والتعليم السبت الماضي نشر النماذج الاسترشادية الجديدة لـ امتحانات الثانوية العامة 2025 ، حيث نشرت السبت الماضي الموافق 26 ابريل 2025 عدد 2 نموذج لمادة اللغة العربية ، بينما نشرت يوم الأحد عدد 2 نموذج لمادة الكيمياء باللغة العربية ، ونشرت يوم الاثنين عدد 2 نموذج لمادة اللغة الإنجليزية ، ثم نشرت أمس الثلاثاء عدد 2 نموذج للكيمياء باللغة الإنجليزية.
رابط النماذج الاسترشادية الجديدة لـ امتحانات الثانوية العامة 2025
ويمكن لجميع طلاب الثانوية العامة 2025 الوصول إلى رابط النماذج الاسترشادية الجديدة لـ امتحانات الثانوية العامة 2025 على موقع وزارة التربية والتعليم ، يمكن الوصول إليه من خلال الضغط هنا
وأكدت وزارة التربية والتعليم أنه سيتم إتاحة إجابات النماذج الاسترشادية الجديدة لـ امتحانات الثانوية العامة 2025 عبر قناة "مدرستنا 3" من خلال نخبة متميزة من المعلمين ، حيث يخصص يوم لكل مادة، فى تمام الساعة العاشرة مساء يوميا، على أن تكون الإعادة فى تمام الساعة العاشرة صباح اليوم التالي، وذلك عبر تردد القناة على النايل سات 12206 أُفقي معدل ترميز 27500.
وقالت الوزارة أن توفير النماذج الاسترشادية الجديدة لـ امتحانات الثانوية العامة 2025 ، وإتاحة إجاباتها عبر قناة "مدرستنا 3" يتيح الفرصة لطلاب الثانوية العامة 2025 لمراجعة المحتوى الدراسي، والتدرب على الامتحانات بشكل فعال ونموذجي، من خلال تقديم شرح وافٍ لكيفية حل نماذج الامتحانات.
جدول مواعيد نشر النماذج الاسترشادية الجديدة لـ امتحانات الثانوية العامة 2025السبت 26 أبريل : اللغة العربية
الأحد 27 أبريل : الكيمياء
الاثنين 28 أبريل : اللغة الإنجليزية
الثلاثاء 29 أبريل : Chemistry
الاربعاء 30 أبريل : الإحصاء
الخميس 1 مايو : الفيزياء
الجمعة 2 مايو : اللغة الألمانية
السبت 3 مايو : Physics
الأحد 4 مايو : الجغرافيا
الأثنين 5 مايو : الرياضيات التطبيقية
الثلاثاء 6 مايو : Statistics
الأربعاء 7 مايو : الأحياء
الخميس 8 مايو : Pure_Math
الجمعة 9 مايو : اللغة الفرنسية
السبت 10 مايو : الرياضيات البحتة
الاحد 11 مايو : التاريخ
الأثنين 12 مايو : Applid Math
الثلاثاء 13 مايو : Biology