جدل حول أداء نموذج Maverick من ميتا.. هل تلاعبت الشركة بالنتائج على LM Arena؟
تاريخ النشر: 7th, April 2025 GMT
في خطوة أثارت تساؤلات عديدة داخل الأوساط التقنية، أعلنت شركة Meta يوم السبت عن إصدار مجموعة جديدة من نماذج الذكاء الاصطناعي الرائدة، من بينها النموذج الذي يحمل اسم "Maverick"، والذي سرعان ما احتل المركز الثاني على منصة LM Arena، وهي ساحة اختبار يقارن فيها البشر بين نتائج النماذج ويختارون الأفضل.
لكن سرعان ما اكتشف باحثون في مجال الذكاء الاصطناعي عبر منصة X (تويتر سابقاً) أن النموذج الذي اختبرته ميتا على LM Arena ليس هو نفس النسخة المتاحة للمطورين.
بحسب ما نشرته ميتا رسميًا، فإن النسخة التي استخدمت في تقييم LM Arena تُعرف بأنها "نسخة دردشة تجريبية".
وفي موقع Llama الرسمي، يظهر توضيح بأن النموذج الذي تم تقييمه هو "Llama 4 Maverick المعدّل لزيادة قدراته الحوارية"، ما يعني أن ميتا أجرت تعديلات على النموذج خصيصاً لتحسين أدائه في هذا النوع من الاختبارات.
تخصيص نموذج AI للتفوّق في اختبار معين ثم طرح نسخة أقل أداءً للعامة يثير مخاوف تتعلق بالشفافية والمصداقية. فمثل هذه الخطوة تضع المطورين والمستخدمين في مأزق، إذ لا يمكنهم الوثوق بأن الأداء الذي شاهدوه في التقييمات سينعكس فعليًا عند استخدام النموذج في تطبيقاتهم أو أبحاثهم.
فوارق ملحوظة بين النسختينالباحثون الذين جربوا النسخة العامة من Maverick لاحظوا اختلافات واضحة مقارنة بنسخة LM Arena، من بينها ، النموذج في LM Arena يستخدم الكثير من الرموز التعبيرية (emojis).
اما إجابات النموذج هناك طويلة للغاية ومفرطة في التفاصيل مقارنة بالنسخة "الفانيلا" (غير المعدلة) التي يمكن للمطورين تحميلها.
LM Arena منصة تقييم غير مثاليةرغم أن LM Arena تعتبر مرجعًا مهمًا في تقييم نماذج الذكاء الاصطناعي، إلا أنها تعاني من قصور معروف، إذ أنها تعتمد على تفضيلات بشرية قد تكون ذاتية، ولا تمثل دائمًا الأداء الواقعي للنماذج في سيناريوهات معقدة أو تطبيقات فعلية، إلا أن الشركات عمومًا لا تقوم بتخصيص نماذجها خصيصًا للتفوّق في هذه المنصة أو على الأقل، لا تعترف بذلك علنًا.
ميتا في مرمى النقديضع هذا التحايل المحتمل ميتا تحت ضغط متزايد، خاصة في ظل المنافسة الشرسة مع نماذج مثل GPT-4 من OpenAI أو Claude من Anthropic.
وقد تواصلت جهات صحفية مع شركة Meta ومنصة Chatbot Arena (الجهة المشرفة على LM Arena) للحصول على تعليق رسمي، لكن حتى الآن، لم يصدر أي رد.
المصدر: صدى البلد
كلمات دلالية: الذكاء الاصطناعي المزيد نماذج الذکاء الاصطناعی
إقرأ أيضاً:
صورة قميص كريكيت بتقنية الذكاء الاصطناعي من سام ألتمان تُثير تفاعل الهنود
في بلد يعد الكريكيت بمثابة ديانة وطنية، لم يفوت روبوت الدردشة الذكي "شات جي بي تي" هذه الحقيقة.
فقد طلب سام ألتمان، مؤسس شركة OpenAI، من النموذج أن يولد له صورة بأسلوب الأنمي على هيئة لاعب كريكيت، فجاءته النتيجة وهو يرتدي قميص منتخب الهند الأزرق الزاهي، ممسكاً بمضرب الكريكيت.
شارك ألتمان الصورة على منصة X (تويتر سابقًا) يوم الخميس، الأمر الذي أشعل منصات التواصل الاجتماعي في الهند، حيث تفاعل المستخدمون بحماس، وتساءل البعض عمّا إذا كانت هذه الخطوة تعكس محبة حقيقية للهند أم استراتيجية تجارية خفية.
رغم أن ألتمان سبق أن شارك صورًا من إنتاج الذكاء الاصطناعي، خاصة أثناء انتشار ترند "أسلوب جيبلي" (Studio Ghibli) الشهير، إلا أن ارتداءه لقميص المنتخب الهندي تحديدًا هو ما أثار الجدل هذه المرة.
اعتبر البعض الأمر لفتة جميلة تجاه الجماهير الهندية، في حين ذهب آخرون إلى التحليل والسخرية. أحد المستخدمين كتب: "سام يحاول جذب العملاء الهنود بشدة".
وأضاف آخر: "بانتظار إعلانك القادم في الهند، فكم من الـ40 مليار دولار ستخصصه لهذا السوق؟"، في إشارة إلى التمويل القياسي الذي حصلت عليه OpenAI مؤخراً".
بينمادون ألتمان قبل نشر صورة الأنمي مباشرة تغريدة عير فيها عن إعجابه بتبني الهند لتقنيات الذكاء الاصطناعي، وكتب: "من المدهش مشاهدة ما يحدث في الهند، إنها تسبق العالم".
فيما انتشرت التغريدة بشكل واسع، وتناقلتها وسائل الإعلام الهندية مع تعليقات المستخدمين، بل وفتح أحدهم نقاشًا على Reddit متسائلًا عن معنى كلام ألتمان.
تغير في الموقفاللافت أن ألتمان لم يكن دائمًا بهذا الحماس تجاه إمكانيات الهند في مجال الذكاء الاصطناعي.
ففي زيارته للهند عام 2023، بدا وكأنه يقلل من قدرة الشركات الناشئة الهندية على منافسة نماذج OpenAI، وقال حينها إن بناء نماذج أساسية قوية بميزانية منخفضة (10 ملايين دولار) هو أمر "ميؤوس منه".
لكن في زيارته الأخيرة عام 2024، غيّر نبرته. خلال لقائه بوزير الاتصالات الهندي أشوين فايشناو في فبراير، أعرب ألتمان عن رغبته في التعاون مع الهند لتطوير نماذج ذكاء اصطناعي منخفضة التكلفة.
كما أشاد بسرعة الهند في تبني التقنيات، وأكد أن الهند أصبحت ثاني أكبر سوق لشركته، مع تضاعف عدد المستخدمين ثلاث مرات خلال عام واحد.
خلفيات اقتصاديةرغم المديح المتزايد، فإن العلاقة بين OpenAI والهند ليست خالية من التوتر. الشركة تواجه دعاوى قضائية من عدة مؤسسات إعلامية هندية بسبب استخدام محتواها دون تصريح في تدريب نماذجها.
ويرى خبراء أن اهتمام ألتمان المتجدد بالهند لا يعود إلى حب مفاجئ، بل إلى أرباح متوقعة. فبحسب الإدارة الدولية للتجارة (ITA)، من المتوقع أن تصل قيمة سوق الذكاء الاصطناعي في الهند إلى 8 مليارات دولار بحلول عام 2025، بمعدل نمو سنوي مركب يتجاوز 40%.
يرى نيخيل باهوا، مؤسس موقع MediaNama المعني بسياسات التكنولوجيا، أن "التصريحات الكبرى من مؤسسي شركات الذكاء الاصطناعي تجاه الهند" ترتبط بالحجم الهائل لقاعدة المستخدمين. ويضيف: "ألتمان ليس وحده من يسعى لاستقطاب الهند".
في يناير، أعلن أرافيند سرينيفاس، مؤسس منصة Perplexity AI، استعداده لاستثمار مليون دولار من أمواله الشخصية، وتخصيص خمس ساعات أسبوعيًا لمساعدة الشركات الناشئة الهندية في مجال الذكاء الاصطناعي.
ويؤكد الكاتب التقني براسانتو ك روي أن الترندات مثل "جيبلي" كشفت عن حجم جمهور الهند بالنسبة لـ ChatGPT وغيره من منصات الذكاء الاصطناعي.
ووسط تزايد شعبية نماذج منافسة مثل Gemini وGrok، يبدو أن ألتمان يسعى للاحتفاظ بالمستخدمين الحاليين وجذب المزيد.
ويضيف باهوا: "الهند تمثل سوقًا ضخمًا لجميع نماذج الذكاء الاصطناعي العالمية، ومع دخول DeepSeek الصينية إلى المنافسة بأسعار أقل، من الطبيعي أن يحاول ألتمان الحفاظ على مكانته".
ويختم قائلًا: "إذا بدا أن هناك حبًا مفاجئًا للهند، فتذكّر: لا شيء شخصي في هذا المجال، إنه مجرد بيزنس".