علوم وتكنولوجيا دراسة: ChatGPT أصبح أكثر فقرًا فى حل المعادلات الرياضية
تاريخ النشر: 23rd, July 2023 GMT
علوم وتكنولوجيا، دراسة ChatGPT أصبح أكثر فقرًا فى حل المعادلات الرياضية،وجدت دراسة أجرتها جامعة ستانفورد أن برنامج الدردشة الآلي الشهير ChatGPT الذي أنشأته .،عبر صحافة مصر، حيث يهتم الكثير من الناس بمشاهدة ومتابعه الاخبار، وتصدر خبر دراسة: ChatGPT أصبح أكثر فقرًا فى حل المعادلات الرياضية ، محركات البحث العالمية و نتابع معكم تفاصيل ومعلوماته كما وردت الينا والان إلى التفاصيل.
وجدت دراسة أجرتها جامعة ستانفورد أن برنامج الدردشة الآلي الشهير ChatGPT الذي أنشأته شركة OpenAI يزداد سوءًا في حل المعادلات الرياضية، وواجه برنامج chatbot تقلبات كبيرة في الأداء في مهام معينة بين مارس ويونيو.
وقارن البحث نسختين من التكنولوجيا - GPT-3.5 وGPT-4، مع التركيز على مهام مثل حل مسائل الرياضيات ، والإجابة على الأسئلة الحساسة ، وإنشاء كود برمجي، والتفكير المرئي.
وفقًا لتقرير Fortune، كشفت الدراسة عن ظاهرة تسمى "الانجراف" ، حيث تغيرت قدرة التكنولوجيا على أداء مهام محددة بشكل غير متوقع بمرور الوقت.
وفي حالة قدرة حل المشكلات الرياضية في GPT-4 انخفضت دقتها بشكل كبير من 97.6 % في مارس إلى 2.4 % فقط في يونيو. وفقًا للنتائج ، أظهر نموذج GPT-3.5 مسارًا معاكسًا ، حيث تحسن من دقة 7.4 % في مارس إلى 86.8 % في يونيو في نفس المهمة .
لوحظت تقلبات مماثلة عندما طُلب من النماذج كتابة التعليمات البرمجية وإجراء اختبارات الاستدلال البصري، وأعرب أستاذ علوم الكمبيوتر في جامعة ستانفورد ، جيمس زو ، أحد مؤلفي الدراسة ، عن دهشته من حجم التغيير، بالنظر إلى تطور ChatGPT.
وقال Zou في مقابلة مع Fortune: "عندما نقوم بضبط نموذج لغوي كبير لتحسين أدائه في مهام معينة ، يمكن أن يكون لذلك في الواقع الكثير من النتائج غير المقصودة ، والتي قد تضر في الواقع بأداء هذا النموذج في مهام أخرى". "هناك كل أنواع الترابطات المثيرة للاهتمام في كيفية استجابة النموذج للأشياء التي يمكن أن تؤدي إلى بعض السلوكيات المتدهورة التي لاحظناها." رداً على القدرات الرياضية المتدهورة في ChatGPT، علق أحد مستخدمي Reddit قائلاً إن الغباء مع تقدم العمر هو أكثر الأشياء التي يمكن أن يفعلها الإنسان.
لم يكن التناقض في النتائج بسبب عدم دقة النموذج في مهام محددة. بدلاً من ذلك، حدث ذلك لأنهم عندما حاولوا تحسين النموذج في بعض المهام ، كان له تأثيرات غير مقصودة على أجزاء أخرى من النموذج ، مما تسبب في سلوكيات غير متوقعة.
وتكشف النتائج أن هذه النماذج يمكن أن تخضع لتغييرات بمرور الوقت، والتي يشار إليها باسم "الانجرافات". تتسبب هذه الانجرافات في أداء النماذج بشكل مختلف في المهام المختلفة.
ولضمان استمرار هذه النماذج اللغوية في العمل بفعالية ، تؤكد الدراسة على أهمية مراقبة أدائها بانتظام من خلال القيام بذلك ، يمكن تحديد أي مشاكل أو مشكلات تنشأ بسبب هذه الانجرافات ومعالجتها على الفور، مع الحفاظ على الأداء الأمثل للنماذج.
وتلقي دراسة جامعة ستانفورد الضوء على التحديات التي تطرحها الانجرافات في نماذج لغة الذكاء الاصطناعي مثل ChatGPT ويسلط البحث الضوء على الحاجة إلى مزيد من التحقيق والشفافية لضمان الأداء المتسق والموثوق لهذه الأنظمة في المهام المختلفة.
المصدر: صحافة العرب
كلمات دلالية: موعد عاجل الدولار الامريكي اليوم اسعار الذهب اسعار النفط مباريات اليوم جدول ترتيب حالة الطقس یمکن أن فی مهام
إقرأ أيضاً:
Grok 3 يُذهل العالم.. يفكر مثل البشر ويتفوق في التحديات المنطقية
كشفت شركة xAI عن نموذجها الجديد Grok 3، مصحوبًا بقدرات جديدة مثل تحليل الصور وتحسين الإجابات على الأسئلة.
وقال إيلون ماسك الرئيس التنفيذي لشركة XAI للذكاء الاصطناعي، إن نموذج الذكاء الاصطناعي Grok 3 هو الأذكى، ويفكر بطريقة تحاكي البشر.
أوضح أن Grok 3 يمكنه ممارسة الألعاب الإلكترونية، واستعرض على الهواء تجربة لقيام النموذج بلعب لعبة "المكعبات"، حيث قام النموذج بتركيب النموذج في المكان المخصص له حسب اللون.
كذلك قام ماسك بتوجيه سؤال للنموذج حول كيفية وضع مخطط للسفر للمريخ والعودة مرة أخرى، وتمكن النموذج من إنجاز المهمة خلال 114 ثانية فقط.
ووفقاً لموقع "تك كرنش" اعتمدت الشركة على مركز بيانات ضخم مزود بحوالي 200,000 وحدة معالجة رسومات (GPU) لتطوير Grok 3. وفقًا لإيلون ماسك، مالك xAI، فإن هذا المشروع استخدم "10 مرات" أكثر من قدرة المعالجة الحاسوبية مقارنة بالنسخة السابقة، Grok 2، مع توسيع قاعدة البيانات التي تشمل على ما يبدو معلومات من الملفات القانونية.
وقال ماسك إن Grok 3 هو "ذكاء اصطناعي يسعى إلى الحقيقة إلى أقصى حد".
اقرأ أيضاً.. بعد إطلاق "3 Grok".. منصة إكس تضاعف أسعار اشتراك "بريميوم بلس"
حلول متنوعة لاحتياجات مختلفة
يشمل إطلاق Grok 3 مجموعة من النماذج المصممة لتلبية احتياجات متنوعة. على سبيل المثال، يركز Grok 3 mini على تسريع أوقات الاستجابة على حساب دقة الإجابة التامة. ومع ذلك، ما يميز الإصدار هو النماذج الجديدة التي تركز على التفكير المنطقي.
تسمى هذه النماذج بـ Grok 3 Reasoning وGrok 3 mini Reasoning، حيث تهدف إلى تقليد العمليات العقلية البشرية من خلال "التفكير" في حل المشكلات. هذه النماذج، التي تُشبه إلى حد كبير نماذج مثل o3-mini من OpenAI وR1 من DeepSeek، تحاول التحقق من صحة إجاباتها، مما يقلل من احتمالية الأخطاء.
نتائج الأداء القياسية
تؤكد xAI أن Grok 3 يتفوق على GPT-4 من OpenAI في بعض الاختبارات القياسية، مثل AIME وGPQA، التي تقيم كفاءة النموذج في معالجة المشكلات المعقدة عبر الرياضيات، الفيزياء، الأحياء، والكيمياء.
يحقق الإصدار الأولي من Grok 3 أيضًا أداءً رائدًا على منصة Chatbot Arena، التي تسمح للمستخدمين بمقارنة نماذج الذكاء الاصطناعي وتصنيف نتائجها. النموذج هو الأول الذي يتجاوز علامة 1400 على هذه المنصة.
تطبيق DeepSearch وميزات جديدة
تستخدم نماذج Grok 3 الجديدة لتطوير ميزة في تطبيق Grok تسمى DeepSearch. هذه الميزة تعتمد على نماذج Grok لمسح الإنترنت ومنصة ماسك الاجتماعية، X، للبحث عن المعلومات ذات الصلة قبل تجميع ملخص تفصيلي للإجابة على استفسارات المستخدمين.
الوصول إلى Grok 3 والمخططات المستقبلية
يمكن للمشتركين في X في فئة Premium+ الذين يدفعون 50 دولارًا شهريًا الوصول إلى أحدث الميزات. كما أطلقت xAI خطة اشتراك جديدة باسم SuperGrok، والتي من المتوقع أن تتراوح أسعارها بين 30 دولارًا شهريًا أو 300 دولار سنويًا. سيستفيد المشتركون في SuperGrok من قدرات تفكير محسّنة، وزيادة في استفسارات DeepSearch، بالإضافة إلى ميزات توليد الصور غير المحدودة.
اقرأ ايضاً.. Grok 3.. مستقبل الذكاء الاصطناعي بين الاستدلال والبحث العميق
بإطلاق Grok 3، تواصل xAI و ماسك دفع حدود التكنولوجيا للأمام، في الوقت الذي قد تثير فيه المناقشات حول الانحياز، الشفافية، وأخلاقيات استخدام الذكاء الاصطناعي.
في ظل منافسة شرسة من شركات مثل OpenAI وGoogle وDeepSeek، ستعتمد نجاحات Grok 3 على قدرة النموذج على موازنة الدقة، الطلب من المستخدمين، والمسؤولية المجتمعية.
إسلام العبادي (أبوظبي)