علوم وتكنولوجيا، دراسة ChatGPT أصبح أكثر فقرًا فى حل المعادلات الرياضية،وجدت دراسة أجرتها جامعة ستانفورد أن برنامج الدردشة الآلي الشهير ChatGPT الذي أنشأته .،عبر صحافة مصر، حيث يهتم الكثير من الناس بمشاهدة ومتابعه الاخبار، وتصدر خبر دراسة: ChatGPT أصبح أكثر فقرًا فى حل المعادلات الرياضية ، محركات البحث العالمية و نتابع معكم تفاصيل ومعلوماته كما وردت الينا والان إلى التفاصيل.

دراسة: ChatGPT أصبح أكثر فقرًا فى حل المعادلات...
وجدت دراسة أجرتها جامعة ستانفورد أن برنامج الدردشة الآلي الشهير ChatGPT الذي أنشأته شركة OpenAI يزداد سوءًا في حل المعادلات الرياضية، وواجه برنامج chatbot تقلبات كبيرة في الأداء في مهام معينة بين مارس ويونيو. 

وقارن البحث نسختين من التكنولوجيا - GPT-3.5 وGPT-4، مع التركيز على مهام مثل حل مسائل الرياضيات ، والإجابة على الأسئلة الحساسة ، وإنشاء كود برمجي، والتفكير المرئي.

وفقًا لتقرير Fortune، كشفت الدراسة عن ظاهرة تسمى "الانجراف" ، حيث تغيرت قدرة التكنولوجيا على أداء مهام محددة بشكل غير متوقع بمرور الوقت. 

وفي حالة قدرة حل المشكلات الرياضية في GPT-4  انخفضت دقتها بشكل كبير من 97.6 % في مارس إلى 2.4 % فقط في يونيو. وفقًا للنتائج ، أظهر نموذج GPT-3.5 مسارًا معاكسًا ، حيث تحسن من دقة 7.4 % في مارس إلى 86.8 % في يونيو في نفس المهمة .

لوحظت تقلبات مماثلة عندما طُلب من النماذج كتابة التعليمات البرمجية وإجراء اختبارات الاستدلال البصري، وأعرب أستاذ علوم الكمبيوتر في جامعة ستانفورد ، جيمس زو ، أحد مؤلفي الدراسة ، عن دهشته من حجم التغيير، بالنظر إلى تطور ChatGPT.

وقال Zou في مقابلة مع Fortune: "عندما نقوم بضبط نموذج لغوي كبير لتحسين أدائه في مهام معينة ، يمكن أن يكون لذلك في الواقع الكثير من النتائج غير المقصودة ، والتي قد تضر في الواقع بأداء هذا النموذج في مهام أخرى". "هناك كل أنواع الترابطات المثيرة للاهتمام في كيفية استجابة النموذج للأشياء التي يمكن أن تؤدي إلى بعض السلوكيات المتدهورة التي لاحظناها." رداً على القدرات الرياضية المتدهورة في ChatGPT، علق أحد مستخدمي Reddit قائلاً إن الغباء مع تقدم العمر هو أكثر الأشياء التي يمكن أن يفعلها الإنسان.

لم يكن التناقض في النتائج بسبب عدم دقة النموذج في مهام محددة. بدلاً من ذلك، حدث ذلك لأنهم عندما حاولوا تحسين النموذج في بعض المهام ، كان له تأثيرات غير مقصودة على أجزاء أخرى من النموذج ، مما تسبب في سلوكيات غير متوقعة.

وتكشف النتائج أن هذه النماذج يمكن أن تخضع لتغييرات بمرور الوقت، والتي يشار إليها باسم "الانجرافات". تتسبب هذه الانجرافات في أداء النماذج بشكل مختلف في المهام المختلفة. 

ولضمان استمرار هذه النماذج اللغوية في العمل بفعالية ، تؤكد الدراسة على أهمية مراقبة أدائها بانتظام من خلال القيام بذلك ، يمكن تحديد أي مشاكل أو مشكلات تنشأ بسبب هذه الانجرافات ومعالجتها على الفور، مع الحفاظ على الأداء الأمثل للنماذج.

وتلقي دراسة جامعة ستانفورد الضوء على التحديات التي تطرحها الانجرافات في نماذج لغة الذكاء الاصطناعي مثل ChatGPT ويسلط البحث الضوء على الحاجة إلى مزيد من التحقيق والشفافية لضمان الأداء المتسق والموثوق لهذه الأنظمة في المهام المختلفة.

المصدر: صحافة العرب

كلمات دلالية: موعد عاجل الدولار الامريكي اليوم اسعار الذهب اسعار النفط مباريات اليوم جدول ترتيب حالة الطقس یمکن أن فی مهام

إقرأ أيضاً:

Grok 3 يُذهل العالم.. يفكر مثل البشر ويتفوق في التحديات المنطقية

كشفت شركة xAI عن نموذجها الجديد Grok 3، مصحوبًا بقدرات جديدة مثل تحليل الصور وتحسين الإجابات على الأسئلة.

وقال إيلون ماسك الرئيس التنفيذي لشركة XAI للذكاء الاصطناعي، إن نموذج الذكاء الاصطناعي Grok 3 هو الأذكى، ويفكر بطريقة تحاكي البشر.

أوضح أن Grok 3 يمكنه ممارسة الألعاب الإلكترونية، واستعرض على الهواء تجربة لقيام النموذج بلعب لعبة "المكعبات"، حيث قام النموذج بتركيب النموذج في المكان المخصص له حسب اللون.



 

 
كذلك قام ماسك بتوجيه سؤال للنموذج حول كيفية وضع مخطط للسفر للمريخ والعودة مرة أخرى، وتمكن النموذج من إنجاز المهمة خلال 114 ثانية فقط.

 

 

 

 

ووفقاً لموقع "تك كرنش" اعتمدت الشركة على مركز بيانات ضخم مزود بحوالي 200,000 وحدة معالجة رسومات (GPU) لتطوير Grok 3. وفقًا لإيلون ماسك، مالك xAI، فإن هذا المشروع استخدم "10 مرات" أكثر من قدرة المعالجة الحاسوبية مقارنة بالنسخة السابقة، Grok 2، مع توسيع قاعدة البيانات التي تشمل على ما يبدو معلومات من الملفات القانونية.

وقال ماسك إن Grok 3 هو "ذكاء اصطناعي يسعى إلى الحقيقة إلى أقصى حد".

 

اقرأ أيضاً.. بعد إطلاق "3 Grok".. منصة إكس تضاعف أسعار اشتراك "بريميوم بلس"

 حلول متنوعة لاحتياجات مختلفة

يشمل إطلاق Grok 3 مجموعة من النماذج المصممة لتلبية احتياجات متنوعة. على سبيل المثال، يركز Grok 3 mini على تسريع أوقات الاستجابة على حساب دقة الإجابة التامة. ومع ذلك، ما يميز الإصدار هو النماذج الجديدة التي تركز على التفكير المنطقي.

تسمى هذه النماذج بـ Grok 3 Reasoning وGrok 3 mini Reasoning، حيث تهدف إلى تقليد العمليات العقلية البشرية من خلال "التفكير" في حل المشكلات. هذه النماذج، التي تُشبه إلى حد كبير نماذج مثل o3-mini من OpenAI وR1 من DeepSeek، تحاول التحقق من صحة إجاباتها، مما يقلل من احتمالية الأخطاء.

 

 

 



نتائج الأداء القياسية

أخبار ذات صلة مسترال سابا.. ذكاء اصطناعي يدخل سباق اللغة العربية هل يشيخ الذكاء الاصطناعي كالبشر؟ خفايا التقادم الرقمي


تؤكد xAI أن Grok 3 يتفوق على GPT-4 من OpenAI في بعض الاختبارات القياسية، مثل AIME وGPQA، التي تقيم كفاءة النموذج في معالجة المشكلات المعقدة عبر الرياضيات، الفيزياء، الأحياء، والكيمياء.

يحقق الإصدار الأولي من Grok 3 أيضًا أداءً رائدًا على منصة Chatbot Arena، التي تسمح للمستخدمين بمقارنة نماذج الذكاء الاصطناعي وتصنيف نتائجها. النموذج هو الأول الذي يتجاوز علامة 1400 على هذه المنصة.

 

 

 

 تطبيق DeepSearch وميزات جديدة



تستخدم نماذج Grok 3 الجديدة لتطوير ميزة في تطبيق Grok تسمى DeepSearch. هذه الميزة تعتمد على نماذج Grok لمسح الإنترنت ومنصة ماسك الاجتماعية، X، للبحث عن المعلومات ذات الصلة قبل تجميع ملخص تفصيلي للإجابة على استفسارات المستخدمين.



الوصول إلى Grok 3 والمخططات المستقبلية



يمكن للمشتركين في X في فئة Premium+ الذين يدفعون 50 دولارًا شهريًا الوصول إلى أحدث الميزات. كما أطلقت xAI خطة اشتراك جديدة باسم SuperGrok، والتي من المتوقع أن تتراوح أسعارها بين 30 دولارًا شهريًا أو 300 دولار سنويًا. سيستفيد المشتركون في SuperGrok من قدرات تفكير محسّنة، وزيادة في استفسارات DeepSearch، بالإضافة إلى ميزات توليد الصور غير المحدودة.





اقرأ ايضاً.. Grok 3.. مستقبل الذكاء الاصطناعي بين الاستدلال والبحث العميق





بإطلاق Grok 3، تواصل xAI و ماسك دفع حدود التكنولوجيا للأمام، في الوقت الذي قد تثير فيه المناقشات حول الانحياز، الشفافية، وأخلاقيات استخدام الذكاء الاصطناعي.

في ظل منافسة شرسة من شركات مثل OpenAI وGoogle وDeepSeek، ستعتمد نجاحات Grok 3 على قدرة النموذج على موازنة الدقة، الطلب من المستخدمين، والمسؤولية المجتمعية.


إسلام العبادي (أبوظبي)

مقالات مشابهة

  • بالصور: طواقم كهرباء غزة تنفذ مهام إزالة مكونات الشبكات المتضررة في محافظة غزة
  • «ضحايا لقمة العيش».. إصابة 3 أشخاص إثر سقوطهم من أعلى سقالة بالطالبية
  • ترامب يوسع مهام مدير مكتب أف بي أي
  • «OpenAI» تعلن إطلاق وكيل الذكاء الاصطناعي «Operator» لمشتركي ChatGPT Pro في عدة دول
  • مسترال سابا.. ذكاء اصطناعي يدخل سباق اللغة العربية
  • Grok 3 يُذهل العالم.. يفكر مثل البشر ويتفوق في التحديات المنطقية
  • «حرب الذكاء الاصطناعي».. OpenAI تحظر حسابات في كوريا الشمالية والصين.. اعرف الأسباب
  • إطلاق Grok 3 مجانا.. 5 ميزات يتفوق بها على ChatGPT
  • OpenAI تقلب الموازين.. حظر حسابات صينية في ChatGPT يثير الجدل
  • دراسة: كمية المياه التي تفقدها الأنهار الجليدية تعادل ما يستهلكه سكان العالم في 3 عقود