بعد ما يقرب من أسبوعين من الإعلانات، اختتمت OpenAI سلسلة البث المباشر التي استمرت 12 يومًا من OpenAI بمعاينة لطرازها الرائد من الجيل التالي. قال الرئيس التنفيذي لشركة OpenAI سام ألتمان لأولئك الذين شاهدوا الإعلان على YouTube: "احترامًا للأصدقاء في Telefónica (مالك شبكة O2 الخلوية في أوروبا)، ووفقًا للتقاليد العظيمة التي تتسم بها OpenAI بأنها سيئة حقًا في الأسماء، فقد أطلقنا عليها اسم o3".

الطراز الجديد ليس جاهزًا للاستخدام العام حتى الآن. بدلاً من ذلك، تجعل OpenAI أولاً o3 متاحًا للباحثين الذين يريدون المساعدة في اختبارات السلامة. كما أعلنت OpenAI عن وجود o3-mini. قال ألتمان إن الشركة تخطط لإطلاق هذا الطراز "في نهاية شهر يناير"، مع إطلاق o3 "بعد ذلك بفترة وجيزة".

 

كما قد تتوقع، يقدم o3 أداءً محسنًا مقارنة بسابقه، ولكن ما مدى تفوقه على o1 هو السمة الرئيسية هنا. على سبيل المثال، عندما تم اجتياز امتحان الرياضيات الأمريكي لهذا العام، حققت o3 درجة دقة بلغت 96.7 في المائة. وعلى النقيض من ذلك، حصلت o1 على تصنيف أكثر تواضعًا بنسبة 83.3 في المائة. قال مارك تشين، نائب الرئيس الأول للأبحاث في OpenAI: "ما يدل على ذلك هو أن o3 غالبًا ما تفوت سؤالاً واحدًا فقط". في الواقع، حققت o3 أداءً جيدًا للغاية في مجموعة المعايير المعتادة التي تضعها OpenAI لنماذجها لدرجة أن الشركة اضطرت إلى إيجاد اختبارات أكثر تحديًا لمقارنتها بها.


أحد هذه الاختبارات هو ARC-AGI، وهو معيار يختبر قدرة خوارزمية الذكاء الاصطناعي على الحدس والتعلم على الفور. وفقًا لمبتكر الاختبار، مؤسسة ARC Prize غير الربحية، فإن نظام الذكاء الاصطناعي الذي يمكنه التغلب بنجاح على ARC-AGI من شأنه أن يمثل "معلمًا مهمًا نحو الذكاء الاصطناعي العام". منذ ظهوره لأول مرة في عام 2019، لم يتفوق أي نموذج للذكاء الاصطناعي على ARC-AGI. يتكون الاختبار من أسئلة الإدخال والإخراج التي يمكن لمعظم الناس فهمها بشكل حدسي. على سبيل المثال، في المثال أعلاه، ستكون الإجابة الصحيحة هي إنشاء مربعات من البوليومينو الأربعة باستخدام كتل زرقاء داكنة.

في إعداد الحوسبة المنخفضة، سجل o3 نسبة 75.7 في المائة في الاختبار. مع قوة المعالجة الإضافية، حقق النموذج تصنيفًا بنسبة 87.5 في المائة. وفقًا لـ Greg Kamradt، رئيس مؤسسة ARC Prize Foundation، "الأداء البشري قابل للمقارنة عند عتبة 85 في المائة، لذا فإن تجاوز هذا يعد إنجازًا رئيسيًا".


استعرضت OpenAI أيضًا o3-mini. يستخدم النموذج الجديد واجهة برمجة تطبيقات Adaptive Thinking Time التي أعلنت عنها OpenAI مؤخرًا لتقديم ثلاثة أوضاع استدلال مختلفة: منخفضة ومتوسطة وعالية. في الممارسة العملية، يسمح هذا للمستخدمين بتعديل المدة التي "يفكر" فيها البرنامج في مشكلة قبل تقديم إجابة. كما ترى من الرسم البياني أعلاه، يمكن لـ o3-mini تحقيق نتائج مماثلة لنموذج الاستدلال الحالي o1 من OpenAI، ولكن بجزء بسيط من تكلفة الحوسبة. كما ذكرنا، سيصل o3-mini للاستخدام العام قبل o3.

المصدر: بوابة الوفد

كلمات دلالية: فی المائة

إقرأ أيضاً:

إليك أوائل المتأهلين لدور الـ16 في دوري أبطال أوروبا من الملحق

دبي، الإمارات العربية المتحدة (CNN) -- بلغت 4 فرق حتّى الآن دور الـ16 من دوري أبطال أوروبا (تشامبيونزليغ) عبر الملحق، فيما ودعت 4 فرق أخرى المسابقة.

وتأهل للدور الثاني كلّ من فاينورد الهولندي وكلوب بروج البلجيكي وبنفيكا البرتغالي وبايرن ميونخ الألماني، بينما غادر كلّ من ميلان الإيطالي وأتالانتا الإيطالي وموناكو الفرنسي وسيلتك الاسكتلندي.

وجاء تأهل فاينورد بعد تفوقه على ميلان بمجموع مباراتي الذهاب والإياب بنتيجة 1/2 وكلوب بروج على أتالانتا بنتيجة 2/5 وبنفيكا على موناكو بنتيجة 3/4 وبايرن ميونخ على سيلتك 2/3.

مقالات مشابهة

  • كلية البريمي الجامعية تطرح تخصصات في الذكاء الاصطناعي والأمن السيبراني
  • الفيوم تكرم ذوي الهمم أوائل مسابقات الجمهورية الرياضية والفنية
  • غدا.. البنك المركزي يعقد أول اجتماعاته في 2025 لحسم سعر الفائدة
  • «كوالكوم» تنضم إلى مبادرة الجيل التالي من الاستثمارات الأجنبية المباشرة
  • رئيس الوزراء لصدى البلد: هناك تصور لزيادة برنامج تكافل وكرامة قبل العام المالي المقبل
  • تعليم مطروح: حصول 8 طلاب على أوائل الجمهورية في الإلقاء الشعري
  • صوّروا .. (٤) فُرقاء أوائل ودكتوراه مدنيّه
  • سو-57.. تفاصيل صفقة المقاتلة الروسية التي ستمتلكها الجزائر
  • إليك أوائل المتأهلين لدور الـ16 في دوري أبطال أوروبا من الملحق
  • اليونان تفتتح العام المقبل متحفا للآثار البحرية قرب أثينا