بعد ما يقرب من أسبوعين من الإعلانات، اختتمت OpenAI سلسلة البث المباشر التي استمرت 12 يومًا من OpenAI بمعاينة لطرازها الرائد من الجيل التالي. قال الرئيس التنفيذي لشركة OpenAI سام ألتمان لأولئك الذين شاهدوا الإعلان على YouTube: "احترامًا للأصدقاء في Telefónica (مالك شبكة O2 الخلوية في أوروبا)، ووفقًا للتقاليد العظيمة التي تتسم بها OpenAI بأنها سيئة حقًا في الأسماء، فقد أطلقنا عليها اسم o3".

الطراز الجديد ليس جاهزًا للاستخدام العام حتى الآن. بدلاً من ذلك، تجعل OpenAI أولاً o3 متاحًا للباحثين الذين يريدون المساعدة في اختبارات السلامة. كما أعلنت OpenAI عن وجود o3-mini. قال ألتمان إن الشركة تخطط لإطلاق هذا الطراز "في نهاية شهر يناير"، مع إطلاق o3 "بعد ذلك بفترة وجيزة".

 

كما قد تتوقع، يقدم o3 أداءً محسنًا مقارنة بسابقه، ولكن ما مدى تفوقه على o1 هو السمة الرئيسية هنا. على سبيل المثال، عندما تم اجتياز امتحان الرياضيات الأمريكي لهذا العام، حققت o3 درجة دقة بلغت 96.7 في المائة. وعلى النقيض من ذلك، حصلت o1 على تصنيف أكثر تواضعًا بنسبة 83.3 في المائة. قال مارك تشين، نائب الرئيس الأول للأبحاث في OpenAI: "ما يدل على ذلك هو أن o3 غالبًا ما تفوت سؤالاً واحدًا فقط". في الواقع، حققت o3 أداءً جيدًا للغاية في مجموعة المعايير المعتادة التي تضعها OpenAI لنماذجها لدرجة أن الشركة اضطرت إلى إيجاد اختبارات أكثر تحديًا لمقارنتها بها.


أحد هذه الاختبارات هو ARC-AGI، وهو معيار يختبر قدرة خوارزمية الذكاء الاصطناعي على الحدس والتعلم على الفور. وفقًا لمبتكر الاختبار، مؤسسة ARC Prize غير الربحية، فإن نظام الذكاء الاصطناعي الذي يمكنه التغلب بنجاح على ARC-AGI من شأنه أن يمثل "معلمًا مهمًا نحو الذكاء الاصطناعي العام". منذ ظهوره لأول مرة في عام 2019، لم يتفوق أي نموذج للذكاء الاصطناعي على ARC-AGI. يتكون الاختبار من أسئلة الإدخال والإخراج التي يمكن لمعظم الناس فهمها بشكل حدسي. على سبيل المثال، في المثال أعلاه، ستكون الإجابة الصحيحة هي إنشاء مربعات من البوليومينو الأربعة باستخدام كتل زرقاء داكنة.

في إعداد الحوسبة المنخفضة، سجل o3 نسبة 75.7 في المائة في الاختبار. مع قوة المعالجة الإضافية، حقق النموذج تصنيفًا بنسبة 87.5 في المائة. وفقًا لـ Greg Kamradt، رئيس مؤسسة ARC Prize Foundation، "الأداء البشري قابل للمقارنة عند عتبة 85 في المائة، لذا فإن تجاوز هذا يعد إنجازًا رئيسيًا".


استعرضت OpenAI أيضًا o3-mini. يستخدم النموذج الجديد واجهة برمجة تطبيقات Adaptive Thinking Time التي أعلنت عنها OpenAI مؤخرًا لتقديم ثلاثة أوضاع استدلال مختلفة: منخفضة ومتوسطة وعالية. في الممارسة العملية، يسمح هذا للمستخدمين بتعديل المدة التي "يفكر" فيها البرنامج في مشكلة قبل تقديم إجابة. كما ترى من الرسم البياني أعلاه، يمكن لـ o3-mini تحقيق نتائج مماثلة لنموذج الاستدلال الحالي o1 من OpenAI، ولكن بجزء بسيط من تكلفة الحوسبة. كما ذكرنا، سيصل o3-mini للاستخدام العام قبل o3.

المصدر: بوابة الوفد

كلمات دلالية: فی المائة

إقرأ أيضاً:

دبي لصناعات الطيران: إتمام صفقة "بوينغ 737" مع "أيروميكسيكو"

أعلنت "دبي لصناعات الطيران" اليوم الاثنين، تسليم الطائرة السادسة والأخيرة من طراز "بوينغ 737 ماكس" إلى شركة أيروميكسيكو، وذلك ضمن صفقة شملت ثلاث طائرات من طراز 737-8، وثلاث من طراز 737-9.

وتُعَدّ شركة أيروميكسيكو من عملاء دبي لصناعات الطيران منذ أكثر من عشر سنوات، وخلال هذه الفترة، سلّمت دبي لصناعات الطيران 20 طائرة "بوينغ 737" إلى أيروميكسيكو.

 

مقالات مشابهة

  • سباق نحو الذكاء العام.. اختبار جديد يتحدى أقوى نماذج الذكاء الاصطناعي
  • ديب سيك تعزز منافستها مع OpenAI بتحديث نموذجها للذكاء الاصطناعي
  • شركات التكنولوجيا الأمريكية تحذر من تفوق الصين في الذكاء الاصطناعي
  • «دبي لصناعات الطيران» تنجز صفقة «بوينغ 737» مع «أيروميكسيكو»
  • دبي لصناعات الطيران: إتمام صفقة "بوينغ 737" مع "أيروميكسيكو"
  • معضلة «اليوم التالي»
  • مصر لصناعة الكيماويات تستهدف 1.3 مليار جنيه إيرادات خلال العام المالي المقبل
  • إسرائيل الشريك التجاري الثاني عشر لمصر
  • جامعة القناة تنظم المؤتمر العلمي البيئي الأول حول دور الذكاء الاصطناعي في الحفاظ على البيئة أبريل المقبل
  • جامعة قناة السويس تنظم دورة "الأمن السيبراني والذكاء الاصطناعي" مايو المقبل