كشفت Google يوم الخميس النقاب عن Gemini 1.5 Pro، والذي تصفه الشركة بأنه يقدم "أداء محسنًا بشكل كبير" مقارنة بالطراز السابق. يتبع مسار الذكاء الاصطناعي للشركة - الذي يُنظر إليه داخليًا على أنه بالغ الأهمية لمستقبلها - الكشف عن Gemini 1.0 Ultra الأسبوع الماضي، إلى جانب تغيير العلامة التجارية لـ Bard chatbot (إلى Gemini) لتتماشى مع قدرات النموذج الجديد الأكثر قوة وتنوعًا.

في منشور مدونة إعلاني، يحاول ساندر بيتشاي، الرئيس التنفيذي لشركة Google، وديميس هاسابيس، الرئيس التنفيذي لشركة Google DeepMind، تحقيق التوازن بين طمأنة جمهورهما حول السلامة الأخلاقية للذكاء الاصطناعي مع الترويج لقدرات نماذجهما سريعة التطور. ولخص بيتشاي قائلاً: "تواصل فرقنا دفع حدود أحدث موديلاتنا مع مراعاة السلامة في جوهرها".

تحتاج الشركة إلى التأكيد على سلامة المتشككين في الذكاء الاصطناعي (بما في ذلك أحد المديرين التنفيذيين السابقين لشركة جوجل) والجهات التنظيمية الحكومية. ولكنها تحتاج أيضًا إلى التأكيد على الأداء المتسارع لنماذجها لمطوري الذكاء الاصطناعي والعملاء المحتملين والمستثمرين الذين يشعرون بالقلق من أن الشركة كانت بطيئة جدًا في الاستجابة لنجاح OpenAI مع ChatGPT.

يقول Pichai وHassabis إن Gemini 1.5 Pro يقدم نتائج مماثلة لـ Gemini 1.0 Ultra. ومع ذلك، يعمل Gemini 1.5 على هذا المستوى بكفاءة أكبر، مع انخفاض المتطلبات الحسابية. تتضمن إمكانيات الوسائط المتعددة معالجة النصوص أو الصور أو مقاطع الفيديو أو الصوت أو التعليمات البرمجية. مع تقدم نماذج الذكاء الاصطناعي، ستستمر في تقديم مجموعة أكثر تنوعًا من الإمكانات في مربع مطالبة واحد (مثال حديث آخر هو دمج OpenAI لإنشاء صور DALL-E 3 في ChatGPT).
يمكن لـ Gemini 1.5 Pro أيضًا التعامل مع ما يصل إلى مليون رمز مميز، أو يمكن لوحدات نماذج البيانات التي تعمل بالذكاء الاصطناعي معالجتها في طلب واحد. تقول Google إن Gemini 1.5 Pro يمكنه معالجة أكثر من 700000 كلمة وساعة من الفيديو و11 ساعة من الصوت وقواعد التعليمات البرمجية مع أكثر من 30000 سطر من التعليمات البرمجية. وتقول الشركة إنها "اختبرت بنجاح" إصدارًا يدعم ما يصل إلى 10 ملايين رمز مميز.

تقول الشركة إن Gemini 1.5 Pro يحافظ على دقة عالية في الاستعلامات ذات أعداد الرموز المميزة الأكبر عندما يكون لديه المزيد من البيانات الجديدة ليتعلمها. يُقال أن النموذج أعجب بتقييم Needle In a Haystack. في هذا الاختبار، يقوم المطورون بإدراج جزء صغير من المعلومات داخل كتلة نصية طويلة لمعرفة ما إذا كان نموذج الذكاء الاصطناعي يمكنه التقاطها. قالت Google إن Gemini 1.5 Pro يمكنه العثور على النص المضمن بنسبة 99 بالمائة من الوقت في كتل البيانات التي يصل طولها إلى مليون رمز مميز.

تقول Google إن Gemini 1.5 Pro يمكنه التفكير في تفاصيل مختلفة من نصوص مهمة القمر Apollo 11 المؤلفة من 402 صفحة. بالإضافة إلى ذلك، يمكنه تحليل نقاط الحبكة والأحداث من فيلم صامت مدته 44 دقيقة تم تحميله من بطولة باستر كيتون. كتب هاسابيس: "نظرًا لأن نافذة السياق الطويلة لـ 1.5 Pro هي الأولى من نوعها بين النماذج واسعة النطاق، فإننا نعمل باستمرار على تطوير تقييمات ومعايير جديدة لاختبار قدراتها الجديدة".

تطلق Google برنامج Gemini 1.5 Pro بقدرات 128000 رمز، وهو نفس العدد الذي تصل إليه نماذج GPT-4 الخاصة بـ OpenAI (المعلن عنها علنًا). يقول هاسابيس إن جوجل ستقدم في النهاية مستويات تسعير جديدة تدعم ما يصل إلى مليون استعلام مميز.
يعد Gemini 1.5 Pro أيضًا بارعًا في تعلم مهارات جديدة من المعلومات في مطالبات طويلة - دون ضبط إضافي ("التعلم في السياق"). وفي اختبار قياسي يسمى الترجمة الآلية من كتاب واحد، تعلم النموذج دليلًا نحويًا للغة كالامانج، وهي لغة يتحدث بها أقل من 200 متحدث على مستوى العالم ولم يتم التدريب عليها من قبل. وتقول الشركة إن Gemini 1.5 Pro تعلم الأداء بمستوى مماثل حيث يتعلم الإنسان نفس المحتوى عند ترجمة اللغة الإنجليزية إلى Kalamang.

وفي جزء من الإعلان الذي سيلفت انتباه المطورين، تقول Google إن Gemini 1.5 Pro يمكنه أداء مهام حل المشكلات عبر كتل تعليمات برمجية أطول. كتب هاسابيس: "عندما تُعطى مطالبة تحتوي على أكثر من 100000 سطر من التعليمات البرمجية، يمكنها التفكير بشكل أفضل عبر الأمثلة، واقتراح تعديلات مفيدة وتقديم تفسيرات حول كيفية عمل أجزاء مختلفة من التعليمات البرمجية".

وعلى صعيد الأخلاقيات والسلامة، تقول جوجل إنها تتبع "نفس النهج تجاه المسئولين".

"العمل" الذي استغرقته نماذج Gemini 1.0. ويتضمن ذلك تطوير وتطبيق تقنيات الفريق الأحمر، حيث تعمل مجموعة من المطورين الأخلاقيين في الأساس كمدافعين عن الشيطان، ويختبرون "مجموعة من الأضرار المحتملة". بالإضافة إلى ذلك، تقول الشركة إنها تقوم بتدقيق شديد في مجالات مثل سلامة المحتوى والأضرار التمثيلية. وتقول الشركة إنها تواصل تطوير اختبارات أخلاقية وسلامة جديدة لأدوات الذكاء الاصطناعي الخاصة بها.

تطلق Google إصدار Gemini 1.5 للوصول المبكر للمطورين وعملاء المؤسسات. وتخطط الشركة لجعله متاحًا على نطاق أوسع في نهاية المطاف. يتوفر Gemini 1.0 حاليًا للمستهلكين، إلى جانب الإصدار Pro الذي يكلف 20 دولارًا شهريًا.

المصدر: بوابة الوفد

إقرأ أيضاً:

ميتا تغير تسمياتها لصور الذكاء الاصطناعي بعد شكاوى المصورين

تعمل شركة Meta على تحديث تصنيفاتها "Made with AI" بعد شكاوى واسعة النطاق من المصورين بأن الشركة كانت تشير عن طريق الخطأ إلى محتوى غير منشأ بواسطة الذكاء الاصطناعي. وفي أحد التحديثات، قالت الشركة إنها ستغير الصياغة إلى "معلومات الذكاء الاصطناعي" لأن التصنيفات الحالية "لم تكن دائمًا متوافقة مع توقعات الأشخاص ولم توفر دائمًا سياقًا كافيًا".

قدمت الشركة ملصقات "Made with AI" في وقت سابق من هذا العام بعد انتقادات من مجلس الرقابة بشأن سياسة "الوسائط التي تم التلاعب بها". وقالت ميتا إنها، مثل العديد من نظيراتها، ستعتمد على إشارات "معايير الصناعة" لتحديد متى تم استخدام الذكاء الاصطناعي التوليدي لإنشاء صورة. ومع ذلك، لم يمض وقت طويل قبل أن يبدأ المصورون في ملاحظة أن فيسبوك وإنستغرام كانا يطبقان الشارة على الصور التي لم يتم إنشاؤها بالفعل باستخدام الذكاء الاصطناعي. وفقًا للاختبارات التي أجرتها PetaPixel، فإن الصور التي تم تحريرها باستخدام أداة التعبئة التوليدية من Adobe في Photoshop من شأنها أن تؤدي إلى تشغيل الملصق حتى لو كان التعديل مجرد "بقعة صغيرة".


على الرغم من أن Meta لم تذكر اسم Photoshop، إلا أن الشركة قالت في تحديثها إن "بعض المحتوى الذي تضمن تعديلات طفيفة باستخدام الذكاء الاصطناعي، مثل أدوات التنقيح، تضمن مؤشرات صناعية قياسية" أدت إلى ظهور شارة "Made with AI". "بينما نعمل مع الشركات في جميع أنحاء الصناعة لتحسين العملية بحيث يتوافق نهج التصنيف الخاص بنا بشكل أفضل مع هدفنا، فإننا نقوم بتحديث علامة "Made with AI" إلى "معلومات الذكاء الاصطناعي" عبر تطبيقاتنا، والتي يمكن للأشخاص النقر عليها للحصول على مزيد من المعلومات. "

ومن المربك إلى حد ما، أن تسميات "معلومات الذكاء الاصطناعي" الجديدة لن تحتوي في الواقع على أي تفاصيل حول الأدوات التي تدعم الذكاء الاصطناعي والتي ربما تم استخدامها للصورة المعنية. أكد متحدث باسم Meta أن القائمة السياقية التي تظهر عندما ينقر المستخدمون على الشارة ستظل كما هي. تحتوي هذه القائمة على وصف عام للذكاء الاصطناعي التوليدي وتشير إلى أن Meta قد تضيف إشعارًا "عندما يشارك الأشخاص محتوى يحتوي على إشارات الذكاء الاصطناعي التي يمكن لأنظمتنا قراءتها".

مقالات مشابهة

  • «معلومات الوزراء»: 33% من الوظائف في الاقتصادات المتقدمة مُعرضة للخطر
  • «معلومات الوزراء» يستعرض أبرز التقارير الدولية حول خريطة جاهزية العالم للذكاء الاصطناعي
  • الهند تعتزم إنشاء منصة للابتكار في مجال الذكاء الاصطناعي
  • الخبراء يجتمعون في مسقط لإعداد "ميثاق العالم الإسلامي للذكاء الاصطناعي"
  • حلقة إقليمية تستعرض البرامج التنفيذية لإعداد ميثاق العالم الإسلامي للذكاء الاصطناعي
  • "التعاون الإسلامي" تدعو إلى حوكمة أخلاقية للذكاء الاصطناعي
  • الأمم المتحدة تتبنى قرارا صينيا حول الوصول للذكاء الاصطناعي
  • حلقةُ عمل إقليمية حول ميثاق العالم الإسلامي للذكاء الاصطناعي في منطقتي آسيا والشرق الأوسط
  • ميتا تغير تسمياتها لصور الذكاء الاصطناعي بعد شكاوى المصورين
  • 500 مليون دولار وفورات “أدنوك”من تطبيق 30 أداة للذكاء الاصطناعي