Google Gemini 1.5 Pro نموذجًا جديدًا وأكثر كفاءة للذكاء الاصطناعي
تاريخ النشر: 16th, February 2024 GMT
كشفت Google يوم الخميس النقاب عن Gemini 1.5 Pro، والذي تصفه الشركة بأنه يقدم "أداء محسنًا بشكل كبير" مقارنة بالطراز السابق. يتبع مسار الذكاء الاصطناعي للشركة - الذي يُنظر إليه داخليًا على أنه بالغ الأهمية لمستقبلها - الكشف عن Gemini 1.0 Ultra الأسبوع الماضي، إلى جانب تغيير العلامة التجارية لـ Bard chatbot (إلى Gemini) لتتماشى مع قدرات النموذج الجديد الأكثر قوة وتنوعًا.
في منشور مدونة إعلاني، يحاول ساندر بيتشاي، الرئيس التنفيذي لشركة Google، وديميس هاسابيس، الرئيس التنفيذي لشركة Google DeepMind، تحقيق التوازن بين طمأنة جمهورهما حول السلامة الأخلاقية للذكاء الاصطناعي مع الترويج لقدرات نماذجهما سريعة التطور. ولخص بيتشاي قائلاً: "تواصل فرقنا دفع حدود أحدث موديلاتنا مع مراعاة السلامة في جوهرها".
تحتاج الشركة إلى التأكيد على سلامة المتشككين في الذكاء الاصطناعي (بما في ذلك أحد المديرين التنفيذيين السابقين لشركة جوجل) والجهات التنظيمية الحكومية. ولكنها تحتاج أيضًا إلى التأكيد على الأداء المتسارع لنماذجها لمطوري الذكاء الاصطناعي والعملاء المحتملين والمستثمرين الذين يشعرون بالقلق من أن الشركة كانت بطيئة جدًا في الاستجابة لنجاح OpenAI مع ChatGPT.
يقول Pichai وHassabis إن Gemini 1.5 Pro يقدم نتائج مماثلة لـ Gemini 1.0 Ultra. ومع ذلك، يعمل Gemini 1.5 على هذا المستوى بكفاءة أكبر، مع انخفاض المتطلبات الحسابية. تتضمن إمكانيات الوسائط المتعددة معالجة النصوص أو الصور أو مقاطع الفيديو أو الصوت أو التعليمات البرمجية. مع تقدم نماذج الذكاء الاصطناعي، ستستمر في تقديم مجموعة أكثر تنوعًا من الإمكانات في مربع مطالبة واحد (مثال حديث آخر هو دمج OpenAI لإنشاء صور DALL-E 3 في ChatGPT).
يمكن لـ Gemini 1.5 Pro أيضًا التعامل مع ما يصل إلى مليون رمز مميز، أو يمكن لوحدات نماذج البيانات التي تعمل بالذكاء الاصطناعي معالجتها في طلب واحد. تقول Google إن Gemini 1.5 Pro يمكنه معالجة أكثر من 700000 كلمة وساعة من الفيديو و11 ساعة من الصوت وقواعد التعليمات البرمجية مع أكثر من 30000 سطر من التعليمات البرمجية. وتقول الشركة إنها "اختبرت بنجاح" إصدارًا يدعم ما يصل إلى 10 ملايين رمز مميز.
تقول الشركة إن Gemini 1.5 Pro يحافظ على دقة عالية في الاستعلامات ذات أعداد الرموز المميزة الأكبر عندما يكون لديه المزيد من البيانات الجديدة ليتعلمها. يُقال أن النموذج أعجب بتقييم Needle In a Haystack. في هذا الاختبار، يقوم المطورون بإدراج جزء صغير من المعلومات داخل كتلة نصية طويلة لمعرفة ما إذا كان نموذج الذكاء الاصطناعي يمكنه التقاطها. قالت Google إن Gemini 1.5 Pro يمكنه العثور على النص المضمن بنسبة 99 بالمائة من الوقت في كتل البيانات التي يصل طولها إلى مليون رمز مميز.
تقول Google إن Gemini 1.5 Pro يمكنه التفكير في تفاصيل مختلفة من نصوص مهمة القمر Apollo 11 المؤلفة من 402 صفحة. بالإضافة إلى ذلك، يمكنه تحليل نقاط الحبكة والأحداث من فيلم صامت مدته 44 دقيقة تم تحميله من بطولة باستر كيتون. كتب هاسابيس: "نظرًا لأن نافذة السياق الطويلة لـ 1.5 Pro هي الأولى من نوعها بين النماذج واسعة النطاق، فإننا نعمل باستمرار على تطوير تقييمات ومعايير جديدة لاختبار قدراتها الجديدة".
تطلق Google برنامج Gemini 1.5 Pro بقدرات 128000 رمز، وهو نفس العدد الذي تصل إليه نماذج GPT-4 الخاصة بـ OpenAI (المعلن عنها علنًا). يقول هاسابيس إن جوجل ستقدم في النهاية مستويات تسعير جديدة تدعم ما يصل إلى مليون استعلام مميز.
يعد Gemini 1.5 Pro أيضًا بارعًا في تعلم مهارات جديدة من المعلومات في مطالبات طويلة - دون ضبط إضافي ("التعلم في السياق"). وفي اختبار قياسي يسمى الترجمة الآلية من كتاب واحد، تعلم النموذج دليلًا نحويًا للغة كالامانج، وهي لغة يتحدث بها أقل من 200 متحدث على مستوى العالم ولم يتم التدريب عليها من قبل. وتقول الشركة إن Gemini 1.5 Pro تعلم الأداء بمستوى مماثل حيث يتعلم الإنسان نفس المحتوى عند ترجمة اللغة الإنجليزية إلى Kalamang.
وفي جزء من الإعلان الذي سيلفت انتباه المطورين، تقول Google إن Gemini 1.5 Pro يمكنه أداء مهام حل المشكلات عبر كتل تعليمات برمجية أطول. كتب هاسابيس: "عندما تُعطى مطالبة تحتوي على أكثر من 100000 سطر من التعليمات البرمجية، يمكنها التفكير بشكل أفضل عبر الأمثلة، واقتراح تعديلات مفيدة وتقديم تفسيرات حول كيفية عمل أجزاء مختلفة من التعليمات البرمجية".
وعلى صعيد الأخلاقيات والسلامة، تقول جوجل إنها تتبع "نفس النهج تجاه المسئولين".
"العمل" الذي استغرقته نماذج Gemini 1.0. ويتضمن ذلك تطوير وتطبيق تقنيات الفريق الأحمر، حيث تعمل مجموعة من المطورين الأخلاقيين في الأساس كمدافعين عن الشيطان، ويختبرون "مجموعة من الأضرار المحتملة". بالإضافة إلى ذلك، تقول الشركة إنها تقوم بتدقيق شديد في مجالات مثل سلامة المحتوى والأضرار التمثيلية. وتقول الشركة إنها تواصل تطوير اختبارات أخلاقية وسلامة جديدة لأدوات الذكاء الاصطناعي الخاصة بها.
تطلق Google إصدار Gemini 1.5 للوصول المبكر للمطورين وعملاء المؤسسات. وتخطط الشركة لجعله متاحًا على نطاق أوسع في نهاية المطاف. يتوفر Gemini 1.0 حاليًا للمستهلكين، إلى جانب الإصدار Pro الذي يكلف 20 دولارًا شهريًا.
المصدر: بوابة الوفد
إقرأ أيضاً:
كيف وقع الذكاء الاصطناعي ضحية كذبة أبريل؟
اعتاد الصحفي بن بلاك نشر قصة كاذبة في الأول من أبريل/نيسان من كل عام على موقعه الإخباري المحلي "كومبران لايف" (Cwmbran Life)، ولكنه صُدم عندما اكتشف أن الذكاء الاصطناعي الخاص بغوغل يعتبر الأكاذيب التي كتبها حقيقة ويظهرها في مقدمة نتائج البحث، وفقا لتقرير نشره موقع "بي بي سي".
وبحسب التقرير فإن بلاك البالغ من العمر 48 عاما بدأ بنشر قصصه الزائفة منذ عام 2018، وفي عام 2020 نشر قصة تزعم أن بلدة كومبران في ويلز سُجلت في موسوعة غينيس للأرقام القياسية لامتلاكها أكبر عدد من الدوارات المرورية لكل كيلومتر مربع.
ورغم أنه عدل صياغة المقال في نفس اليوم ولكن عندما بحث عنه في الأول من أبريل/نيسان، صُدم وشعر بالقلق عندما رأى أن معلوماته الكاذبة تستخدمها أداة الذكاء الاصطناعي من غوغل وتقدمها للمستخدمين على أنها حقيقة.
يُذكر أن بلاك قرر كتابة قصص كاذبة في يوم 1 أبريل/نيسان من كل عام بهدف المرح والتسلية، وقال إن زوجته كانت تساعده في إيجاد الأفكار، وفي عام 2020 استلهم فكرة قصته من كون كومبران بلدة جديدة حيث يكون ربط المنازل بالدوارات من أسهل طرق البناء والتنظيم.
وقال بلاك: "اختلقت عددا من الدوارات لكل كيلومتر مربع، ثم أضفت اقتباسا مزيفا من أحد السكان وبعدها ضغطت على زر نشر، ولقد لاقت القصة استحسانا كبيرا وضحك الناس عليها".
إعلانوبعد ظهر ذلك اليوم أوضح بلاك أن القصة كانت عبارة عن "كذبة نيسان" وليست خبرا حقيقيا، ولكن في اليوم التالي شعر بالانزعاج عندما اكتشف أن موقعا إخباريا وطنيا نشر قصته دون إذنه، ورغم محاولاته في إزالة القصة فإنها لا تزال منشورة على الإنترنت.
وقال بلاك: "لقد نسيت أمر هذه القصة التي مر عليها 5 سنوات، ولكن عندما كنت أبحث عن القصص السابقة في يوم كذبة نيسان من هذا العام، تفاجأت بأن أداة غوغل للذكاء الاصطناعي وموقعا إلكترونيا لتعلم القيادة يستخدمان قصتي المزيفة ويظهران أن كومبران لديها أكبر عدد للدوارات المرورية في العالم".
وأضاف "إنه لمن المخيف حقا أن يقوم شخص ما في أسكتلندا بالبحث عن الطرق في ويلز باستخدام غوغل ويجد قصة غير حقيقية" (..) "إنها ليست قصة خطيرة ولكن الخطير حقا هو كيف يمكن للأخبار الكاذبة أن تنتشر بسهولة حتى لو كانت من مصدر إخباري موثوق، ورغم أنني غيرتها في نفس اليوم فإنها لا تزال تظهر على الإنترنت -فالإنترنت يفعل ما يحلو له- إنه أمر جنوني".
ويرى بلاك أن الذكاء الاصطناعي أصبح يشكل تهديدا للناشرين المستقلين، حيث تستخدم العديد من الأدوات محتواهم الأصلي دون إذن وتعيد تقديمه بأشكال مختلفة ليستفيد منها المستخدمون، وهذا قد يؤثر سلبا على زيارات مواقعهم.
وأشار إلى أن المواقع الإخبارية الكبرى أبرمت صفقات وتعاونت مع شركات الذكاء الاصطناعي، وهو أمر غير متاح له كناشر مستقل.
ورغم أن بلاك لم ينشر قصة كاذبة هذا العام بسبب انشغاله، فإن هذه التجربة أثرت عليه وجعلته يقرر عدم نشر أي قصص كاذبة مرة أخرى.