سيما.. نموذج ذكاء اصطناعي يصل إلى ألعاب الفيديو
تاريخ النشر: 30th, April 2024 GMT
الشخصيات في ألعاب الفيديو التي يتحكم فيها بواسطة الحاسوب ليست شيئا جديدا. فالشخصيات التي يتحكم بها الحاسوب هي من العناصر الأساسية في عالم الألعاب منذ فترة طويلة. ولكن اليوم ظهر نموذج مميز وجديد في مجال الألعاب ذات التحكم الذاتي بواسطة الحاسوب والذي سيغير عالم الألعاب.
سيما (SIMA) هو نموذج مطور في عالم ألعاب الفيديو والمعروف بالوكيل المتعدد المهام والقابل للتعلم والتوجيه والذي يعتمد على الذكاء الاصطناعي التوليدي للقيام بأمور لم نعهدها في الألعاب المنتشرة في الوقت الحالي.
يصف مختبر أبحاث الذكاء الاصطناعي غوغل ديب مايند نموذج سيما بأنه "وكيل ذكاء اصطناعي"، والذي يختلف عن النماذج الأخرى مثل شات جي بي تي وجيميني، يُدرب وكلاء الذكاء الاصطناعي على مجموعة كبيرة من البيانات، كما يمكنهم معالجة البيانات واتخاذ الإجراءات بأنفسهم.
سيما سيكون قادر على أداء أنواع مختلفة من المهام، إنه كصديق افتراضي يمكنه فهم التعليمات واتباعها في جميع أنواع البيئات الافتراضية من استكشاف الزنزانات الغامضة إلى بناء القلاع الفخمة، يمكنه إتمام المهام أو حل التحديات المسندة إليه.
وعلى عكس الشخصيات غير القابلة للعب، فإن سيما الذي يتحكم فيه الذكاء الاصطناعي غير مبرمج في لعبة معينة للتصرف بطريقة ما أو الاستجابة لبعض الإجراءات التي يقدمها البشر. بل تُعرفه غوغل بأنه وكيل ذكاء اصطناعي عام للبيئات الافتراضية الثلاثية الأبعاد.
كيف يعمل؟لا يمتلك سيما أي نوع من الوصول إلى خوارزميات اللعبة أو القواعد الداخلية، وبدلا من ذلك، يدرب ساعات عديدة من خلال مقاطع الفيديو التي تعرض أسلوب لعب اللاعبين العاديين. ومن هذه البيانات والشروح المقدمة، فهو يتعلم ربط تمثيلات مرئية معينة للقيام بالإجراءات والعمليات والتفاعلات. كما يتعلم من مقاطع فيديو للاعبين وهم يوجهون بعضهم البعض للقيام بأشياء خاصة في اللعبة.
على سبيل المثال، قد يتعلم الوكيل سيما من كيفية تحرك وحدات البيكسل في نمط معين على الشاشة أن هذا الإجراء يسمى "التحرك للأمام"، أو عندما تقترب الشخصية من شيء يشبه الباب ويستخدم شيئا يشبه مقبض الباب، فهذا يعني "فتح باب". أمور بسيطة مثل هذه، مهام أو أحداث تأخذ بضع ثوان ولكنها أكثر من مجرد الضغط على مفتاح أو تحديد شيء ما.
يلعب سيما جنبا إلى جنب مع اللاعبين فهو يتصرف على شاكلة اللاعب البشري من خلال اتباع أوامر لفظية، فهو مصمم ليكون مساعدا للاعب وليس خصما له.
تقول غوغل: "سيما ليس مدربا على الفوز في لعبة، بل هو مجهز للعمل جنبا إلى جنب مع اللاعب وتنفيذ الإجراءات بناء على تعليمات اللغة الطبيعية". كما أوضحت أن سيما يعمل كلاعب زميل يحاول إنجاز كل ما يطلبه منه اللاعب البشري.
وأضافت غوغل أن سيما يحتاج فقط إلى الصور التي توفرها البيئة ثلاثية الأبعاد وتعليمات اللغة التي يقدمها المستخدم. ومع إخراجات الفأرة ولوحة المفاتيح، يتم تقييمها عبر 600 مهارة، تشمل مجالات كالتنقل وتفاعل الكائنات وغيرها، فيفهم الجمل مثل "انعطف لليسار" أو "اقطع الشجرة" وينفذها.
محرك سيما اختبر على 9 ألعاب منها "نو مانز سكاي" ولعبة "إيكو" و "تيرداون" و "جوت سيميليتور" وغيرها (موقع غوغل ديب مايند) كيف يفهم سيما ألعاب الفيديووفق تقرير غوغل، فإن النموذج الذي تدرب على العديد من الألعاب كان أفضل من النموذج الذي تعلم كيفية اللعب في لعبة واحدة فقط. فقد تفوقت نماذج سيما التي تم تدريبها على مجموعة من الألعاب الثلاثية الأبعاد بشكل ملحوظ على جميع النماذج المتخصصة والتي تدربت على لعبة واحدة فقط.
وقعت هذه الاختبارات على 9 ألعاب منها "نو مانز سكاي" ولعبة "إيكو" و "تيرداون" و "جوت سيميليتور" وغيرها. ومن خلال التجارب على هذه الألعاب، فإن الوكيل الذي تدرب في كل الألعاب ما عدا واحدة كان بنفس الأداء الجيد في تلك اللعبة التي لم يتدرب عليها مسبقا.
وتبرز هذه التحديات على العمل في بيئات جديدة قدرة سيما على تعميم المهارات المكتسبة خارج نطاق التدريب. وتعتبر هذه نتيجة أولية واعدة، ولكن هناك حاجة إلى مزيد من البحث حتى يتمكن هذا المساعد من تقديم أداء قريب من المستوى البشري في كل من الألعاب المرئية وغير المرئية.
ميزات سيمايشتمل نموذج غوغل لألعاب الفيديو "سيما" على ميزات متطورة تمكنه من التفاعل ضمن بيئات محاكاة ثلاثية الأبعاد مختلفة. تعد هذه الميزات جزءا لا يتجزأ من تصميمه، مما يسمح له بفهم وتنفيذ تعليمات اللغة الطبيعية وتنفيذ العديد من الإجراءات. وأبرز هذه الميزات:
– نقل المعرفة إلى بيئة متعددة: من السمات الرئيسية لسيما أنه يستطيع استخدام المعرفة والمهارات التي اكتسبتها في بيئة ما لتحقيق أداء جيد في بيئة أخرى دون البدء من الصفر في كل مرة. تعد هذه القدرة على التنقل بين البيئات مهمة جدا لمرونة النموذج وكفاءته. فهذا يتيح له استخدام ما تعلمه في مجموعة واسعة من المواقف بدلا من موقف واحد فقط.
على سبيل المثال، إذا تعلم النموذج مفهوم "فتح الباب" في إحدى الألعاب، فيمكنه تطبيق هذه المعرفة عند مواجهة باب في لعبة أخرى غير ذات صلة. تعمل أنظمة الإدراك والعمل المتطورة للوكيل على تسهيل رسم خرائط المفاهيم المشتركة من خلال استخلاص أوجه التشابه الأساسية في التفاعلات عبر البيئات وتسريع تكيفها.
– يفهم تعليمات اللغة الطبيعية: صمم سيما لفهم مجموعة واسعة من التعليمات اللغوية، وتفسيرها في سياق بيئتها وأهدافها الحالية. يمتد هذا الفهم إلى الأوامر المعقدة وتسلسلات التعليمات، مما يمكّنه من الانخراط في التفاعلات المتطورة وإكمال المهام المعقدة وفقا لمدخلات اللغة الشبيهة بالإنسان.
– ينفذ أكثر من 600 إجراء: نظرا لتنوع بيئات التدريب وصعوبة المهام التي يمكنه التعامل معها، يمكن لنموذج سيما تنفيذ أكثر من 600 إجراء مختلف، وذلك بفضل مخزونه الكبير من الحركة، حيث يمكنه الاستجابة بشكل صحيح لمختلف المواقف والتعليمات.
سيما قادر على أداء أنواع مختلفة من المهام؛ فهو كصديق افتراضي يمكنه فهم التعليمات واتباعها في جميع أنواع البيئات الافتراضية (غيتي إيميجز) تحديات تطوير سيماواجه فريق أبحاث ديب مايند العديد من المشكلات الصعبة عند تطوير سيما. تنشأ هذه المشاكل عند تدريب نماذج الذكاء الاصطناعي في بيئات ثلاثية الأبعاد مختلفة ومتغيرة، وسنذكر أبرز التحديات التي واجهها المطورون:
– بيئات الوقت الحقيقي غير مصممة لنماذج مثل سيما: تدرب سيما في بيئات الوقت الحقيقي التي تعتمد على الوقت الفعلي، خاصة ألعاب الفيديو التجارية، وهذه البيئات غير متوقعة بطبيعتها وليست مصممة لوكلاء الذكاء الاصطناعي مثل سيما. تصممت هذه البيئات للاعبين البشر وتحتوي على تفاصيل دقيقة وديناميات يمكن أن تكون تحديا للذكاء الاصطناعي للتنقل والفهم.
– معلومات محدودة: يعني تقييم أداء سيما دون وصول إلى واجهة برمجة التطبيقات أن الوكيل لا يمكن أن يعتمد على حالات بيئية صريحة أو آليات اللعبة الأساسية التي عادة ما تكون متاحة للمطورين. هذا القيد يستدعي الاعتماد على إشارات بصرية ونصية فقط، مما يعكس تجربة لعب الإنسان ولكن يثير تحديات كبيرة في تفسير البيئة بدقة وإعطاء رد مناسب.
– دقة التقدير: نقص الوصول المباشر إلى حالة البيئة يعقد عملية التقييم، مما يجعل من الصعب التأكد مما إذا كان الذكاء الاصطناعي قد فهم ونفذ مهمة معينة بنجاح، خاصة في حالات معقدة أو غامضة.
المصدر: الجزيرة
كلمات دلالية: ترجمات حريات الذکاء الاصطناعی ألعاب الفیدیو من خلال فی لعبة
إقرأ أيضاً:
جوجل تدخل وضع الذكاء الاصطناعي الجديد إلى محرك البحث
تخطط شركة جوجل لإضافة ميزة جديدة تعرف بـ “وضع الذكاء الاصطناعي” (AI Mode) إلى محرك بحثها، وفقا لتقرير من موقع The Information، سيوفر هذا الوضع خيارا للتبديل من أعلى صفحة النتائج، مما يتيح للمستخدمين الوصول إلى واجهة تشبه تلك الخاصة بـ Gemini AI chatbot.
وبحسب ما ذكره موقع “ذا فيرج” التقني، سيتم إضافة علامة التبويب الجديدة “وضع الذكاء الاصطناعي” إلى الجانب الأيسر من علامات التبويب الموجودة مثل “الكل” و"الصور" و"مقاطع الفيديو" و"التسوق".
جوجل تطلق تحديثا جديدا لتطبيق Gmail.. إليك مميزاتهوداعا جوجل سيرش.. 4 خطوات لاستخدام بحث ChatGPT مجاناوعند استقبال المستخدم لرد في هذا الوضع، ستظهر روابط لصفحات ويب ذات صلة، بالإضافة إلى “شريط بحث” أسفل إجابة المحادثة، يدعو المستخدمين لمتابعة الاستفسارات.
تأتي هذه الخطوة بعد تقرير سابق من “Android Authority”، أكد على وجود وضع الذكاء الاصطناعي في إصدار تجريبي من تطبيق جوجل، كما اكتشف موقع 9to5Google، رمزا بشير إلى إمكانية استخدام هذا الوضع لطرح الأسئلة عبر الصوت.
جوجل لم تعلق على الأمر بعد، حيث تتجه نحو دمج البحث مع تقنيات الذكاء الاصطناعي في ظل الضغوط المتزايدة، خاصة بعد إطلاق OpenAI ميزة البحث في ChatGPT لجميع المستخدمين.
يذكر أن شركة جوجل قد بدأت بالفعل في تقديم ملخصات بحث مدعومة بالذكاء الاصطناعي لبعض الاستفسارات وعملت على توسيع هذه الميزة لتشمل المزيد من الدول في أكتوبر الماضي.
جوجل تتيح أداة البحث العميق بالذكاء الاصطناعيويشار إلى أن جوجل قد أعلنت عن توسيع إتاحة أداة البحث العميق “Deep Research” عبر نظام الذكاء الاصطناعي الخاص بها Gemini، لتضم 40 لغة إضافية، ومنها اللغة العربية، وذلك بعد أن أتاحت الأداة للمشتركين في خطة Gemini Advanced.
وتعمل الأداة من خلال طلب المستخدم من Gemini البحث في موضوع معين، إذ ينشئ الروبوت “خطة بحث متعددة الخطوات” يمكن للمستخدم تعديلها أو الموافقة عليها.
وأوضحت جوجل أن عملية البحث تبدأ بجمع “المعلومات المهمة” من الإنترنت، تليها عمليات بحث متعلقة بالموضوع نفسه، وهي عملية تكرر عدة مرات للحصول على نتائج دقيقة وشاملة.
وعند اكتمال البحث، تقدم الأداة تقريرا يضم أبرز النتائج مدعومة بروابط للمصادر الأصلية، ويمكن للمستخدمين طلب توضيحات إضافية حول بعض النقاط أو تعديل التقرير، مع إمكانية تصديره إلى مستندات جوجل في ملف نصي.