أعلن "إنسبشن"، مركز الذكاء الاصطناعي التابع لمجموعة "جي 42"، إطلاق الإصدار مفتوح المصدر من نموذج "جيس"، النموذج اللغوي الكبير للغة العربية الأعلى جودة على مستوى العالم.

ويستند "جيس" إلى 13 مليار مؤشر، وتم تدريبه على مجموعة بيانات جرى تطويرها حديثاً وتضم 395 مليار رمز باللغتين العربية والإنجليزية.

وسيسخر نموذج "جيس” الذي تمت تسميته تيمناً بأعلى قمة في دولة الإمارات العربية المتحدة، مزايا الذكاء الاصطناعي التوليدي في العالم العربي.

 

ويعد هذا النموذج ثمرة تعاون بين مركز "إنسبشن"؛ وجامعة محمد بن زايد للذكاء الاصطناعي، أول جامعة للدراسات العليا المتخصصة ببحوث الذكاء الاصطناعي على مستوى العالم؛ وشركة "سيريبراس سيستمز". 

وتم تدريب النموذج باستخدام "كوندور جالاكسي"، الحاسوب الفائق المدعوم بالذكاء الاصطناعي بقدرة حوسبة متعددة الإكسافلوبس (مليون ترليون عملية حسابية في الثانية)، والذي تم تصميمه بالتعاون بين "جي 42" و"سيريبراس سيستمز".

ويعد إطلاق "جيس" محطة بالغة الأهمية في مضمار الذكاء الاصطناعي في العالم العربي؛ ذلك أن هذا النموذج، الذي تم تطويره في العاصمة الإماراتية أبوظبي، يتيح لأكثر من 400 مليون متحدث باللغة العربية فرصة مهمة لاستكشاف القدرات الكامنة للذكاء الاصطناعي التوليدي، كما يعزز مكانة دولة الإمارات باعتبارها مركزاً رائداً للذكاء الاصطناعي، والابتكار، وصون الثقافة، والتعاون الدولي.

أخبار ذات صلة العلماء: الإمارات تسعى إلى تعزيز التعاون لتطوير بنية تحتية رقمية قوية نسخة «بيزنيس» من «تشات جي بي تي»

ويسعى مركز "إنسبشن"، من خلال فتح مصدر نموذج "جيس"، إلى حفز مشاركة المجتمعات العلمية والأكاديمية والمطورين في تسريع نمو منظومة حيوية للذكاء الاصطناعي باللغة العربية والارتقاء بمستوى االابتكار في هذا المجال، فقد يشكّل "جيس" نموذجاً يحتذى به للغات أخرى لا تحظى حالياً بدرجة كافية من التمثيل في بيئات الذكاء الاصطناعي الرائجة.

وقال أندرو جاكسون، الرئيس التنفيذي لمركز "إنسبشن" للذكاء الاصطناعي: "نؤمن في "إنسبشن" بأن التعاون هو أساس الازدهار. ونرسي اليوم معياراً جديداً لتقدم الذكاء الاصطناعي في منطقة الشرق الأوسط مع ضمان مكانة متميزة للغة العربية بكل ثرائها وإرثها في مشهد الذكاء الاصطناعي. ويعكس "جيس" التزامنا الراسخ بالتميز والابتكار ونشر منظومة الذكاء الاصطناعي على نطاق أوسع".

من جانبه، قال البروفيسور إيريك زينغ، رئيس جامعة محمد بن زايد للذكاء الاصطناعي: "تطلّب تطوير نموذج لغوي كبير للغة العربية من هذا المستوى إجراء أبحاث متقدمة في مجال الذكاء الاصطناعي، واكتساب فهم عميق للغة العربية بتنوعها وإرثها الغني وللأهمية المتنامية للنماذج اللغوية الكبيرة في مختلف جوانب المجتمع. وستواصل جامعة محمد بن زايد للذكاء الاصطناعي ريادة النماذج اللغوية الكبيرة التي تتميز بالكفاءة والفاعلية والدقة".

ويعد "جيس" نموذجاً لغوياً كبيراً قائماً على المحولات يستخدم العديد من المزايا المتطورة، بما فيها ميزة الانتباه للتحيزات الخطية "ALiBi" التي تمكّن النموذج من استقراء تسلسل طويل لتوفير سياق أفضل وأدق. ومن التقنيات الرائدة التي يستخدمها النموذج أيضاً دالة تنشط الوحدات الخطية المسورة "SwiGLU"، وتحديد معلمات الحد الأقصى للتحديث بغية تعزيز كفاءة تدريب النموذج ودقته.

وعمل فريقا جامعة محمد بن زايد للذكاء الاصطناعي ومركز "إنسبشن" على تقييم وتعديل نموذج "جيس" مفتوح المصدر، الذي تم تدريبه على مجموعة بيانات مخصصة تضم 116 مليار رمز مميز "tokens" باللغة العربية لاستيعاب تعقيد وتنوع وغنى هذه اللغة، وذلك باستخدام "كوندور جالاكسي 1" (CG-1)، حاسوب الذكاء الاصطناعي الفائق الذي تم الإعلان عن تطويره مؤخراً بالتعاون بين "جي 42" وشركة "سيريبراس سيستمز". وتضمنت مجموعة البيانات أيضاً 279 مليار رمز مميز باللغة الإنجليزية لضمان الارتقاء بأداء النموذج عبر التحويل ثنائي اللغة. وسيواصل مركز "إنسبشن" وجامعة محمد بن زايد للذكاء الاصطناعي تحسين نموذج "جيس" وتوسيع نطاقه لمواكبة نمو مجتمع مستخدميه.

وقال أندرو فيلدمان، الرئيس التنفيذي لشركة "سيريبراس سيستمز": "حققت شراكتنا الاستراتيجية مع "جي 42" نتائج متميزة بالفعل، حيث قدمنا منذ بضعة أسابيع حاسوب "كوندور جالاكسي" الفائق المدعوم بالذكاء الاصطناعي مع قدرة حوسبة متعددة الإكسافلوبس. واليوم تقدم هذه الشراكة إنجازاً استثنائياً آخر يتمثل بالنموذج اللغوي الكبير للغة العربية الموجه إلى مجتمع البرمجيات مفتوحة المصدر. ولطالما حرصنا في "سيريبراس" على تصميم تقنيات متطورة واستكشاف السبل المبتكرة لاستخدامها. ويشكّل "جيس" مساهمة كبيرة إلى مجتمع البرمجيات مفتوحة المصدر العالمي، ودليلاً ملموساً على سهولة استخدام حاسوب "كوندور جالاكسي 1" وقدرته على تطوير نماذج الذكاء الاصطناعي بسرعة فائقة".

 

المصدر: وام

المصدر: صحيفة الاتحاد

كلمات دلالية: اللغة العربية الذكاء الاصطناعي جامعة محمد بن زاید للذکاء الاصطناعی الذکاء الاصطناعی باللغة العربیة للغة العربیة الذی تم

إقرأ أيضاً:

تحديات جوهرية تواجه تطور الذكاء الاصطناعي

#سواليف

أظهر استطلاع حديث لخبراء في مجال #الذكاء_الاصطناعي أن توسيع نماذج اللغات الكبيرة (LLMs) لن يؤدي إلى تحقيق الذكاء الاصطناعي العام (AGI).

يعدّ AGI بمثابة النقلة النوعية التي تمكّن الأنظمة من التعلم بشكل فعّال كالذكاء البشري أو أفضل منه.

وأكد 76% من 475 باحثا في المجال، أنهم يرون أن هذا التوسع “غير مرجح” أو “غير مرجح جدا” أن يحقق هذا الهدف المنشود.

مقالات ذات صلة إعداد بسيط في هاتفك قد يجعلك تبدو أصغر بـ10 سنوات! 2025/04/01

وتعتبر هذه النتيجة انتكاسة كبيرة للصناعات التكنولوجية التي توقعت أن تحسينات بسيطة في النماذج الحالية من خلال مزيد من البيانات والطاقة ستؤدي إلى الذكاء الاصطناعي العام.

ومنذ #طفرة الذكاء الاصطناعي التوليدي في 2022، كانت التوقعات تركز على أن زيادة الموارد كافية لتجاوز #الذكاء_البشري. لكن مع مرور الوقت، وبالرغم من الزيادة الكبيرة في الإنفاق، فإن التقدم قد تباطأ بشكل ملحوظ.

وقال ستيوارت راسل، عالم الحاسوب في جامعة كاليفورنيا، بيركلي، والذي شارك في إعداد التقرير: “منذ إصدار GPT-4، أصبح واضحا أن التوسع في النماذج كان تدريجيا ومكلفا. الشركات قد استثمرت أموالا ضخمة بالفعل، ولا يمكنها التراجع بسبب الضغوط المالية”.

وفي السنوات الأخيرة، ساهمت البنية الأساسية المبتكرة المسماة “المحولات” (Transformers)، التي ابتكرها علماء غوغل عام 2017، في تحسن قدرات نماذج الذكاء الاصطناعي. وتستفيد هذه النماذج من زيادة البيانات لتوليد استجابات أدق. ولكن التوسع المستمر يتطلب موارد ضخمة من الطاقة والمال.

وقد استقطب قطاع الذكاء الاصطناعي المولّد نحو 56 مليار دولار في رأس المال المغامر عام 2024، مع تكريس جزء كبير من هذه الأموال لبناء مراكز بيانات ضخمة تسببت في زيادة انبعاثات الكربون ثلاث مرات منذ 2018.

ومع استنفاد البيانات البشرية القابلة للاستخدام بحلول نهاية هذا العقد، فإن الشركات ستضطر إما لاستخدام البيانات التي أنشأها الذكاء الاصطناعي نفسه أو جمع بيانات خاصة من المستخدمين، ما يعرض النماذج لمخاطر أخطاء إضافية. وعلى الرغم من ذلك، لا يقتصر السبب في محدودية النماذج الحالية على الموارد فقط، بل يتعدى ذلك إلى القيود الهيكلية في طريقة تدريب هذه النماذج.

كما أشار راسل: “المشكلة تكمن في أن هذه النماذج تعتمد على شبكات ضخمة تمثل مفاهيم مجزّأة، ما يجعلها بحاجة إلى كميات ضخمة من البيانات”.

وفي ظل هذه التحديات، بدأ الباحثون في النظر إلى نماذج استدلالية متخصصة يمكن أن تحقق استجابات أكثر دقة. كما يعتقد البعض أن دمج تقنيات الذكاء الاصطناعي مع أنظمة تعلم آلي أخرى قد يفتح آفاقا جديدة.

وفي هذا الصدد، أثبتت شركة DeepSeek الصينية أن بإمكانها تحقيق نتائج متميزة بتكاليف أقل، متفوقة على العديد من نماذج الذكاء الاصطناعي التي تعتمد عليها شركات التكنولوجيا الكبرى في وادي السيليكون.

ورغم التحديات، ما يزال هناك أمل في التقدم، حيث يقول توماس ديتريش، الأستاذ الفخري لعلوم الحاسوب في جامعة ولاية أوريغون: “في الماضي، كانت التطورات التكنولوجية تتطلب من 10 إلى 20 عاما لتحقيق العوائد الكبيرة. وهذا يعني أن هناك فرصة للابتكار بشكل كبير في مجال الذكاء الاصطناعي، رغم أن العديد من الشركات قد تفشل في البداية”.

مقالات مشابهة

  • 644 مليار دولار الإنفاق العالمي على الذكاء الاصطناعي التوليدي في 2025
  • لماذا قام إيلون ماسك بدمج شركته للذكاء الاصطناعي مع منصة "إكس" وما خطورة ذلك؟
  • تفوق التنين الصيني في السباق العالمي للذكاء الاصطناعي بعد "ديب سيك"
  • Runway تطلق نموذج فيديو جديد بالذكاء الاصطناعي يحافظ على تناسق المشاهد والشخصيات
  • 3 وظائف فقط ستنجو من سيطرة الذكاء الاصطناعي
  • مايكروسوفت.. قصة نجاح من الحوسبة إلى الذكاء الاصطناعي والسحابة
  • تحديات جوهرية تواجه تطور الذكاء الاصطناعي
  • الذكاء الاصطناعي واغتيال الخيال
  • عملاق التكنولوجيا في العالم.. يكشف عن ثلاث وظائف فقط ستنجو من سيطرة الذكاء الاصطناعي
  • الذكاء الاصطناعي يتقن الخداع!