الأعلى جودة في العالم.. إطلاق نموذج ذكاء اصطناعي باللغة العربية في أبوظبي
تاريخ النشر: 30th, August 2023 GMT
أبوظبي: عماد الدين خليل
أعلن «إنسبشن»، مركز الذكاء الاصطناعي التابع لمجموعة «جي 42» (G42)، بالشراكة مع جامعة محمد بن زايد للذكاء الاصطناعي، عن إطلاق الإصدار مفتوح المصدر من نموذج «جيس»، النموذج اللغوي الكبير للغة العربية الأعلى جودة على مستوى العالم، يستند «جيس» إلى 13 مليار مؤشر، وتم تدريبه على مجموعة بيانات جرى تطويرها حديثاً وتضم 395 مليار رمز باللغتين العربية والإنجليزية.
وأوضح المركز خلال مؤتمر صحفي عقد «عن بعد» صباح أمس الأربعاء في أبوظبي، أن تسميته النموذج جاء تيمناً بأعلى قمة في دولة الإمارات العربية المتحدة، وسيسخر النموذج مزايا الذكاء الاصطناعي التوليدي في العالم العربي، وتم تدريب النموذج باستخدام «كوندور جالاكسي»، الحاسوب الفائق المدعوم بالذكاء الاصطناعي بقدرة حوسبة متعددة الإكسافلوبس (مليون ترليون عملية حسابية في الثانية)، والذي تم تصميمه بالتعاون بين «جي 42» و«سيريبراس سيستمز».
ويعد إطلاق «جيس» محطة بالغة الأهمية في مضمار الذكاء الاصطناعي في العالم العربي ذلك أن هذا النموذج، الذي تم تطويره في أبوظبي، يتيح لأكثر من 400 مليون متحدث باللغة العربية فرصة مهمة لاستكشاف القدرات الكامنة للذكاء الاصطناعي التوليدي، كما يعزز مكانة دولة الإمارات باعتبارها مركزاً رائداً للذكاء الاصطناعي، والابتكار وصون الثقافة والتعاون الدولي.
ويسعى مركز «إنسبشن»، من خلال فتح مصدر نموذج «جيس»، إلى حفز مشاركة المجتمعات العلمية والأكاديمية والمطورين في تسريع نمو منظومة حيوية للذكاء الاصطناعي باللغة العربية والارتقاء بمستوى االابتكار في هذا المجال، فقد يشكّل «جيس» نموذجاً يحتذى به للغات أخرى لا تحظى حالياً بدرجة كافية من التمثيل في بيئات الذكاء الاصطناعي الرائجة.
وقال أندرو جاكسون، الرئيس التنفيذي لمركز «إنسبشن» للذكاء الاصطناعي: «نؤمن بأن التعاون هو أساس الازدهار ونرسي اليوم معياراً جديداً لتقدم الذكاء الاصطناعي في منطقة الشرق الأوسط مع ضمان مكانة متميزة للغة العربية بكل ثرائها وإرثها في مشهد الذكاء الاصطناعي، ويعكس»جيس«التزامنا الراسخ بالتميز والابتكار ونشر منظومة الذكاء الاصطناعي على نطاق أوسع».
وقال البروفيسور إيريك زينغ، رئيس جامعة محمد بن زايد للذكاء الاصطناعي والبروفيسور الجامعي: «تطلّب تطوير نموذج لغوي كبير للغة العربية من هذا المستوى إجراء أبحاث متقدمة في مجال الذكاء الاصطناعي، واكتساب فهم عميق للغة العربية بتنوعها وإرثها الغني وللأهمية المتنامية للنماذج اللغوية الكبيرة في مختلف جوانب المجتمع. وستواصل جامعة محمد بن زايد للذكاء الاصطناعي ريادة النماذج اللغوية الكبيرة التي تتميز بالكفاءة والفاعلية والدقة».
وبالتزامن مع إصدار النموذج، عقد مركز «إنسبشن» وجامعة محمد بن زايد للذكاء الاصطناعي شراكة أكاديمية لإتاحة استخدام «جيس» من قبل الفرق المطورة لنماذج اللغة العربية الحالية والمستقبلية بهدف اختباره، وتضمنت قائمة الشركاء الأكاديميين لمركز «إنسبشن» في إطلاق نموذج «جيس» كل من جامعة كارنيغي ميلون، ومدرسة البوليتكنيك الفرنسية، وجامعة حمد بن خليفة، ومختبر المعلوماتية في جامعة شمال باريس، ومختبر «كامل» التابع لجامعة نيويورك أبوظبي، وجامعة إدنبرة. وسوف تبدأ العديد من الهيئات والمؤسسات الإماراتية بالفعل في استخدام النموذج بما فيها وزارة الخارجية، ووزارة الصناعة والتكنولوجيا المتقدمة، ودائرة الصحة – أبوظبي، وشركة بترول أبوظبي الوطنية (أدنوك)، وطيران الاتحاد، وبنك أبوظبي الأول، ومجموعة e& الأمر يوفر رؤى قيّمة تساهم في تحسين النموذج.
ويعد «جيس» نموذجاً لغوياً كبيراً قائماً على المحولات يستخدم العديد من المزايا المتطورة، بما فيها ميزة الانتباه للتحيزات الخطية (ALiBi) التي تمكّن النموذج من استقراء تسلسل طويل لتوفير سياق أفضل وأدق ومن التقنيات الرائدة التي يستخدمها النموذج أيضاً دالة تنشط الوحدات الخطية المسورة (SwiGLU)، وتحديد معلمات الحد الأقصى للتحديث بغية تعزيز كفاءة تدريب النموذج ودقته.
وعمل فريقي جامعة محمد بن زايد للذكاء الاصطناعي ومركز «إنسبشن» على تقييم وتعديل نموذج «جيس» مفتوح المصدر، الذي تم تدريبه على مجموعة بيانات مخصصة تضم 116 مليار رمز مميز (tokens) باللغة العربية لاستيعاب تعقيد وتنوع وغنى هذه اللغة، وذلك باستخدام «كوندور جالاكسي 1» (CG-1)، حاسوب الذكاء الاصطناعي الفائق الذي تم الإعلان عن تطويره مؤخراً بالتعاون بين «جي 42» وشركة «سيريبراس سيستمز». وتضمنت مجموعة البيانات أيضاً 279 مليار رمز مميز باللغة الإنجليزية لضمان الارتقاء بأداء النموذج عبر التحويل ثنائي اللغة.
وقال أندرو فيلدمان، الرئيس التنفيذي لشركة «سيريبراس سيستمز»: «اليوم تقدم هذه الشراكة إنجازاً استثنائياً آخر يتمثل بالنموذج اللغوي الكبير للغة العربية الموجه إلى مجتمع البرمجيات مفتوحة المصدر، ويشكّل»جيس«مساهمة كبيرة إلى مجتمع البرمجيات مفتوحة المصدر العالمي، ودليلاً ملموساً على سهولة استخدام حاسوب كوندور جالاكسي 1 وقدرته على تطوير نماذج الذكاء الاصطناعي بسرعة فائقة».
ويمكن تنزيل نموذج «جيس» من موقع «Hugging Face» كما يمكن للمستخدمين تجربة النموذج عبر الإنترنت من خلال التسجيل عبر الموقع الإلكتروني لجيس وتلقي دعوة للوصول إليه.
المصدر: صحيفة الخليج
كلمات دلالية: فيديوهات الذكاء الاصطناعي أبوظبي جامعة محمد بن زاید للذکاء الاصطناعی الذکاء الاصطناعی باللغة العربیة للغة العربیة
إقرأ أيضاً:
لا تعهِدوا بقصص حياتكم للذكاء الاصطناعي
بينما كنت أقوم بتصحيح واجبات الطلبة الجامعيين في مادة الكتابة الإبداعية، مررت بأزمة إيمان عنيفة فيما يتعلق بالمستقبل، أعني مستقبل الدراسة الأكاديمية، ومستقبل الكتابة، ومستقبل التفكير. كنت قد كلفت الطلبة بأن يكتبوا عن هاجس مسيطر عليهم، أو أن يكتبوا قصة حياتهم من منظور أحد الهواجس المسيطرة على الثقافة الجماهيرية. والعادة مع هذا التكليف أنه يثمر كتابات مدهشة وعميقة ومفعمة بالحيوية من طلبة لم يجربوا من قبل تناول اهتماماتهم الشخصية بجدية، فإذا بي في هذه المرة أتلقى نصًا من ألفيّ كلمة يعرّف «الهاجس» مستندًا إلى الدليل التشخيصي والإحصائي للأمراض العقلية (DSM-5) وإلى مصادر إلكترونية عديدة، وكله مكتوب بأسلوب (تشات جي بي تي) النثري الضحل الخالي من الحياة.
كشفت شركة (أوبن آيه آي) [OpenAI] في وقت سابق من الشهر الحالي عن نسخة جديدة من إصدار تدريبي يعد -على حد قول رئيس الشركة التنفيذي سام آلتمان على الأقل- «بارعا في الكتابة الإبداعية». ومن غير الواضح بعد متى سوف يتم إطلاق هذه النسخة، لكن بوصفي مدرسًا قديمًا للتأليف لطلبة السنة الأولى فإنني أعرف تمام المعرفة خطورة الغش من خلال الاستعانة بالذكاء الاصطناعي في فصول تدريس الكتابة بشتى أنواعها. ويمكنني أن أتعاطف معهم ـ بقدر ما. فالطلبة يجدون أنفسهم غارقين، ويدفعهم الذعر إلى اللجوء إلى آلات الانتحال الأدبي. هؤلاء الطلبة أنفسهم أغرقتهم دعايات الذكاء الاصطناعي، وصادفوا بلا شك تغطيات إخبارية شديدة السذاجة مليئة بالمزاعم المضللة عن مدى إعجازية أدوات الذكاء الاصطناعي.ولكن، هل لطالب يدرس الكتابة الإبداعية أن يستعمل الذكاء الاصطناعي؟ وفي فصل مخصص لدراسة كتابة السيرة الذاتية؟ ترى ما الذي يمكن أن تقوله عن حياتك وأنت لا تريد أن تكبد نفسك مجرد عناء التفكير فيها؟
أعرف شخصيا، وقد كتبت عملين سيريّين، التحديات والمسرات الكامنة في هذا العمل، وأود أن يمر طلبتي بتجربتهم مع هذه التحديات هم الآخرون، ففعل كتابة السيرة الذاتية لا يتعلق بمحض قولك «انظروا إليَّ»، إنما هو يتعلق بالأحرى بتقويتك لنفسك وتعريفك لماهيتك، فذلك يجري جزئيا بمعاودة الرجوع إلى التجارب المنهكة بصفة خاصة، وتحليلها من جميع الزوايا، ورؤيتها في صورتها المعقدة، وإعادة سردها. وهذه العملية -ولا أقول هذا بأي قدر من الاستخفاف- تجعل الكاتب يشعر أنه أكثر امتلاء بحياته.
وإيكال أمر هذه المهمة، دون كل مهام الدنيا، إلى آلة عمل محبط إلى أبعد الحدود. والأدهى من ذلك أن يعهد بها إلى آلة تجوب الإنترنت جمعًا لنسخ مزيفة من نفسك، فذلك ليس خيانة للأمانة الأكاديمية وحسب، وإنما هو امتهان لذكرياتنا وإنسانيتنا. ومما يحبط المرء أن يفكر في أولئك الشباب الموهوبين إذ يعهدون لا بعملهم المهني وحده وإنما بقصص حياتهم ذاتها إلى حاسوب.
وليس الطلبة أكثر ما يعنيني. فإغواء استعمال طريق الذكاء الاصطناعي المختصر يمثل عرضا من أعراض ثقافة امتهنت كثيرا قيمة الكتابة وقيمة القراءة على السواء، إلى حد أن يبدو للبعض من طلابي أن الخيار العقلاني حقا هو النأي بأنفسهم عن كليهما.
في أيامنا هذه يزداد كثيرا امتهان الخبرة وتقدير ما يسمَّى بالكفاءة على جميع ما عداها. لكن ماذا لو أن كمال تكوين المرء -وهذا ما أنا مقتنع به تمام الاقتناع- لا يتعلق بتعظيم إنتاجيته وإنما بفهم جوانب عدم الكفاءة والفوضى في الحياة، بل وباحتضانها؟ فكل التعلم في برامج الكتابة إنما يحدث في هذه اللحظات الكفاحية. وهذه المهارات التي يتعلمها الطالب في هذا البرنامج هي المهارات الحيوية، لأن معرفة الظرف الإنساني وفهمه سوف يظلان أمرا جوهريا بعد أن يذوي الذكاء الاصطناعي بزمن طويل.
قد تبدو هذه معركة عبثية، فالسؤال الذي يواجهني أكثر مما سواه في عملي ممن لا علاقة لهم به هو ما إذا كان الطلبة يكتبون أي شيء حقا، والحق أن أغلبهم في حدود ما أرى يكتبون: يكتبون مسوَّدات، وينقحونها، ويتعثرون، ويسهرون الليل ويصابون بالإحباط ويقدمون لي أفضل ما في وسعهم عمله، وهم يفهمون أن سحر السيرة الذاتية إنما يتحقق حينما يتفاعل قارئ مع الوعي الفريد الواقع في الجانب الآخر من الصفحة.
وقد تتعلم أداة الذكاء الاصطناعي كيف تحاكي بالاصطناع المنتج الكتابي النهائي، ولكنها لن تحاكي أبدا روح كاتب أو طريقة إنتاجه لكتابة ذات معنى، فالعملية التي يحل بها عقل فردي متفرد مشكلة ما هي التي تمنح القراء قدرة على التواصل مع ذات شخص آخر، شخص فعلي، وهذه العملية هي التي تشكل جوهر حياة الكتابة والحكي وهي شريان الحياة لكليهما.
أعرف أن مشكلة الذكاء الاصطناعي سوف تتفاقم على مدى السنوات القادمة، في ظل تبني مؤسساتنا للتكنولوجيا لم تثبت جدواها تمام الثبوت، فها هي إدارات الجامعات تعلن دوريا عن شراكات جديدة مع شركات مبتدئة في مجال الذكاء الاصطناعي، وها هم أساتذة يعمدون بنية حسنة -فلعلهم يتخيلون طالبا مثاليا في عالم مثالي، أو أن الأمر لا يعدو أنهم يشعرون أن عليهم أن يجاروا الحداثة- إلى دمج هذه الأدوات في فصولهم، حتى لو أن الطلاب يرون هذه الأدوات محض طرق مختصرة يسيرة.
وليس من شيء تحت سيطرتي حقا بوصفي معلمًا إلا ما أعمله في فصلي. فسوف أظل أدرّس للطلبة، سواء أكتبوا سيرة ذاتية تصبح من أكثر الكتب رواجًا ومبيعًا أم اقتصر أمرهم على الخربشة في دفاتر يومياتهم بين الحين والحين، سأظل أعلمهم أننا قادرون على أن ننجز العمل بأمانة وبجدية قدر استطاعتنا، واضعين أنفسنا وهواجسنا على الصفحة.
ففعل الكتابة نفسه قد يكون فعل حفاظ على الذات، بل وفعل عصيان، وما شرارة الثورة هذه إلا أعظم نقاط قوتنا، وما لهذه الشرارة من وجود إلا في أنفسنا.