دبي، الإمارات العربية المتحدة (CNN)-- أدّى ظهور روبوت الدردشة "تشات جي بي تي" (ChatGPT) والمنصات المماثلة إلى التسبب بضجة حول الذكاء الصناعي، المُدرّب على مجموعات واسعة من البيانات على الإنترنت للاستجابة للأوامر النصية.

ورُغم الاهتمام المتزايد بالذكاء الاصطناعي في الشرق الأوسط، إلا أن نماذج اللغة العربية تخلفت عن الركب.

ولكن، كشف فريق من الأكاديميين، والباحثين، والمهندسين في دولة الإمارات العربية المتحدة مؤخرًا عن أداة قوية مصممة خصيصًا للمتحدثين باللغة العربية في العالم، والتي يقول مبتكروها إنّها قد تمهّد الطريق لنموذج لغوي كبير (أنظمة LLM) بلغات أخرى "أقل تمثيلاً في الذكاء الاصطناعي السائد".

أُطلق على الأداة اسم "جيس" تيمنًا باسم أكبر جبل في دولة الإمارات. ويعتبرها صنّاعها النموذج اللغوي الكبير للغة العربية الأعلى جودة في العالم. Credit: Gifty Sahany/CNN

وأُطلق على الأداة اسم "جيس" تيمنًا باسم أكبر جبل في دولة الإمارات، وتم إنشاؤها بالتعاون بين جامعة محمد بن زايد للذكاء الاصطناعي (MBZUAI) في أبوظبي، وشركة "Cerebras Systems"، ومقرّها "سيليكون فالي"، و"Inception" التابعة لشركة "G42" للذكاء الصناعي، ومقرها الإمارات.

ورغم أنّ "ChatGPT"، و"LLaMA" التابعة لشركة "ميتا"، وغيرها من أنظمة "LLM" تتمتع بقدرات لغوية عربية، إلا أنّها مُدرَّبة في الغالب على بيانات باللغة الإنجليزية على الإنترنت، وفقًا لما ذكره تيموثي بالدوين، عميد الجامعة بالإنابة، وأستاذ معالجة اللغات الطبيعية في جامعة محمد بن زايد للذكاء الاصطناعي.

وبدلاً من ذلك، استخدمت أداة "جيس" مجموعات البيانات باللغتين الإنجليزية والعربية، مع التركيز على المحتوى القادم من الشرق الأوسط، ما سمح لها بالذهاب لأبعد "ممّا تمكّن أي شخص آخر من تحقيقه باللغة العربية"، بحسب ما أوضحه بالدوين.

وتُهيمن اللغات التي تستخدم الحروف اللاتينية على الإنترنت، واللغة الإنجليزية هي الأكثر استخدامًا حتّى الآن.

وقال مدير التقنيات الاستراتيجية وبرامج الأمن السيبراني في معهد الشرق الأوسط بواشنطن، محمد سليمان. إن ذلك يعني أنّ مجموعات البيانات تكون أكبر بهذه اللغات.

وأضاف لـCNN أنّ "جعل الوصول إلى أدوات الذكاء الاصطناعي حكرًا على أولئك الذين يمكنهم التحدث بلغات معينة قد يمنع شريحة كبيرة من المجتمعات المحرومة من جني فوائد الذكاء الصناعي".

وتحتوي النماذج اللغوية المُدرَّبة باللغة الإنجليزية عادةّ على مجموعات من البيانات المتمحورة حول الغرب. وأوضح سليمان أن "(أنظمة LLM هذه) تفتقر إلى الوعي بالثقافات الأخرى، ما يؤثر سلبًا على تجربة المستخدم بالنسبة للأشخاص من خلفيات متنوعة".

وبفضل التدريب الذي تمتعت به، تفهم "جيس" الفروقات الثقافية، واللهجات، وفقًا لما أشارت إليه جامعة محمد بن زايد للذكاء الاصطناعي، ويتيح ذلك استخدامها على نطاق أوسع في مختلف الصناعات.

وفي الإصدارات المستقبلية، يهدف الفريق إلى جعل "جيس" تعمل مع الصور، أو الرسوم البيانية، أو جداول البيانات بدلاً من النصوص فقط، وسيؤدي ذلك إلى توسيع نطاق استخداماتها، وربما تمكينها من تفسير المسوحات الطبية، أو البيانات الاستثمارية، أو البيانات الواردة من الأقمار الصناعية.

اللهجات المختلفة

وذكر بالدوين أنّ اللغة العربية هي اللغة السادسة الأكثر استخدامًا في العالم، وهي غنية بـ "مجموعة" من اللهجات المختلفة، ما يزيد من تعقيد تدريب نموذج اللغة. وتُستخدم اللغة العربية الفصحى الحديثة عادةً في الوثائق والكتابات الرسمية، ولكن غالبًا ما تُستخدم اللهجات المحلية في المدونات، أو وسائل التواصل الاجتماعي. وخلال تدريبها على مجموعة متنوعة من البيانات، أشار بالدوين إلى تمكّن "جيس" من التنقل بين اللهجات المختلفة.

وأضاف بالدوين: "هناك مجال للتحسّن بالتأكيد، ولكن جرى التركيز بشكلٍ أكبر على القوة، من حيث القدرة على فهم ما إذا كان لدينا المزيد من المدخلات غير الرسمية للنموذج".

ويسمح التحديث الأخير لـ"Bard" من "غوغل" أيضًا بفهم الأسئلة بأكثر من 12 لهجة عربية، بما في ذلك اللغة العامية المصرية، والسعودية، ومن ثم يكون الرّد باللغة العربية الفصحى الحديثة.

وقال بالدوين إنّ "جيس" تتمتّع بـ13 مليار متغير، ويجري العمل على تحديث 30 مليار متغير.

وتحدّد المتغيرات حجم نموذج اللغة، ولكن ليس بالضرورة دقتها.

وتتمتع منصة "ChatGPT-3.5" بـ175 مليار متغير تقريبًا، وفقًا لما ذكرته "OpenAI".

وقال بالدوين إنّ "جيس" تستخدم ضبط التعليمات لمنعها من إنشاء إجابات "سامة" أو "ضارة" تمامًا مثل نماذج الذكاء الاصطناعي التوليدية الأخرى.

ولن تولّد الأداة أي شيء قد يؤدي إلى إيذاء النفس، أو إلحاق الضرر بالآخرين، أو يوحي بالإدمان.

وتلتزم الإجابات التي تولدها بالقواعد والعادات المحلية بشأن مواضيع مثل المثلية الجنسية، والمخدرات.

وأجرت جامعة محمد بن زايد للذكاء الاصطناعي "حوارات مختلفة" مع حكومة الإمارات، والمؤسسات الأخرى حول الذكاء الاصطناعي المسؤول، والتي أُخِذت بعين الاعتبار عند تطوير "جيس"، وفقًا لما ذكره بالدوين.

التطورات الإقليمية

شهدت دولة الإمارات العربية المتحدة جهودًا متزايدة لتطوير أنظمة الذكاء الاصطناعي التوليدية.

وكانت الإمارات أول دولة في العالم تعين وزيرًا للذكاء الاصطناعي في عام 2017.

وفي مارس/آذار، كشف مجلس أبحاث التكنولوجيا المتطورة في أبوظبي ومعهد الابتكار التكنولوجي (TII) عن أكبر نموذج للذكاء الاصطناعي في المنطقة، وهو "فالكون"، مع إصدار نسخة جديدة في سبتمبر/أيلول.

المصدر: CNN Arabic

كلمات دلالية: الذكاء الاصطناعي تكنولوجيا جامعة محمد بن زاید للذکاء الاصطناعی الذکاء الاصطناعی باللغة العربیة اللغة العربیة دولة الإمارات الاصطناعی ا فی العالم

إقرأ أيضاً:

أوبن إيه آي تغير تكتيكها في تدريب نماذج الذكاء الاصطناعي

قررت شركة "أوبن إيه آي" تغيير تكتيكها في تدريب نماذج الذكاء الاصطناعي للوصول إلى ما وصفتها بـ"الحرية الفكرية" بغض النظر عن الأخطار أو التحديات التي يثيرها هذا الموضوع، إذ سيصبح "شات جي بي تي" قادرا على تقديم إجابات ووجهات نظر كانت محظورة في السابق، وستقل المواضيع التي لن يتحدث عنها الروبوت الدردشة الذكي، وفقا لتقرير نشره موقع "تيك كرانش".

ويرى محللون أن هذا القرار يُعد جزءا من جهود "أوبن إيه آي" في كسب رضا إدارة ترامب الجديدة، ومن جهة أخرى تشير إلى توسع كبير في وادي السيليكون فيما يخص سلامة الذكاء الاصطناعي.

وقد أعلنت "أوبن إيه آي" عن تحديث مواصفات نماذجها من خلال وثيقة تتكون من 187 صفحة، حددت فيها طريقة تدريب نماذج الذكاء الاصطناعي على التصرف، كما كشفت عن مبدأ توجيهي جديد وهو "لا تكذب، سواء من خلال تقديم بيانات غير صحيحة أو من خلال حذف سياق مهم".

وفي قسم جديد يسمى "لنبحث عن الحقيقة معا"، تقول الشركة إنها لا تريد من "شات جي بي تي" أن يتخذ موقفا تحريريا أو رأيا محددا حتى لو اعتبر بعض المستخدمين ذلك غير أخلاقي أو مسيئا، وهذا يعني أن روبوت الدردشة سيقدم وجهات نظر متعددة حول المواضيع المثيرة للجدل، بشكل يكون فيه محايدا وغير منحاز إلى طرف معين، على سبيل المثال يجب أن يذكر أن "حياة السود مهمة" ويتابع أن "حياة الجميع مهمة أيضا"، بدلا من رفض الإجابة أو اتخاذ جانب سياسي في الإجابة، فالشركة تريد أن يؤكد حبه للبشرية جمعاء، ثم يُقدم سياقا حول كل قضية.

إعلان

وتقول الشركة في الوثيقة: "قد يكون هذا المبدأ مثيرا للجدل، لأنه يشير إلى أن مساعد الذكاء الاصطناعي قد يبقى محايدا في مواضيع يعتبرها البعض غير أخلاقية أو مسيئة، ومع ذلك فإن الهدف من روبوت الدردشة هو مساعدة الإنسانية وليس تشكيلها".

وأوضحت "أوبن إيه آي" أن هذا التكتيك الجديد لا يعني أن "شات جي بي تي" أصبح منفتحا بشكل كامل، بل سيظل يرفض الإجابة عن الأسئلة غير الأخلاقية، التي تحرض على الخطأ ويرفض الرد بطريقة تدعم الأكاذيب الواضحة.

ويمكن اعتبار هذه التغييرات ردا على الانتقادات بشأن تدابير الأمان في "شات جي بي تي"، التي بدت منحازة نحو اليسار المعتدل، ومع ذلك رفض المتحدث باسم "أوبن إيه آي" فكرة أن الشركة أجرت هذه التغييرات لإرضاء ترامب، وأوضح أن تبني الحرية الفكرية يعكس اعتقادات الشركة في منح المستخدمين مزيدا من السيطرة، ولكن ليس الجميع يرى الأمر بهذه الطريقة.

مقالات مشابهة

  • كلية البريمي الجامعية تطرح تخصصات في الذكاء الاصطناعي والأمن السيبراني
  • اليوم العالمي للغة الأم.. نصائح لتعليم الطفل اللغة العربية
  • جامعة عجمان تختتم الملتقى الرابع للذكاء الاصطناعي في قطاع التعليم
  • حكومة الوحدة: ناقشنا تجارب الدول العربية الناجحة في استخدام الذكاء الاصطناعي
  • كريستيانو جونيور يتحدث باللغة العربية مع صديقه .. فيديو
  • الذكاء الاصطناعي يُبكي هنا الزاهد على الهواء
  • أوبن إيه آي تغير تكتيكها في تدريب نماذج الذكاء الاصطناعي
  • جوجل ترجع لسباق الذكاء الاصطناعي وتضيف «التفكير» إلى تطبيق جيمني
  • التربية والتعليم تُنظم لقاءين تعريفيين باللغة الصينية في مسقط والداخلية
  • بيتروس يعلم فتاتين من نجران اللغة البرتغالية ويتفاعل معهما: تبارك الله.. فيديو