نموذج جيس في الإمارات.. ما هو هدف الذكاء الاصطناعي باللغة العربية؟
تاريخ النشر: 18th, October 2023 GMT
دبي، الإمارات العربية المتحدة (CNN)-- أدّى ظهور روبوت الدردشة "تشات جي بي تي" (ChatGPT) والمنصات المماثلة إلى التسبب بضجة حول الذكاء الصناعي، المُدرّب على مجموعات واسعة من البيانات على الإنترنت للاستجابة للأوامر النصية.
ورُغم الاهتمام المتزايد بالذكاء الاصطناعي في الشرق الأوسط، إلا أن نماذج اللغة العربية تخلفت عن الركب.
ولكن، كشف فريق من الأكاديميين، والباحثين، والمهندسين في دولة الإمارات العربية المتحدة مؤخرًا عن أداة قوية مصممة خصيصًا للمتحدثين باللغة العربية في العالم، والتي يقول مبتكروها إنّها قد تمهّد الطريق لنموذج لغوي كبير (أنظمة LLM) بلغات أخرى "أقل تمثيلاً في الذكاء الاصطناعي السائد".
أُطلق على الأداة اسم "جيس" تيمنًا باسم أكبر جبل في دولة الإمارات. ويعتبرها صنّاعها النموذج اللغوي الكبير للغة العربية الأعلى جودة في العالم. Credit: Gifty Sahany/CNNوأُطلق على الأداة اسم "جيس" تيمنًا باسم أكبر جبل في دولة الإمارات، وتم إنشاؤها بالتعاون بين جامعة محمد بن زايد للذكاء الاصطناعي (MBZUAI) في أبوظبي، وشركة "Cerebras Systems"، ومقرّها "سيليكون فالي"، و"Inception" التابعة لشركة "G42" للذكاء الصناعي، ومقرها الإمارات.
ورغم أنّ "ChatGPT"، و"LLaMA" التابعة لشركة "ميتا"، وغيرها من أنظمة "LLM" تتمتع بقدرات لغوية عربية، إلا أنّها مُدرَّبة في الغالب على بيانات باللغة الإنجليزية على الإنترنت، وفقًا لما ذكره تيموثي بالدوين، عميد الجامعة بالإنابة، وأستاذ معالجة اللغات الطبيعية في جامعة محمد بن زايد للذكاء الاصطناعي.
وبدلاً من ذلك، استخدمت أداة "جيس" مجموعات البيانات باللغتين الإنجليزية والعربية، مع التركيز على المحتوى القادم من الشرق الأوسط، ما سمح لها بالذهاب لأبعد "ممّا تمكّن أي شخص آخر من تحقيقه باللغة العربية"، بحسب ما أوضحه بالدوين.
وتُهيمن اللغات التي تستخدم الحروف اللاتينية على الإنترنت، واللغة الإنجليزية هي الأكثر استخدامًا حتّى الآن.
وقال مدير التقنيات الاستراتيجية وبرامج الأمن السيبراني في معهد الشرق الأوسط بواشنطن، محمد سليمان. إن ذلك يعني أنّ مجموعات البيانات تكون أكبر بهذه اللغات.
وأضاف لـCNN أنّ "جعل الوصول إلى أدوات الذكاء الاصطناعي حكرًا على أولئك الذين يمكنهم التحدث بلغات معينة قد يمنع شريحة كبيرة من المجتمعات المحرومة من جني فوائد الذكاء الصناعي".
وتحتوي النماذج اللغوية المُدرَّبة باللغة الإنجليزية عادةّ على مجموعات من البيانات المتمحورة حول الغرب. وأوضح سليمان أن "(أنظمة LLM هذه) تفتقر إلى الوعي بالثقافات الأخرى، ما يؤثر سلبًا على تجربة المستخدم بالنسبة للأشخاص من خلفيات متنوعة".
وبفضل التدريب الذي تمتعت به، تفهم "جيس" الفروقات الثقافية، واللهجات، وفقًا لما أشارت إليه جامعة محمد بن زايد للذكاء الاصطناعي، ويتيح ذلك استخدامها على نطاق أوسع في مختلف الصناعات.
وفي الإصدارات المستقبلية، يهدف الفريق إلى جعل "جيس" تعمل مع الصور، أو الرسوم البيانية، أو جداول البيانات بدلاً من النصوص فقط، وسيؤدي ذلك إلى توسيع نطاق استخداماتها، وربما تمكينها من تفسير المسوحات الطبية، أو البيانات الاستثمارية، أو البيانات الواردة من الأقمار الصناعية.
اللهجات المختلفةوذكر بالدوين أنّ اللغة العربية هي اللغة السادسة الأكثر استخدامًا في العالم، وهي غنية بـ "مجموعة" من اللهجات المختلفة، ما يزيد من تعقيد تدريب نموذج اللغة. وتُستخدم اللغة العربية الفصحى الحديثة عادةً في الوثائق والكتابات الرسمية، ولكن غالبًا ما تُستخدم اللهجات المحلية في المدونات، أو وسائل التواصل الاجتماعي. وخلال تدريبها على مجموعة متنوعة من البيانات، أشار بالدوين إلى تمكّن "جيس" من التنقل بين اللهجات المختلفة.
وأضاف بالدوين: "هناك مجال للتحسّن بالتأكيد، ولكن جرى التركيز بشكلٍ أكبر على القوة، من حيث القدرة على فهم ما إذا كان لدينا المزيد من المدخلات غير الرسمية للنموذج".
ويسمح التحديث الأخير لـ"Bard" من "غوغل" أيضًا بفهم الأسئلة بأكثر من 12 لهجة عربية، بما في ذلك اللغة العامية المصرية، والسعودية، ومن ثم يكون الرّد باللغة العربية الفصحى الحديثة.
وقال بالدوين إنّ "جيس" تتمتّع بـ13 مليار متغير، ويجري العمل على تحديث 30 مليار متغير.
وتحدّد المتغيرات حجم نموذج اللغة، ولكن ليس بالضرورة دقتها.
وتتمتع منصة "ChatGPT-3.5" بـ175 مليار متغير تقريبًا، وفقًا لما ذكرته "OpenAI".
وقال بالدوين إنّ "جيس" تستخدم ضبط التعليمات لمنعها من إنشاء إجابات "سامة" أو "ضارة" تمامًا مثل نماذج الذكاء الاصطناعي التوليدية الأخرى.
ولن تولّد الأداة أي شيء قد يؤدي إلى إيذاء النفس، أو إلحاق الضرر بالآخرين، أو يوحي بالإدمان.
وتلتزم الإجابات التي تولدها بالقواعد والعادات المحلية بشأن مواضيع مثل المثلية الجنسية، والمخدرات.
وأجرت جامعة محمد بن زايد للذكاء الاصطناعي "حوارات مختلفة" مع حكومة الإمارات، والمؤسسات الأخرى حول الذكاء الاصطناعي المسؤول، والتي أُخِذت بعين الاعتبار عند تطوير "جيس"، وفقًا لما ذكره بالدوين.
التطورات الإقليميةشهدت دولة الإمارات العربية المتحدة جهودًا متزايدة لتطوير أنظمة الذكاء الاصطناعي التوليدية.
وكانت الإمارات أول دولة في العالم تعين وزيرًا للذكاء الاصطناعي في عام 2017.
وفي مارس/آذار، كشف مجلس أبحاث التكنولوجيا المتطورة في أبوظبي ومعهد الابتكار التكنولوجي (TII) عن أكبر نموذج للذكاء الاصطناعي في المنطقة، وهو "فالكون"، مع إصدار نسخة جديدة في سبتمبر/أيلول.
المصدر: CNN Arabic
كلمات دلالية: الذكاء الاصطناعي تكنولوجيا جامعة محمد بن زاید للذکاء الاصطناعی الذکاء الاصطناعی باللغة العربیة اللغة العربیة دولة الإمارات الاصطناعی ا فی العالم
إقرأ أيضاً:
هل تقدم الطاقة النووية حلًا لإحدى أزمات الذكاء الاصطناعي؟
دخلت كبرى الشركات التقنية في سباق محموم لتطوير تقنيات الذكاء الاصطناعي وطرح التقنية الأكثر استخدامًا، وفي خضم هذا السباق الذي يركز على هذه التقنيات والنماذج اللغوية وقدراتها المختلفة، تناسى الجميع أحد أكبر التحديات الملازمة لتقنيات الذكاء الاصطناعي.
تتمثل هذه المشكلة في استهلاك الطاقة الذي تحتاجه خوادم الذكاء الاصطناعي ومراكز البيانات التي تستضيفها، إذ تحتاج هذه المراكز إلى كم كبير من الطاقة نظرًا لتعقيد عمليات الذكاء الاصطناعي وتطور الخوادم التي تستخدمها، فضلًا عن الحاجة إلى تأدية هذه العمليات بشكل سريع للغاية ودقيق حتى تتمكن الخدمات من التنافس في هذا القطاع الشرس.
وبينما لا يمثل استهلاك الطاقة في حد ذاته تحديًا أو عائقًا أمام هذه الشركات، يمثل مصدر هذه الطاقة عائقا، إذ جرت العادة أن تعمل مراكز البيانات عبر استخدام شبكات الطاقة الكهربائية التي تعتمد بشكل أساسي على المحروقات، مما يزيد من البصمة الكربونية التي تتركها هذه الشركات وراءها.
الدور المجتمعي ورحلة خفض البصمة الكربونيةفي السنوات الماضية، شهد قطاع التقنية توجّه العديد من الشركات إلى آليات خفض البصمة الكربونية كجزء من الدور المجتمعي الذي تقوم به كل شركة عملاقة، وفي هذا السياق، قررت شركة آبل سابقًا إزالة رأس الشاحن من العلبة الخاصة بها، ثم قررت خفض حجم العلبة لتستهلك أوراقًا أقل، فضلًا عن خفض مساحة التخزين اللازمة لصندوق الهاتف، وبالتالي تحقيق أكبر قدر استفادة من حاويات الشحن وجعلها تسع عددًا أكبر من الهواتف، مما يجعلها تستهلك وقودًا أقل بنسبة كبيرة.
قررت شركة آبل جملة إجراءات تجعلها تستهلك وقودًا أقل بنسبة كبيرة (رويترز)ولا يمكن القول بأن آبل هي أول من سار في هذا الطريق، إذ سبقتها مايكروسوفت التي بدأت رحلتها في خفض البصمة الكربونية منذ عام 2012 وربما قبل ذلك عبر تبني مؤسس الشركة ومديرها التنفيذي لفترة طويلة بيل غيتس فكرة الأقراص الضوئية المضغوطة التي وفرت مساحة تخزين توازي العديد من الأوراق وحمت الأشجار من القطع، وهو الذي كان واضحًا في الصورة الشهيرة التي انتشرت له سابقًا.
وتحاول شركات أمازون وفورد وسامسونغ خفض انبعاثاتها الكربونية بشكل كبير، كل منها بطريقتها الخاصة، بدءًا من الاعتماد على مصادر طاقة صديقة للبيئة مثل مزارع الرياح لتوليد الكهرباء من الهواء أو حتى الانتقال إلى السيارات الكهربائية سواءً كان في الاستخدام أو التطوير.
تعد مايكروسوفت من كبار الداعمين لحملة التحول للأخضر والحفاظ على البيئة، ورغم ذلك، فإنها من أكبر المستثمرين في شركة "آوبن إيه آي" صاحبة أكبر نموذج ذكاء اصطناعي وأكثرهم شهرةً واستخدامًا، فضلًا عن كونه الأكثر استهلاكًا للطاقة، لذا من المتوقع أن تحاول مايكروسوفت وغيرها من المستثمرين الكبار في الذكاء الاصطناعي الوصول إلى حالة حياد كربوني في المستقبل القريب.
معدل استهلاك مرتفعيتمثل جزء من مشكلة الطاقة في تقنيات الذكاء الاصطناعي في كونها تحتاج إلى مصادر طاقة كبيرة ومستمرة لتشغيل التقنيات بكفاءة وجودة، وبحسب دراسة أجريت في جامعة كاليفورنيا، فإن "شات جي بي تي" يحتاج إلى 500 مليلتر من المياه مقابل كل 50 أمر يوجه له، وعند النظر لحجم مستخدمي "شات جي بي تي"، وفق أحدث بيانات الشركة، فإننا نجد أنهم يتجاوزون 200 مليون مستخدم أسبوعيًا.
وبحسب الدراسة، فإن هذا العدد من المستخدمين إذا وجه كحد أدنى أمرا واحدا فقط للنموذج فهو يحتاج لاستهلاك ما يعادل مليوني لتر من المياه، ويذكر أن هذا الاستهلاك هو لنموذج ذكاء اصطناعي واحد يستخدمه شخص في أمر واحد أسبوعيًا، وهو تقدير منخفض لمعدل استخدام نماذج الذكاء الاصطناعي.
وفي تقرير آخر نشره موقع "غولدمان ساكس" (Goldman Sachs) التابع للمؤسسة المالية الشهيرة، فإن استخدام "شات جي بي تي" في أمر واحد يستهلك كهرباء أكثر بـ10 أضعاف من استخدام محرك "غوغل"، لذا تتوقع المؤسسة أن هذا الاستهلاك المرتفع يزيد من حاجة مراكز البيانات إلى الطاقة بمعدل 160% بحلول عام 2030.
وفي الوقت الحالي، فإن مراكز البيانات تستهلك قرب 2% من إجمالي الطاقة المنتجة في العالم، لذا فإن مضاعفة هذا الاستهلاك تجعله يصل إلى 4% من إجمالي الطاقة المستهلكة فقط لصالح مراكز البيانات، وذلك دون النظر إلى بقية التقنيات سواءً كان تعدين العملات الرقمية أو الاستخدام المعتاد للحواسيب والتقنيات.
شركات عملاقة عاملة في الذكاء الاصطناعي توجهت إلى الطاقة النووية لتغطية احتياجات خوادمها من الطاقة (غيتي)ترى غولدمان ساكس أن الاستثمار في الذكاء الاصطناعي في المستقبل القريب لن يكون مجديًا وسيقدم تكاليف أكثر من العائد الخاص به، وذلك لأسباب عديدة في مقدمتها استهلاك الطاقة المرتفع لهذه التقنية وكلفته، لذا على الشركات حل هذا العائق قبل السعي لتطوير تقنيات الذكاء الاصطناعي بشكل أكبر.
لماذا الطاقة النووية وليس طاقة الرياح أو الطاقة الشمسية؟تحدثت التقارير مؤخرًا عن توجه الشركات التقنية العملاقة العاملة في الذكاء الاصطناعي إلى الطاقة النووية لتغطية احتياجات خوادمها من الطاقة بشكل عام، وفي مقدمة هذه الشركات جاءت غوغل، التي قررت التعاون مع شركة "كايروس باور" للطاقة النووية، وأما مايكروسوفت فقد تعاقدت مع إحدى كبرى شركات الطاقة في الولايات المتحدة وهي "كونستليشن" (Constellation) لتزويد خوادمها بالطاقة النووية، في حين قررت أمازون الاستثمار في بناء معالج نووي مصغر خاص بها بالتعاون مع شركة "دومينيون للطاقة" (Dominion Energy).
تؤكد هذه التقارير التفات شركات التقنية الكبرى والشركات العاملة في الذكاء الاصطناعي تحديدًا إلى الطاقة النووية دون بقية مصادر الطاقة الخضراء، سواءً كانت مزارع الرياح والطاقة المولدة منها أو الطاقة الشمسية أو حتى الطاقة المولدة من المياه.
يعود السبب وراء هذا التوجه إلى الطاقة النووية كونها قادرة على تغطية حاجة مراكز البيانات بشكل كامل عبر مجهود أقل كثيرًا من مصادر الطاقة المتجددة الأخرى سواءً كان في الكلفة الأساسية لبناء المحطة أو في كلفة التشغيل النهائية.
وبحسب تقرير نشره موقع "كلايمت كنترول" التابع لمعهد ماساشوستس للتكنولوجيا، فإن استبدال مصانع الطاقة النووية المتوسطة الحجم القادرة على توليد وتخزين 900 ميغاواط من الطاقة يحتاج إلى مزرعة رياح مكونة من 800 توربينات رياح متوسطة الحجم.
وهذا بمفرده يفسر سبب توجه العديد من الشركات إلى الطاقة النووية مثل مايكروسوفت التي تملك مزارع رياح عديدة وتستخدمها بالفعل في بعض مراكزها، ويتكرر السيناريو ذاته في جميع مصادر الطاقة المتجددة سواءً كانت مياها أو شمسية أو غازا طبيعيا.
بالطبع، لا تأتي مفاعلات الطاقة النووية دون التحديات الخاصة بها، إذ تتطلب هذه المفاعلات آليات حماية خاصة وإدارة خاصة من أجل خفض فرص الانفجار والتسرب الإشعاعي في المنطقة المحيطة بها، ولكن يمكن القول إن معدلات هذه التسريبات قد انخفضت بفضل تطور التقنية وآليات السلامة المستخدمة في المفاعلات النووية.