الإمارات تقود جهود تطوير نماذج اللغات الكبيرة في المنطقة
تاريخ النشر: 16th, September 2024 GMT
تتصدر دولة الإمارات إقليمياً في الاستفادة من الذكاء الاصطناعي والتوليدي باعتباره أحد المكونات الرئيسية للثورة الصناعية الرابعة وترسيخ أقدامها كوجهة للشركات العالمية والإقليمية العاملة في هذا المجال الحيوي.
ودخلت دولة الإمارات مجال تطوير نماذج اللغات الكبيرة مفتوحة المصدر، ضمن خططها الطموحة لتعظيم الاستفادة من الذكاء الاصطناعي التوليدي، وفي سياق مسيرتها لترسيخ الاقتصاد المعرفي وتطوير أنظمة اقتصادية جديدة تواكب المستقبل وذلك وفقاً لورقة بحثية جديدة أعدها ” انترريجونال للتحليلات الاستراتيجية” ومقره أبوظبي.
وبحسب “البوابة الرسمية لحكومة دولة الإمارات”، تعد النماذج اللغوية الكبيرة مفتوحة المصدر مثل (Large language model) و (LLMs) أحد أنواع نماذج الذكاء الاصطناعي التي يتم تدريبها على كميات هائلة من النصوص كي تتعلم الأنماط والقواعد والسياقات والدلالات في اللغة كما تستخدم مسرعات لمعالجة البيانات النصية الضخمة لفهم اللغة البشرية ومحاكاتها.
جهود كبيرة
وأشار “انترريجونال” إلى الجهود الكبيرة التي أطلقتها دولة الإمارات ممثلة في العديد من الجهات الحكومية حيث قال عمر العلماء زير دولة الإمارات للذكاء الاصطناعي والاقتصاد الرقمي وتطبيقات العمل عن بعد في تصريح سابق لصحيفة “فايننشال تايمز”: إن الصفقة التي وقعت بين مايكروسوفت للاستحواذ على حصة بـ 1.5 مليار دولار في G42، شركة الذكاء الاصطناعي في أبوظبي، مجرد بداية لتعاون تقني أكبر بين الإمارات والولايات المتحدة الأمريكية.
وذكرت “فايننشال تايمز” أن أبوظبي ستستثمر بكثافة في مشاريع الذكاء الاصطناعي في الخارج حيث استقطبت قادة الصناعة مثل: سام ألتمان في شركة “أوبن إيه آي” وجنسن هوانغ في ” إنفيديا” .
وفي السياق، أطلقت جامعة محمد بن زايد للذكاء الاصطناعي نماذج: «بايميدكس»، و«بالو» و«جلام إم»، و«جيوتشات»، و«موبايل لاما» كنماذج لغوية صغيرة وكبيرة متعددة الوسائط تستخدم التعلّم متعدد الوسائط لمعالجة البيانات وتحليلها من وسائط أو مصادر متعددة تتخطى حدود النصوص لتشمل المقاطع الصوتية والصور، مع التركيز بشكل خاص على قدرات هذه النماذج في اللغة العربية.
“معهد الابتكار التكنولوجي”
ويتيح معهد الابتكار التكنولوجي التابع لـ “مجلس أبحاث التكنولوجيا المتطورة” لحكومة أبوظبي، نموذج الذكاء الاصطناعي مفتوح المصدر (فالكون 40 بي) للاستخدامات البحثية والتجارية والذي يشمل 40 مليار عامل متغير، وهو مدرَّب على تريليون رمز(token)، موفِّراً بذلك إمكانية وصول إلى قدرات متكاملة غير مسبوقة أمام الباحثين والمبتكرين والمؤسسات الصغيرة والمتوسطة.
وأعلن معهد الابتكار التكنولوجي عن إطلاق أول منصة متميزة للنماذج اللغوية العربية الكبيرة، وذلك بالتعاون مع منصة “Hugging Face” تحت اسم (OALL) تهدف إلى إنشاء منصة مكرسة لتقييم ومقارنة أداء النماذج اللغوية الكبيرة الخاصة باللغة العربية.
مجموعة ” G42″
وقال مركز ” انترريجونال”: إن مجموعة ” G42″ التي أنشئت في أبوظبي تعد أبرز شركات التكنولوجية الإماراتية الرائدة عالمياً في إنشاء وتطوير تقنيّات الذكاء الاصطناعي والتي أعلنت مؤخراً عن عزمها إطلاق نموذج “ناندا” “NANDA ” كأحدث نموذج لغة كبير للغة الهندية يتكون من 13 مليار بارامتر، والذي دُرِّب على قاعدة بيانات تضم ما يقرب 2.13 تريليون وحدة لغوية، بما في ذلك اللغة الهندية.
وقالت “جي 42”: إن إطلاق نموذج “ناندا” يأتي نتيجة التعاون بين “إنسبشن”، التابعة للمجموعة وجامعة محمد بن زايد للذكاء الاصطناعي شركة وسيريبراس سيستمز.
وكانت “جي42” قد أطلقت في أغسطس 2023 نموذج “جيس” أول نموذج لغة كبير مفتوح المصدر ليوفر حلول معالجة اللغة الطبيعية القائمة على العربية، وفتح المجال للوصول إلى قدرات الذكاء الاصطناعي التوليدي للغة الأم لأكثر من 400 مليون من المتحدثين باللغة العربية على مستوى العالم.
ما هي “نماذج اللغات الكبيرة”؟
واستعرضت ورقة “انترريجونال” تعريف العديد من الشركات التقنية والأكاديميات العلمية لمفهوم “نماذج اللغات الكبيرة” المعتمدة على تقنيات الذكاء الاصطناعي حيث ذكرت شركة “Shaip ” العالمية أن نماذج اللغات الكبيرة تعد بمثابة أنظمة ذكاء اصطناعي (AI) متقدمة مصممة لمعالجة وفهم وإنشاء نص يشبه الإنسان استناداً إلى تقنيات التعلم العميق المدربة على مجموعات بيانات ضخمة.
وبحسب موسوعة “ويكيبيديا” فإن النموذج اللغوي الكبير هو نوع من نماذج اللغة يتميز بقدرته على فهم وتوليد اللغة للأغراض العامة باستخدام كم هائل من المعطيات.
ووفقاً لشركة “أمازون ويب سيرفيسز (AWS” العالمية، تعرف نماذج اللغة الكبيرة بكونها نماذج تعليم عميق كبيرة جدًا مدرَّبة مسبقًا على كميات هائلة من البيانات قادرة على التدريب والتعلم الذاتي وتتوفر العديد من التطبيقات العملية لنماذج اللغات الكبيرة مثل: كتابة المحتوى باستثناء GPT-3 وChatGPT، فيما يمكن لنماذج: Claude وLlama 2 وCohere Command وJurassiccan كتابة محتوى أصلي، فيما يقترح نموذج AI21 Wordspice إجراء تغييرات على الجُمل الأصلية لتحسين الأسلوب والصياغة.
المصدر: جريدة الوطن
كلمات دلالية: الذکاء الاصطناعی دولة الإمارات
إقرأ أيضاً:
من بينها العربية.. غوغل تدعم 45 لغة جديدة بـGemini
أعلنت شركة غوغل أن ميزة البحث المتعمق المعروفة باسم "Deep Research"، ضمن مساعدها "Gemini" القائم على الذكاء الاصطناعي، أصبحت متاحة بأكثر من 45 لغة، بما في ذلك اللغة العربية، وفي أكثر من 150 دولة، وذلك خلال الأسابيع المقبلة.
وكانت غوغل قد أطلقت هذه الميزة في وقت سابق من هذا الشهر، مما يتيح لمستخدمي خطة Google One AI المميزة والمدفوعة، الاستفادة من مزايا أداة البحث المدعومة بالذكاء الاصطناعي، وفقاً لموقع "تك كرانش".
وتسمح ميزة "البحث المتعمق" لمستخدمي "Gemini Advanced" بإنشاء تقارير بحث شاملة مليئة بالمصادر والمراجع، كما تقول غوغل: "مع البحث المتعمق، يمكنك إنشاء تقارير بحث معمقة حول مواضيع معقدة، مع روابط للمصادر، مما يوفر لك ساعات من البحث في دقائق فقط".
Deep Research is now available in 45+ languages and more than 150 countries with Gemini Advanced → https://t.co/cmetnUF0Ls ???? https://t.co/nzwUWhyVxs
— Google Gemini App (@GeminiApp) December 20, 2024ويمكن للمستخدمين طلب توضيحات إضافية حول بعض النقاط أو تعديل التقرير، مع إمكانية تصديره إلى مستندات جوجل في ملف نصي.
وتتضمن اللغات المدعومة من Gemini العربية، والبنغالية، والصينية، والدانماركية، والفرنسية، والألمانية، والغوجاراتية، والهندية، والإندونيسية، والإيطالية، واليابانية، والكانادا، والكورية، والمالايالامية، والماراثية، والبولندية، والبرتغالية، والسواحيلية، والإسبانية، والتاميلية، والتيلوغو، والثنية، والأوكرانية، والأردية.
ويعد التحدي الذي يواجه غوغل هو العثور على مصادر موثوقة بلغة معينة، ثم تلخيصها باللغة الأم دون التسبب في أخطاء لغوية.
وتأتي هذه التحسينات في إطار جهود غوغل المستمرة لتعزيز دقة وأداء Gemini على الصعيد العالمي، مع التركيز على تقديم تجربة بحث مدعومة بالذكاء الاصطناعي، تلبي احتياجات المستخدمين عبر مختلف اللغات.
وعلى سبيل المثال، قدمت غوغل مؤخراً، "Gemini 2.0 Flash"، الذي يقدم إخراجاً أصليا للصوت والصورة، بالإضافة إلى تميزه بسرعته، بجانب "Veo 2"، وهي أداة متقدمة لتوليد فيديوهات عالية الجودة بدقة تصل إلى 4K باستخدام الذكاء الاصطناعي.