الحرة:
2024-06-30@01:43:12 GMT

العربية.. هل لغة الضاد عصية على الذكاء الاصطناعي؟

تاريخ النشر: 19th, December 2023 GMT

العربية.. هل لغة الضاد عصية على الذكاء الاصطناعي؟

تعدّ اللغة العربية واحدة من أكثر اللغات شيوعا في العالم، مع أكثر من 400 مليون ناطق بها في أرجاء المعمورة، لكن لا تتوفر الكثير من التكنولوجيا التي تضعها باستخدام الذكاء الاصطناعي بشكل مواز، مقارنة مثلا باللغة الإنكليزية.

وخلص بحث في جامعة كورنويل، على تقييم شامل لبرنامج ChatGPT في البرمجة اللغوية العصبية العربية (يحمل توقيع محمد توكت، إسلام خوندكر عبد الواحد، المعتز بالله نقودي، ومحمد عبد المجيد) إلى أنه على الرغم من الأداء الممتاز لـ ChatGPT الذي يبشر بتحول في البرمجة اللغوية العصبية، لكن ما تزال فعالية النموذج عبر سياقات لغوية متنوعة، مجهولة إلى حد كبير.

وتشير نتائج البحث الذي يشمل 44 مهمة مختلفة لفهم اللغة وإنشائها في أكثر من 60 مجموعة بيانات مختلفة، إلى "تجاوز نماذج أصغر خضعت للتحسين في اللغة العربية الذكاء الاصطناعي (ممثلا بـ ChatGPT في سياق البحث) باستمرار، كما تكشف مقارنة دقيقة بين اللغة العربية الفصحى الحديثة، واللهجة العربية في ChatGPT وGPT-4، عن أوجه القصور النسبية لكلا النموذجين في التعامل مع اللهجات العربية مقارنة بالعربية الفصحى". فكيف هو الواقع وما هي الآفاق؟

"ارفع صوتك" سأل خبراء تكنولوجيا المعلومات ومواقع التواصل، للنظر في السيناريوهات المحتملة.

لغة معقدة وصعوبة الترميز

وتضع اللغة العربية بما تتميز به من تعقيدات، الذكاء الاصطناعي أمام عدد من التحديات، ويتحدث عن ذلك الخبير في تكنولوجيا المعلوماتية ومواقع التواصل عمر قصقص قائلاً إن "أدوات الذكاء الاصطناعي، قادرة على التطور بفضل التدريب وفي حالة اللغة العربية، تكمن العقدة في عدم التدريب الكافي".

ويضيف: "حتى الساعة يبدو أن ذلك قد حصل، لكن ليس بالقدر الكافي أو الموازي للغات الأخرى، كالإنجليزية والإسبانية مثلاً، خصوصا بسبب الأبعاد الأدبية وعلامات التشكيل والترميز".

ويعدّ التشكيل من أكثر الأشياء التي تتميز بها العربية، وعلامات التشكيل كناية عن تلك الرموز الصغيرة التي تضاف إلى الحروف، أي الحركات. وتحدد الحركات طريقة لفظ ومعنى المفردات، وهي قادرة على تغيير طريقة فهم الكلام.

وبالتالي، بغياب التشكيل، قد يقع القارئ في نوع من الغموض، ومن الأمثلة على ذلك "كَتَبَ" و"كُتِبَ" التي تُغير الصيغة من المعلوم إلى المجهول. أما بالنسبة للترميز أو ما يعرف بـ Tokenization، يعتمد الذكاء الاصطناعي على تقسيم سلسلة من النصوص أو الكلام، إلى وحدات يمكن تحديدها، وفي حال لم تتوفر المعلومات الكافية كما يضيف قصقص، يلجأ لاصطناع الشكل المطلوب (بنية مقال مثلا)، لكن مع الوقوع في التكرار بسبب نقص المعلومات.

الدول العربية والذكاء الاصطناعي.. "تأخر عن الركب" وجهود "تتباين من بلد إلى آخر" في وقت يشهد فيه مجال الذكاء الاصطناعي بالعالم تطورات متسارعة، اليوم بعد الآخر، ما يزال تطوير الخوارزميات والبرامج المرتبطة بالمجال بمعظم بلدان المنطقة العربية يسير بـ"خطوات متثاقلة"، وفقا لخبراء وبيانات المؤسسات المتخصصة في هذه التكنولوجيا.

كما أن التصريفات تشكل عائقا جديدا، حيث يختلف نظام اللغة العربية عن الإنكليزية وسواها والأمثلة كثيرة، ففي اللغتين الفرنسية والإنكليزية، يستخدم المفرد والجمع بينما تنفرد اللغة العربية بالمثنى في كلمة واحدة فيقال مثلا: "نظام، نظامان، أنظمة" في ثلاث كلمات مختلفة تشير الإضافات فيها للعدد، بينما في الإنكليزية (system, systems)، وللمثنى يضاف العدد 2.

عدا عن ذلك، تمرّ المعلومات التي تنقلها أدوات الذكاء الاصطناعي عبر قنوات الترجمة، الأمر الذي قد يشكل عائقا آخر.

يبيّن قصقص: "لم تكن لنا على الدوام تجارب عظيمة على مستوى الترجمة، خصوصا وأن محركات البحث أو الأدوات المستخدمة فيها، غالبا ما تنقل الكلمات بشكل حرفي من لغة إلى أخرى، دون إيصال المعنى العام، وهذا الأمر يعني الوقوع في الخطأ، خصوصا على مستوى الأمثال الشعبية مثلا، والعبارات المجازية بشكل عام".

قابلنا الدكتور محمد ضاهر، الأستاذ الجامعي المحاضر في جامعة بيروت العربية، الباحث في مجال الذكاء الاصطناعي والأمن السيبراني ومشروع التوأمة الرقمية للسيارات ذاتية القيادة مع مختبرات Cristal  بجامعة ليل الفرنسية.

المؤشر العالمي للذكاء الاصطناعي.. ما ترتيب الدول العربية؟ أصدر موقع "تورتواز ميديا" لعام 2023، المؤشر العالمي للذكاء الاصطناعي الذي يصنف فيه 62 دولة حسب قدراتها في هذا المجال الذي حقق هذا العام قفزة هائلة إلى الأمام. 

يقول لـ"ارفع صوتك" إن "الفكرة تكمن دائما في كمية المعلومات المتوفرة، وإذا ما أخذنا على سبيل المثال محرك البحث (غوغل)، نلاحظ أن المصادر الموجودة باللغة الإنجليزية تفوق ٩٠٪ من مجموعة المصادر في العالم، وبالتالي هذا ما يفسر امتلاكه للكثير من الإجابات والمراجع والأرشيف الغني حول أي موضوع".

ويضيف: "هذا ما يفسر أيضا الدقة والسرعة في منح الإجابات المفصلة. أما في حالة اللغة العربية، غالبا ما تكون المراجع قليلة، والأمر شبيه بالبحث عن معلومة في كتب باللغة العربية، ولكن العائق هو عدم توفر الكثير من الكتب، فنضطر للبحث أكثر ومن الممكن أن نجد المعلومة أو العكس، أو قد نقع على معلومات غير موسعة، وهذا ما يؤثر على عناصر أخرى كالدقة في المعلومات وسرعة التسليم وسواها".

ويتابع ظاهر: "يعود ذلك إلى عدة أسباب أبرزها، كمية البيانات المتاحة للتدريب على اللغة العربية مقارنة بالإنجليزية. موديل اللغة دُرِب أساسًا بشكل رئيسي على اللغة الإنجليزية، وقد يقدم أداء أفضل في فهم وإنتاج النصوص بالإنجليزية. بالإضافة إلى ذلك، يمكن أن يؤدي نقص البيانات إلى انحياز في تطوير الذكاء الاصطناعي نحو اللغات التي تمتلك كميات أكبر من البيانات".

المشهد المستقبلي

ولكن على الرغم من التحديات، يبدو أن الأدوات المتاحة تفتح آفاقا واعدة، حيث تعكف مؤسسات كبيرة على تصميم نماذج لغوية كبيرة، ومن الأمثلة على ذلك مركز "Inception" الذي أطلق في أكتوبر 2023 أداة "جيس" في الإمارات، والتي أنشئت بالتعاون بين جامعة محمد بن زايد للذكاء الاصطناعي (MBZUAI) في أبوظبي، وشركة "Cerebras Systems"، ومقرّها "سيليكون فالي".

ويتضمن النموذج تدريبا على 13 مليار لمجموعة بيانات فريدة مكونة من 116 مليار رمز عربي، مصمم لالتقاط التعقيد والفروق الدقيقة وثراء اللغة العربية، بالإضافة إلى 279 مليار رمز للكلمات الإنجليزية، بهدف مضاعفة فعالية النموذج من خلال النقل بين اللغات.

يرى قصقص أن "هذا النموذج واعد لناحية الدمج في تطبيقات تولد الردود باللغة العربية من ضمن لغات أخرى، بالإضافة إلى التفاعل على مستوى النصائح والتوصيات والترجمات وسواها من الخدمات التي يقدمها الذكاء الاصطناعي". 

من جهته يدعو الدكتور ظاهر، الناطقين باللغة العربية من باحثين وداعمين لإثراء المراجع والمعلومات المتاحة على الشبكة باللغة العربية.

ويختم قائلا: "لا بد من التشجيع على البحث والابتكار. يمكن أن تحفز زيادة البيانات باللغة العربية الباحثين والمبتكرين في المنطقة على تطوير حلول جديدة وابتكارات في مجال الذكاء الاصطناعي، مما يعزز التقدم التكنولوجي على أمل أن يسمح ذلك بالاستعاضة عن عدم المشاركة في التطوير بالمشاركة في التدريب".

المصدر: الحرة

كلمات دلالية: الذکاء الاصطناعی باللغة العربیة اللغة العربیة

إقرأ أيضاً:

جامعة محمد بن زايد للذكاء الاصطناعي تستقبل 45 طالبا في برنامج التدريب البحثي

استقبلت جامعة محمد بن زايد للذكاء الاصطناعي في أبوظبي، 45 طالباً جامعياً في مجالات العلوم والتكنولوجيا والهندسة والرياضيات من جميع أنحاء العالم.

يأتي ذلك في إطار برنامج التدريب البحثي الذي امتد لشهر، واطلع الطلاب خلاله على آخر أبحاث الذكاء الاصطناعي وتدربوا على يد أعضاء هيئة تدريسية عالمية المستوى.

وتم اختيار المرشحين بناءً على معايير صارمة، لينضموا إلى المجموعة الثانية من المشاركين في برنامج التدريب البحثي للطلاب الجامعيين الذي يمتد لمدة أربعة أسابيع والمخصص للطلاب الجامعيين المتميزين، ويهدف إلى تطوير معارفهم ومهاراتهم في البحث العملي في مجال الذكاء الاصطناعي.

ونظراً لسمعة الجامعة المتنامية بصفتها مركزاً عالمياً رائداً للأبحاث النوعية في مجال الذكاء الاصطناعي يقوم بنشر أوراق بحثية في أبرز المؤتمرات العالمية، جذب هذا البرنامج التدريبي مشاركين من الإمارات العربية المتحدة والولايات المتحدة وكندا وأستراليا وكولومبيا وفيتنام والهند ومصر وجمهورية كوريا وكازاخستان.

والتحق بالبرنامج العديد من الباحثين الطموحين من جامعات عالمية رائدة في علم الحاسوب، مثل المعهد الهندي للتكنولوجيا في مدراس، وجامعة هارفارد، وجامعة ييل، وجامعة جونز هوبكنز، والجامعة البابوية الكاثوليكية في تشيلي، وجامعة مدينة هوشي منه الوطنية في فيتنام، والجامعة الوطنية الأسترالية.

وقال البروفيسور تيموثي بالدوين، عميد جامعة محمد بن زايد للذكاء الاصطناعي، إن مهمة الجامعة تقوم على أسس متعددة من أهمها التعرّف إلى مواهب الجيل القادم من المبدعين والقادة في مجال الذكاء الاصطناعي ورعايتهم ، ويسلط النمو في حجم المشاركة الذي حققه البرنامج التدريبي بنسبة 32 في المائة في عامه الثاني فقط الضوء على المكانة الراسخة للجامعة عالميا، وأهمية دولة الإمارات كمركز عالمي للدراسات العليا.

وأوضح أن البرنامج أتاح للطلاب الجامعيين فرصة فريدة للعمل مع أعضاء الهيئة التدريسية للجامعة والذين يتمتعون بمكانة رائدة عالمياً، وذلك في أبحاث ذكاء اصطناعي مرتبطة بقصايا راهنة ذات أثر عالمي وفي مجالات تشمل الصحة، والمعلوماتية الحيوية، والروبوتات، واستخدام النماذج اللغوية الكبيرة للكشف عن النصوص المعدّة باستخدام الآلات.

وقام المشاركون في البرنامج التدريبي بالاختيار من مجموعة واسعة من المشاريع البحثية في مجال الذكاء الاصطناعي وذلك بناءً على اهتماماتهم الشخصية وتطلعاتهم الأكاديمية والمهنية.

وشملت المشاريع تطوير نموذج أولي للرعاية الصحية الرقمية قائم على عالم الميتافيرس ويسهم في تحسين دقة وقوة نماذج تحليل بكاء الأطفال باستخدام الذكاء الاصطناعي؛ والتقييم المنهجي لقابلية تعميم النماذج اللغوية الكبيرة في العديد من اللغات والمهام.

وفي هذا السياق، قال الطالب الزائر بن لامبرايت الذي يدرس اللسانيات الحاسوبية واللغة العربية في جامعة براندايس في الولايات المتحدة الأمريكية: “لقد انضممتُ إلى البرنامج لأنني أرغب بدراسة اللغة العربية والذكاء الاصطناعي، فأنا مهتم بالاطلاع أكثر على النماذج متعددة الوسائط بالعربية والإنجليزية، لذا فقد أتاح لي هذا البرنامج التعمق في هذا المجال والتعاون مع مجموعة من الباحثين من حول العالم”.

كما شارك المتدربون في تحدي تقسيم أورام المخ الذي شهد استخدام تقنيات الرؤية الحاسوبية للكشف عن الأورام في الصور الطبية، وأتيحت لهم الفرصة للمشاركة في جلسة حوارية حول القطاع والتي ناقشت الذكاء الاصطناعي وسوق العمل في دولة الإمارات.

وبالتزامن مع استكمال أبحاثهم والمشاركة في النقاشات مع أعضاء الهيئة التدريسية في الجامعة، اطّلع المتدربون على تاريخ دولة الإمارات وثقافتها الغنية عبر زيارة الوجهات الرئيسية في أبوظبي، مثل جامع الشيخ زايد الكبير وقصر الحصن وبيت العائلة الإبراهيمية، وذلك في زيارات تم تنظيمها بالتعاون مع مكتب أبوظبي للمقيمين ودائرة الثقافة والسياحة- أبوظبي.وام


مقالات مشابهة

  • اتحاد إذاعات الدول العربية ينظم ندوات حول صناعة المحتوى والميديا عن طريق الذكاء الاصطناعي
  • الأكاديمية العربية للعلوم تنظم ورشة عمل حول “ أخلاقيات استخدام الذكاء الاصطناعي”
  • الخبراء العرب والدوليين يتحاورون بشأن تعزيز الوعي بأخلاقيات استخدام الذكاء الاصطناعي
  • Lenovo تعلن عن حاسب متطور يعمل مع الذكاء الاصطناعي
  • 45 طالباً في برنامج تدريبي بجامعة محمد بن زايد للذكاء الاصطناعي
  • جامعة محمد بن زايد للذكاء الاصطناعي تستقبل 45 طالباً في برنامج التدريب البحثي
  • روسيا.. العثور على مخطوطة باللغتين العربية واليونانية تعود إلى القرن الـ15
  • محمد بن زايد للذكاء الاصطناعي تستقبل 45 طالباً في برنامج التدريب البحثي
  • هل اقترب عصر الذكاء الاصطناعي الواعي؟
  • جامعة محمد بن زايد للذكاء الاصطناعي تستقبل 45 طالبا في برنامج التدريب البحثي