الحرة:
2025-04-26@16:24:07 GMT

العربية.. هل لغة الضاد عصية على الذكاء الاصطناعي؟

تاريخ النشر: 19th, December 2023 GMT

العربية.. هل لغة الضاد عصية على الذكاء الاصطناعي؟

تعدّ اللغة العربية واحدة من أكثر اللغات شيوعا في العالم، مع أكثر من 400 مليون ناطق بها في أرجاء المعمورة، لكن لا تتوفر الكثير من التكنولوجيا التي تضعها باستخدام الذكاء الاصطناعي بشكل مواز، مقارنة مثلا باللغة الإنكليزية.

وخلص بحث في جامعة كورنويل، على تقييم شامل لبرنامج ChatGPT في البرمجة اللغوية العصبية العربية (يحمل توقيع محمد توكت، إسلام خوندكر عبد الواحد، المعتز بالله نقودي، ومحمد عبد المجيد) إلى أنه على الرغم من الأداء الممتاز لـ ChatGPT الذي يبشر بتحول في البرمجة اللغوية العصبية، لكن ما تزال فعالية النموذج عبر سياقات لغوية متنوعة، مجهولة إلى حد كبير.

وتشير نتائج البحث الذي يشمل 44 مهمة مختلفة لفهم اللغة وإنشائها في أكثر من 60 مجموعة بيانات مختلفة، إلى "تجاوز نماذج أصغر خضعت للتحسين في اللغة العربية الذكاء الاصطناعي (ممثلا بـ ChatGPT في سياق البحث) باستمرار، كما تكشف مقارنة دقيقة بين اللغة العربية الفصحى الحديثة، واللهجة العربية في ChatGPT وGPT-4، عن أوجه القصور النسبية لكلا النموذجين في التعامل مع اللهجات العربية مقارنة بالعربية الفصحى". فكيف هو الواقع وما هي الآفاق؟

"ارفع صوتك" سأل خبراء تكنولوجيا المعلومات ومواقع التواصل، للنظر في السيناريوهات المحتملة.

لغة معقدة وصعوبة الترميز

وتضع اللغة العربية بما تتميز به من تعقيدات، الذكاء الاصطناعي أمام عدد من التحديات، ويتحدث عن ذلك الخبير في تكنولوجيا المعلوماتية ومواقع التواصل عمر قصقص قائلاً إن "أدوات الذكاء الاصطناعي، قادرة على التطور بفضل التدريب وفي حالة اللغة العربية، تكمن العقدة في عدم التدريب الكافي".

ويضيف: "حتى الساعة يبدو أن ذلك قد حصل، لكن ليس بالقدر الكافي أو الموازي للغات الأخرى، كالإنجليزية والإسبانية مثلاً، خصوصا بسبب الأبعاد الأدبية وعلامات التشكيل والترميز".

ويعدّ التشكيل من أكثر الأشياء التي تتميز بها العربية، وعلامات التشكيل كناية عن تلك الرموز الصغيرة التي تضاف إلى الحروف، أي الحركات. وتحدد الحركات طريقة لفظ ومعنى المفردات، وهي قادرة على تغيير طريقة فهم الكلام.

وبالتالي، بغياب التشكيل، قد يقع القارئ في نوع من الغموض، ومن الأمثلة على ذلك "كَتَبَ" و"كُتِبَ" التي تُغير الصيغة من المعلوم إلى المجهول. أما بالنسبة للترميز أو ما يعرف بـ Tokenization، يعتمد الذكاء الاصطناعي على تقسيم سلسلة من النصوص أو الكلام، إلى وحدات يمكن تحديدها، وفي حال لم تتوفر المعلومات الكافية كما يضيف قصقص، يلجأ لاصطناع الشكل المطلوب (بنية مقال مثلا)، لكن مع الوقوع في التكرار بسبب نقص المعلومات.

الدول العربية والذكاء الاصطناعي.. "تأخر عن الركب" وجهود "تتباين من بلد إلى آخر" في وقت يشهد فيه مجال الذكاء الاصطناعي بالعالم تطورات متسارعة، اليوم بعد الآخر، ما يزال تطوير الخوارزميات والبرامج المرتبطة بالمجال بمعظم بلدان المنطقة العربية يسير بـ"خطوات متثاقلة"، وفقا لخبراء وبيانات المؤسسات المتخصصة في هذه التكنولوجيا.

كما أن التصريفات تشكل عائقا جديدا، حيث يختلف نظام اللغة العربية عن الإنكليزية وسواها والأمثلة كثيرة، ففي اللغتين الفرنسية والإنكليزية، يستخدم المفرد والجمع بينما تنفرد اللغة العربية بالمثنى في كلمة واحدة فيقال مثلا: "نظام، نظامان، أنظمة" في ثلاث كلمات مختلفة تشير الإضافات فيها للعدد، بينما في الإنكليزية (system, systems)، وللمثنى يضاف العدد 2.

عدا عن ذلك، تمرّ المعلومات التي تنقلها أدوات الذكاء الاصطناعي عبر قنوات الترجمة، الأمر الذي قد يشكل عائقا آخر.

يبيّن قصقص: "لم تكن لنا على الدوام تجارب عظيمة على مستوى الترجمة، خصوصا وأن محركات البحث أو الأدوات المستخدمة فيها، غالبا ما تنقل الكلمات بشكل حرفي من لغة إلى أخرى، دون إيصال المعنى العام، وهذا الأمر يعني الوقوع في الخطأ، خصوصا على مستوى الأمثال الشعبية مثلا، والعبارات المجازية بشكل عام".

قابلنا الدكتور محمد ضاهر، الأستاذ الجامعي المحاضر في جامعة بيروت العربية، الباحث في مجال الذكاء الاصطناعي والأمن السيبراني ومشروع التوأمة الرقمية للسيارات ذاتية القيادة مع مختبرات Cristal  بجامعة ليل الفرنسية.

المؤشر العالمي للذكاء الاصطناعي.. ما ترتيب الدول العربية؟ أصدر موقع "تورتواز ميديا" لعام 2023، المؤشر العالمي للذكاء الاصطناعي الذي يصنف فيه 62 دولة حسب قدراتها في هذا المجال الذي حقق هذا العام قفزة هائلة إلى الأمام. 

يقول لـ"ارفع صوتك" إن "الفكرة تكمن دائما في كمية المعلومات المتوفرة، وإذا ما أخذنا على سبيل المثال محرك البحث (غوغل)، نلاحظ أن المصادر الموجودة باللغة الإنجليزية تفوق ٩٠٪ من مجموعة المصادر في العالم، وبالتالي هذا ما يفسر امتلاكه للكثير من الإجابات والمراجع والأرشيف الغني حول أي موضوع".

ويضيف: "هذا ما يفسر أيضا الدقة والسرعة في منح الإجابات المفصلة. أما في حالة اللغة العربية، غالبا ما تكون المراجع قليلة، والأمر شبيه بالبحث عن معلومة في كتب باللغة العربية، ولكن العائق هو عدم توفر الكثير من الكتب، فنضطر للبحث أكثر ومن الممكن أن نجد المعلومة أو العكس، أو قد نقع على معلومات غير موسعة، وهذا ما يؤثر على عناصر أخرى كالدقة في المعلومات وسرعة التسليم وسواها".

ويتابع ظاهر: "يعود ذلك إلى عدة أسباب أبرزها، كمية البيانات المتاحة للتدريب على اللغة العربية مقارنة بالإنجليزية. موديل اللغة دُرِب أساسًا بشكل رئيسي على اللغة الإنجليزية، وقد يقدم أداء أفضل في فهم وإنتاج النصوص بالإنجليزية. بالإضافة إلى ذلك، يمكن أن يؤدي نقص البيانات إلى انحياز في تطوير الذكاء الاصطناعي نحو اللغات التي تمتلك كميات أكبر من البيانات".

المشهد المستقبلي

ولكن على الرغم من التحديات، يبدو أن الأدوات المتاحة تفتح آفاقا واعدة، حيث تعكف مؤسسات كبيرة على تصميم نماذج لغوية كبيرة، ومن الأمثلة على ذلك مركز "Inception" الذي أطلق في أكتوبر 2023 أداة "جيس" في الإمارات، والتي أنشئت بالتعاون بين جامعة محمد بن زايد للذكاء الاصطناعي (MBZUAI) في أبوظبي، وشركة "Cerebras Systems"، ومقرّها "سيليكون فالي".

ويتضمن النموذج تدريبا على 13 مليار لمجموعة بيانات فريدة مكونة من 116 مليار رمز عربي، مصمم لالتقاط التعقيد والفروق الدقيقة وثراء اللغة العربية، بالإضافة إلى 279 مليار رمز للكلمات الإنجليزية، بهدف مضاعفة فعالية النموذج من خلال النقل بين اللغات.

يرى قصقص أن "هذا النموذج واعد لناحية الدمج في تطبيقات تولد الردود باللغة العربية من ضمن لغات أخرى، بالإضافة إلى التفاعل على مستوى النصائح والتوصيات والترجمات وسواها من الخدمات التي يقدمها الذكاء الاصطناعي". 

من جهته يدعو الدكتور ظاهر، الناطقين باللغة العربية من باحثين وداعمين لإثراء المراجع والمعلومات المتاحة على الشبكة باللغة العربية.

ويختم قائلا: "لا بد من التشجيع على البحث والابتكار. يمكن أن تحفز زيادة البيانات باللغة العربية الباحثين والمبتكرين في المنطقة على تطوير حلول جديدة وابتكارات في مجال الذكاء الاصطناعي، مما يعزز التقدم التكنولوجي على أمل أن يسمح ذلك بالاستعاضة عن عدم المشاركة في التطوير بالمشاركة في التدريب".

المصدر: الحرة

كلمات دلالية: الذکاء الاصطناعی باللغة العربیة اللغة العربیة

إقرأ أيضاً:

بتشويه «فوضى الذكاء الاصطناعي» للواقع يمضي العالم إلى كارثة

تهيمن قناتان متوازيتان للصور على استهلاكنا البصري اليومي. في إحداهما، صور ولقطات حقيقية للعالم كما نعرفه، ففيها سياسة ورياضة وأخبار وترفيه. وفي الثانية، فوضى الذكاء الاصطناعي [أو ما يعرف بـ AI slop]، بمحتوى متواضع الجودة ليس فيه من الإسهام البشري إلا الحد الأدنى. بعض ما فيه تافه الشأن عديم المعنى، لا يعدو صورا كرتونية لمشاهير، ومناظر طبيعية خيالية، وحيوانات ذات سمات بشرية. وبعضه الآخر عرض خادش للحياء...ففيه تجد حبيبات افتراضيات لا يمكن أن تتفاعل معهن تفاعلا حقيقيا. ونطاق هذا المحتوى وحجمه مذهلان، فهو يتسرب إلى كل شيء، من صفحات التواصل الاجتماعي إلى الرسائل المتداولة على واتساب. فلا تكون النتيجة محض تشويش على الواقع، وإنما هي تشويه له.

وفي فوضى الذكاء الاصطناعي شيء جديد هو الخيال السياسي اليميني. فعلى موقع يوتيوب مقاطع فيديو كاملة ذات سيناريوهات مختلقة ينتصر فيها مسؤولو ترامب على القوى الليبرالية. وقد استغل حساب البيت الأبيض على منصة إكس صيحة إنشاء صور بأسلوب استوديو جيبلي، ونشر صورة لامرأة من الدومينيكان تبكي أثناء تعرضها للاعتقال على يد إدارة الهجرة والجمارك (ICE). والواقع أن السخرية السياسية باستعمال الذكاء الاصطناعي قد انتشرت على مستوى العالم.

فهناك مقاطع فيديو صينية من إنتاج الذكاء الاصطناعي تسخر من العمال الأمريكيين البدناء وهم يقفون في خطوط التجميع بعد إعلان التعريفات الجمركية، وقد أثارت هذه المقاطع سؤالا موجها للمتحدثة باسم البيت الأبيض الأسبوع الماضي وردا منها. فقد قالت المتحدثة: إن هذه مقاطع أنتجها من «لا يرون إمكانات العامل الأمريكي». ولإثبات مدى انتشار فوضى الذكاء الاصطناعي، كان علي أن أتأكد ثلاث مرات من أنه حتى هذا الرد نفسه لم يكن في حد ذاته محتوى ذكاء اصطناعي منفذا على عجل مختلقا خدعة أخرى لأعداء ترامب.

وليس الدافع إلى تسييس الذكاء الاصطناعي بالأمر الجديد، فهو ببساطة امتداد للبروباجندا المعهودة. ولكن الجديد هو مدى ديمقراطيته وانتشاره، وأنه لا يحتوي أشخاصا حقيقيين ويخلو من قيود الحياة الواقعية المادية، فيوفر بذلك ما لا حصر له من السيناريوهات الخيالية.

وانتشار محتوى الذكاء الاصطناعي عبر قنوات الدردشة الضخمة عظيمة الحضور، من قبيل واتساب، يعني غياب أي ردود أو تعليقات تشكك في صحته. فكل ما تتلقاه ينعم بسلطة من ثقتك في الشخص الذي أرسله إليك. لذلك أخوض صراعا دائما مع قريبة لي كبيرة السن، مطلعة على عالم الإنترنت، تتلقى سيلا من محتوى الذكاء الاصطناعي على واتساب بشأن حرب السودان وتصدقه. تبدو الصور ومقاطع الفيديو حقيقية بالنسبة لها، وترد إليها موجهة من أشخاص تثق فيهم. ويصعب على المرء حتى أن يستوعب قدرة التكنولوجيا على إنتاج محتوى يبدو حقيقيا إلى هذه الدرجة.

وبإضافة هذه القدرة إلى توافق المحتوى مع رغبات قريبتي السياسية، ستجد نفسك متعلقا به إلى حد بعيد، حتى لو اعتراك بعض من الشك فيه. فوسط الكم الهائل من القطط [في بعض الفيديوهات المختلقة]، يجري استعمال الذكاء الاصطناعي في خلق سيناريوهات سياسية، وتحسينها والوصول بها إلى درجة الكمال عبر تقديمها بلغة بصرية تؤجج الرغبة في الانتصار أو تعتمد على الشعور بالحنين.

يشير البروفيسور رولاند ماير، الباحث في الإعلام والثقافة البصرية، إلى «موجة حديثة من الصور المولدة بالذكاء الاصطناعي لعائلات بيضاء شقراء، تطرحها حسابات إلكترونية فاشية جديدة بوصفها نماذج لمستقبل مشرق». وهو لا يعزو ذلك إلى اللحظة السياسية الراهنة فحسب، وإنما إلى أن «الذكاء الاصطناعي التوليدي محافظ بطبيعته، بل ويقوم على حنين إلى الماضي». فالذكاء الاصطناعي التوليدي يقوم على بيانات مسبقة أثبتت الأبحاث أنها بيانات متحيزة بطبيعتها ضد التنوع العرقي، والأدوار الجندرية والميول الجنسية التقدمية، فتأتي منتجات الذكاء الصناعي بتركيز كبير على هذه المعايير.

يمكن أن نرى الأمر نفسه في محتوى «الزوجة التقليدية» [“trad wife”]، الذي لا يقدم ربات البيوت الجميلات الخاضعات فحسب، وإنما يقدم عالما رجعيا كاملا لينغمس فيه الرجال. وتغص جداول موقع إكس بنوع من المواد الإباحية غير الجنسية، حيث تلمع على الشاشة صور الذكاء الاصطناعي لنساء يوصفن بالحسن والخصوبة والخضوع. ويجري طرح سيادة البيض والاستبداد وتقديس التراتبيات الهرمية في العرق والجندر بوصفها سلة متكاملة من الحنين إلى ماض موهوم. فبات الذكاء الاصطناعي يوصف بالفعل بأنه جمالية الفاشية الجديدة.

لكن الأمر لا يكون دائما على هذا القدر من التماسك. ففي معظم الأحيان، لا تعدو فوضى الذكاء الاصطناعي محتوى فيه بعض المبالغة أو الإثارة بما يغري على التفاعل، ويوفر لمبدعيه فرصة ربح المال من المشاركات والتعليقات وما إلى ذلك. وقد تبين للصحفي ماكس ريد أن فوضى الذكاء الاصطناعي على فيسبوك ـ وهي الفوضى الكبرى على الإطلاق ـ ليست «محض محتوى غير مرغوب فيه» من وجهة نظر فيسبوك، وإنما هي «ما تريده الشركة بالضبط: فهي محتوى شديد الجاذبية». والمحتوى بالنسبة لعمالقة التواصل الاجتماعي هو المحتوى، فكلما كان أرخص، وقلت فيه الحاجة إلى جهد بشري، فذلك أفضل. وتكون النتيجة أن يتحول الإنترنت إلى إنترنت الروبوتات التي تدغدغ مشاعر المستخدمين البشريين وتؤجج فيهم أي أحاسيس أو عواطف تبقيهم منشغلين.

ولكن بغض النظر عن نوايا مبتكريه، يؤدي هذا السيل من محتوى الذكاء الاصطناعي إلى فقدان الإحساس بالواقعية وإرهاق الحواس البصرية. والتأثير العام لدوام التعرض لصور الذكاء الاصطناعي، ما كان منها تافها أو مهدئا أو أيديولوجيا، هو أن كل شيء يبدأ في اتخاذ مسار مختلف. ففي العالم الواقعي، يقف الساسة الأمريكيون خارج أقفاص سجن الترحيل. وتنصب الأكمنة لطلاب الجامعات الأمريكية في الشوارع ليجري إبعادهم. ويحترق أهل غزة أحياء. وتمضي هذه الصور والفيديوهات مع سيل لانهائي من الصور والفيديوهات الأخرى التي تنتهك القوانين المادية والأخلاقية. فتكون النتيجة ارتباكا عميقا. ولا يعود بوسعك أن تصدق عينيك، ولكن ما الذي يمكن أن تصدقه إن لم تصدق عينيك؟ فكل شيء يبدو حقيقيا للغاية وغير واقعي بالمرة، في آن واحد.

أضف إلى هذا ما نعرفه من التبسيط الضروري والإيجاز المستفز في (اقتصاد الانتباه)، وإذا بك في سيرك ضخم من التجاوزات. فحتى عندما يكون المحتوى شديد الجدية، يجري تقديمه بوصفه ترفيها، أو فاصلا، أشبه بنسخة مرئية من موسيقى المصاعد. فهل أفزعك هجوم دونالد ترامب وجيه دي فانس على زيلينسكي؟ حسنا، إليك رسم مصمم بالذكاء الاصطناعي لفانس في هيئة رضيع عملاق. تشعر بالتوتر والإرهاق؟ فها هو بلسم للعين في كوخ فيه نار موقدة والثلج يتساقط في الخارج. ولسبب ما، قرر فيسبوك أنني بحاجة إلى رؤية تيار مستمر من الشقق الصغيرة اللطيفة مع تنويعات من التعليقات التوضيحية مفادها أن «هذا هو كل ما أحتاج إليه».

وتؤدي التحورات السريعة للخوارزميات إلى إمداد المستخدمين بمزيد مما حصدته لهم معتبرة أنه مثير لاهتمامهم. والنتيجة هي أنه يستحيل ترشيد ذلك الاستهلاك حتى لأكثر المستخدمين اتزانا. لأنك تزداد انغماسا في عوالم ذاتية بدلا من الواقع الموضوعي. فتكون النتيجة انفصالا شديد الغرابة. ويضعف الشعور بالقلق والحاجة إلى العمل الذي ينبغي أن يوحي به عالمنا الممزق، وذلك بسبب طريقة عرض المعلومات. وإذن فها هي طريقة جديدة لكي نسير نياما نحو الكارثة وهي طريقة لا تقوم على نقص المعرفة، وإنما تنشأ بسبب الشلل الناجم عن تمرير كل شيء من خلال هذا النظام المشوه، فهو محض جزء آخر من العرض البصري المبالغ فيه.

مقالات مشابهة

  • «التعليم» تُتيح النماذج الاسترشادية لمادة اللغة العربية للثانوية العامة 2025
  • لأول مرة.. أداء الصلاة البابوية باللغة الصينية في جنازة البابا فرنسيس
  • كاريكاتير| إعلام صهيوني باللغة العربية
  • الرئيس الصيني: الذكاء الاصطناعي سيغير أسلوب الحياة البشرية بشكل جذري
  • لطافتك تكلف الذكاء الاصطناعي الملايين!
  • جهاز ذكي يساعد المكفوفين على التنقل باستخدام الذكاء الاصطناعي
  • كيف تعمل من المنزل باستخدام الذكاء الاصطناعي؟
  • يساعدك في اتخاذ القرار.. كيف يغيّر الذكاء الاصطناعي صورة الإنسان عن نفسه؟
  • بتشويه «فوضى الذكاء الاصطناعي» للواقع يمضي العالم إلى كارثة
  • أحمد عبد الوهاب يكتب: اللغة العربية بين العولمة والهوية "تحديات وحلول"