“جي42” تطلق 20 نموذجًا للذكاء الاصطناعي لدعم معالجة اللغة الطبيعية القائمة على العربية
تاريخ النشر: 5th, August 2024 GMT
أطلقت شركة إنسبشن، إحدى شركات “جي42″، والمتخصصة في تطوير نماذج وتطبيقات الذكاء الاصطناعي المتقدمة، اليوم، أحدث نموذج لغة كبير “جيس 70B”، بالإضافة إلى 20 نموذجاً آخر للذكار الاصطناعي لدعم معالجة اللغة الطبيعية القائمة على اللغة العربية.
وقالت الشركة، في بيان اليوم، إنه تم تصميم نموذج “جيس 70B”، الذي يحتوي على 70 مليار بارامتر، لمطوري حلول معالجة اللغة الطبيعية القائمة على اللغة العربية، ويعد بتسريع تكامل خدمات الذكاء الاصطناعي التوليدي عبر مختلف القطاعات، مما يعزّز القدرات في مجالات مثل خدمة العملاء وإنشاء المحتوى وتحليل البيانات.
وكشفت الشركة أيضًا عن مجموعة شاملة من نماذج “جيس” الأساسية والمدربة بدقة ؛ تضم 20 نموذجًا، عبر 8 أحجام، تتراوح من 590 مليون إلى 70 مليار بارامتر، والمدربة بدقة خصيصاً لتطبيقات الدردشة، حيث تم تدريب هذه النماذج على ما يصل إلى 1.6 تريليون وحدة لغوية بالعربية والإنجليزية وبيانات البرمجة.
وتستوعب هذه المجموعة من نماذج “جيس” عددًا واسعًا من الاستخدمات، وتهدف إلى تسريع فرص الابتكار والتطوير والبحث للعديد من التطبيقات المستقبلية للمجتمع العربي الناطق باللغة العربية وثنائي اللغة.
وقال الدكتور أندرو جاكسون، الرئيس التنفيذي لشركة إنسبشن: “اليوم، أصبح الذكاء الاصطناعي قوة مُضافة للِقيمة، وكانت نماذج اللغة الكبيرة في طليعة ارتفاع تبني الذكاء الاصطناعي، مشيرا إلى أنه تم إنشاء ‘جيس‘ للحفاظ على التراث والثقافة واللغة العربية، ولجعل الوصول إلى الذكاء الاصطناعي متاحًا للجميع”.
وأضاف: “أن إصدار ‘جيس 70B‘ وهذه العائلة الجديدة من النماذج يعزز التزامنا بتقديم نموذج أساسي للذكاء الاصطناعي عالي الجودة للدول العربية، منوها إلى أنّ تقنيات التدريب والتكيف التي نقدمها بنجاح لنماذج اللغة العربية قابلة للتوسع لتشمل لغات أخرى غير مخدومة بشكل كافٍ”.
من جهتها قالت نيها سينغوبتا، عالمة تطبيبقية رئيسية في شركة إنسيبشن: “بالنسبة للنماذج التي تصل إلى 30 مليار بارامتر، فقد نجحنا في تدريب جيس من الصفر متفوقين باستمرار على النماذج المعدلة في المجتمع ، لافتة إلى أنه بالنسبة للنماذج التي تحتوي على 70 مليار بارامتر وما فوق، كانت تعقيدات الحوسبة والأثر البيئي لتدريبها من الصفر كبيرة”.وام
المصدر: جريدة الوطن
كلمات دلالية: الذکاء الاصطناعی اللغة العربیة
إقرأ أيضاً:
الذكاء الاصطناعي والترجمة
انتهيت في مقالي السابق إلى أن الذكاء الاصطناعي- الذي يمثل ذروة التكنولوجيا في يومنا هذا- أصبح فتنة تُبهر العامة وتشغل اهتمام المتخصصين، وهي ما يجعلنا نبالغ في أهمية هذا الذكاء وقدراته في كل مجال، بما في ذلك مجالات الترجمة والتأليف والإبداع الفني. وحيث إنني ليس في وسعي إلقاء الضوء على دور الذكاء الاصطناعي في كل هذه المجالات أو بعضها في مقال واحد، فسوف اكتفي هنا بتناول دوره في مجال الترجمة.
لقد اطلعت على برامج الترجمة من خلال الذكاء الاصطناعي بهدف التحقق من قدراتها على الترجمة الدقيقة والأمينة على الأقل، أي التي ينبغي أن تتحقق فيها أبسط شروط الترجمة، وليس كل متطلباتها؛ ولكني فوجئت بأن هذه الترجمات لا تتحقق فيها هذه الشروط الأساسية: فلا هي دقيقة ولا هي أمينة، وتقع في الأخطاء نفسها التي يرتكبها المترجم الرديء. وفيما يلي أمثلة على أنماط عديدة من هذه الأخطاء:
من الأمثلة على هذه الأخطاء: ترجمة كلمة أو عبارة في نص قديم بناء على دلالتها في سياق عصر المترجم، من دون تمحيص لدلالتها في عصر المؤلف، أو- على العكس من ذلك- ترجمة كلمة ما ترجمة حَرفية أو صوتية كما هي مستخدمة في عصرها من دون ترجمة، ومن ثم من دون فهم لمعناها، وبالتالي من دون قدرة على رفع معنى الكلمة إلى حالة حضور، بحيث يبقى معناها مكافئًا لدلالتها المستخدمة في عصرنا، أعني عصر المترجم (سواء أكان هو المترجم البشري أو المترجم الآلي). والحقيقة أن هذا الشرط يعني أن الترجمة تقتضي عملية رفع النص إلى حالة حضور أو «تعاصر»، وهو ما يُعرف «بعصرنة النص».
وهناك نوع آخر من الأخطاء وهو الترجمة الحرفية لدلالات الألفاظ والعبارات وتراكيب اللغة، من دون وعي باختلاف طبيعة اللغة المنقول عنها (في كل هذه المستويات) عن طبيعة اللغة المنقول إليها. فاللفظ لا يمكن ترجمته في ذاته وبمفرده ترجمة قاموسية؛ ببساطة لأن اللفظ في أية لغة ليس له معنى واحد مستقل بذاته، وإنما يتأسس معناه على علاقته بالكلمات الأخرى في سياق النص المنقول عنه، وهي علاقات تختلف في تراكيبها عندما يُراد صياغتها في اللغة المنقول إليها. ولكن هذا النمط وغيره من الأخطاء -للأسف- هو ما نجده في كثير من الترجمات العربية الشائعة والشهيرة.
وهناك نوع ثالث من الأخطاء التي لا تتوخى الدقة حينما لا تراعي السياق المتخصص للنص (إذا كان متخصصًا)؛ وبالتالي ترتكب أخطاءً فادحة. وعلى سبيل المثال: نجد أن كلمة truth، عادةً ما تتم ترجمتها إلى كلمة «الحقيقة»، دون مراعاة للمجال التخصصي الذي ترد فيه هذه الكلمة. فلا يكفي هنا مراعاة المجال التخصصي العام الذي ترد فيه هذه الكلمة، وإنما يجب أيضًا مراعاة الجانب التخصصي الدقيق: فالكلمة يمكن ترجمتها على النحو السابق إذا كانت تقع في مجال الميتافيزيقا أو الأنطولوجيا، ولكنها تصبح غير دقيقة إذا كان النص المنقول عنه يقع في مجال المنطق أو فلسفة تحليل اللغة؛ لأنها في هذه الحالة سوف تعني «الصدق» وليس «الحقيقة»؛ تمامًا مثلما أن كلمة true في هذا السياق أو المجال لا يجب ترجمتها إلى «صحيح»، وإنما إلى كلمة «صادق»؛ لأن الصدق يختلف عن الصحة في المنطق.
ناهيك عن شرط آخر للترجمة يتمثل فيما يمكن أن نسميه «جمال الترجمة»، وهو شرط لا يتحقق إلا في قدر ضئيل للغاية من الترجمات البشرية، وتفتقر إليه تمامًا برامج الذكاء الاصطناعي في الترجمة؛ ببساطة لأنه يرتبط ارتباطًا وثيقًا بأساليب شخصية وإبداعية لدى المترجم (وهذا الطابع الشخصي يغيب عن البرامج الاصطناعية للمترجم الآلي). هذا الطابع الشخصي الإبداعي في الفهم والتأويل - ومن ثم في الأسلوب- يشهد عليه المثال التالي: يمكن أن نجد ترجمتين لنص واحد، وقد تكون كلاهما دقيقة وموثوقة، ومع ذلك فإننا نفضل إحداها على الأخرى، باعتبارها أكثر جمالًا منها، للسبب سابق الذكر. فالترجمة لا تخلو من طابع إبداعي بمعنى ما.
كل هذه الأخطاء التي قد يقع فيها المترجم البشري عادةً ما تقع فيها برامج الترجمة وفقًا للذكاء الاصطناعي، الذي نسميه على سبيل التبسيط: «المترجم الاصطناعي أو الآلي»؟ لماذا؟ يمكن القول ببساطة إن هذه الأنماط من أخطاء المترجم البشري ترجع إلى نقص أو قصور في قدرات معرفية خاصة، وهو قصور لا يمكن مداواته من خلال المترجم الاصطناعي؛ لأنه يفترض نوعًا من الخبرات المعرفية الخاصة، وقدرة على الترجمة في ضوء روح العصر والسياق الثقافي والاجتماعي السائد فيه. بل إنه قد يفترض معرفة وثيقة بخصوصية تفكير كاتب ما وأسلوبه في الكتابة والتعبير عن هذا الفكر، وهو أسلوب قد يتميز بالتجهم والجدية والصرامة أو بالرشاقة واللغة الموسيقية أو بالدعابة أو بالسخرية. بل قد يفترض معرفة مؤسسة على نوع من الألفة أو «الفهم المتعاطف» (إذا استخدمنا لغة هيدجر) مع كاتب النص، بل مع شخصيته ذاتها التي تنعكس في الكتابة.