أصدرت ميتا نموذجًا جديدًا لتحويل الكلام إلى نص يمكنه ترجمة ما يقرب من 100 لغة، حيث تواصل الشركة محاولة إنشاء مترجم عالمي.

أطلقت الشركة على النموذج الجديد اسم SeamlessM4T، التي تعني الترجمة الآلية المتعددة اللغات والمتعددة الوسائط.

ترجمة الكلام إلى نص لنحو 100 لغة

وقالت الشركة: “هذا النموذج قادر على ترجمة الكلام إلى نص وترجمة من النص إلى نص لنحو 100 لغة.

بالنسبة لإجراءات تحويل الكلام إلى كلام وتحويل النص إلى كلام، فإن النموذج يتعرف على 100 لغة إدخال ويحولها إلى 35 لغة إخراج”.

وأصدرت ميتا النموذج بموجب ترخيص Creative Commons CC BY-NC 4.0، مما يسمح للباحثين بمراجعته.

إلى جانب SeamlessM4T، أصدرت ميتا أيضًا البيانات الوصفية لمجموعة بيانات الترجمة المفتوحة SeamlessAlign. وقال ميتا: “يمثل بناء مترجم لغة عالمي تحديًا لأن الأنظمة الحالية لتحويل الكلام إلى كلام وتحويل الكلام إلى نص لا تغطي سوى جزء صغير من لغات العالم”.

وأشارت الشركة إلى أن SeamlessM4T يمثل إنجازًا كبيرًا لأن هذا النموذج الجديد يؤدي مهمة الترجمة بأكملها دفعة واحدة، على عكس نماذج الترجمة الكبيرة الأخرى التي تقسم الترجمة عبر أنظمة مختلفة.

وتتمثل إحدى مميزات SeamlessM4T في قدرته على التعرف عندما ينتقل شخص ما بين لغتين أو أكثر في جملة واحدة.

وأظهرت ميتا في مقطع فيديو أن النموذج يميز على الفور بين الهندية والتيلجو والإنجليزية.

ويعتمد SeamlessM4T على نماذج الترجمة السابقة من ميتا، حيث أصدرت الشركة في العام الماضي نموذجها للترجمة الآلية من النص إلى نص، الذي يدعم 200 لغة.

وطورت الشركة SpeechMatrix، وهي مجموعة بيانات لترجمة الكلام إلى كلام متعددة اللغات والتعرف على الكلام المتعدد اللغات على نطاق واسع.

وجربت في العام الماضي مترجمها العالمي للكلام، حيث حول لغة هوكين المنطوقة، وهي لغة مستخدمة على نطاق واسع في الصين ولا تتمتع بنظام كتابة رسمي، إلى اللغة الإنجليزية.

الترجمة اللغوية 

وتعتبر الترجمة اللغوية مهمة لشركة ميتا، التي توظف آلاف الأشخاص لإدارة منشورات فيسبوك وإنستجرام باللغات المختلفة.

وتخصص الشركة فرق صغيرة للغات غير الرئيسية وتلجأ إلى الإشراف الآلي الذي يعمل بشكل سيئ مع تلك اللغات.

ويمكن للذكاء الاصطناعي، إذا مُنح إمكانية الوصول إلى مجموعة بيانات هذه اللغات الصغيرة، أن يكون أداة مهمة لشركة ميتا من أجل تحسين الإشراف.

وأصدرت الشركة العديد من نماذجها للذكاء الاصطناعي للمطورين والباحثين بطريقة مفتوحة المصدر إلى حد ما.

وطرحت مؤخرًا Audio Craft، وهي تعليمات برمجية تسمح بتحويل النص إلى صوت، وأتاحت ميتا أيضًا إمكانية الوصول إلى نموذج اللغة الكبير Llama 2.

المصدر: البوابة نيوز

كلمات دلالية: الذكاء الاصطناعي النص إلى إلى کلام

إقرأ أيضاً:

جامعة محمد بن زايد للذكاء الاصطناعي تحصد جائزة "غوغل" للأبحاث الأكاديمية

أعلنت جامعة محمد بن زايد للذكاء الاصطناعي، اليوم الأربعاء، حصول فريق من باحثيها على جائزة غوغل العالمية للأبحاث الأكاديمية.




وحصدت الجائزة الدكتورة إيكاترينا كوشمار، الأستاذة المساعدة في قسم معالجة اللغات الطبيعية؛ والدكتور كوشال كومار موريا، وهو باحث ما بعد الدكتوراه متخصص في معالجة اللغات الطبيعية واستخدام النماذج اللغوية الكبيرة في مجال التعليم.
وحصل الباحثان في جامعة محمد بن زايد للذكاء الاصطناعي على هذه الجائزة عن مشروعهما البحثي، الذي يحمل عنوان "2σ - ITS:  برنامج تربوي ذكي قائم على مبادئ علوم التعلّم" الذي يركز على إنشاء نماذج تعليمية أساسية وبناء جيل جديد من الأنظمة التعليمية الذكية القائمة على الحوار باستخدام تقنيات الذكاء الاصطناعي التوليدي، وذلك بهدف مساعدة المتعلّمين في تعلُّم مواد مختلفة، بما في ذلك العلوم والتكنولوجيا، والهندسة، والرياضيات، واللغات. حلول متطورة وقالت الدكتورة إيكاترينا كوشمار: "نفخر بالحصول على هذه الجائزة، ونشكر فريق جوائز غوغل للأبحاث الأكاديمية على تكريمهم ودعمهم لعملنا في هذا المجال حيث يهدف مشروعنا إلى تزويد الطلاب حول العالم بتقنيات معالجة اللغات الطبيعية لمساعدتهم على الاستفادة من الخدمات التعليمية ومن جهة أخرى يساعد المعلمين على التواصل مع الطلاب الذين يتعذّر عليهم الالتحاق بالتعليم التقليدي ونطمح إلى استحداث حلول متطورة قائمة على تقنيات الذكاء الاصطناعي تساهم في تحسين حياة المجتمعات".
وأشارت إلى أن التقنيات الحديثة المتاحة لنا اليوم، مثل نماذج الذكاء الاصطناعي المتطورة والنماذج اللغوية الكبيرة، تتمتع بإمكانات هائلة، لذا نعمل الآن على استكشاف سبل استخدام هذه التقنيات لتحقيق تأثير ملموس في المجتمع.
من جانبه، أوضح الدكتور كوشال كومار موريا أن هذا النظام مصمم لمساعدة المعلمين، وليس لاستبدالهم، معرباً عن أمله في أن يصبح هذا البرنامج التعليمي من العناصر الأساسية في أنظمة التعليم، مثل الآلة الحاسبة والحاسوب.

مقالات مشابهة

  • ندوة تناقش «هجرة اللغات.. قراءة في نموذج العربية والإسبانية»
  • ديب إل منافس ترجمة غوغل يطلق ميزة الترجمة الفورية
  • لمنافسة نظارة "ميتا".. شاومي تطلق نظارات ذكاء اصطناعي بمزايا متقدمة
  • دعوى مكافحة احتكار ضد ميتا بسبب استحواذها.. كيف ردت الشركة؟
  • جامعة محمد بن زايد للذكاء الاصطناعي تحصد جائزة "غوغل" للأبحاث الأكاديمية
  • مصطفى الفقي: ترامب سيحاول إطلاق مبادرات كثيرة عن الشرق الأوسط وروسيا
  • «القومي للترجمة» يطلق مسابقة أبناء رفاعة للاحتفاء بيحيى حقي
  • روبوت يتحول لجراج ماهر بعد مشاهدة فيديوهات تعليمية
  • محافظ السويس يسلم 18 شابا لوحات معدنية لتحويل سياراتهم الملاكي إلى أجرة
  • Caviar تطلق مجموعة iPhone 16 Pro لتكريم ستيف جوبز ودونالد ترامب وإيلون ماسك بسعر يبدأ من 9200 دولار