أصدرت الهيئة السعودية للبيانات والذكاء الاصطناعي "سدايا" دليلًا استرشاديًا عن الذكاء الاصطناعي التوليدي والنماذج اللغوية الكبيرة، في خطوة تستهدف رفع مستوى الوعي بهذه التقنيات التي أصبحت عنصرًا مهمًا في عالم التقنيات المتقدمة في عصرنا الحاليّ، والإسهام في مستقبل أكثر استدامة وفائدة للمجتمعات والأفراد على حد سواء.

ويمكن الاطلاع على الدليل من خلال الرابط هنا.

أخبار متعلقة يشمل 17 دولة.. خطوات التقديم في برنامج الابتعاث الجامعيبمناسبة ذكرى الاستقلال.. سفارة المملكة بالهند تغلق أبوابها والتواصل للطوارئ

وتأتي هذه الخطوة في إطار اهتمام سدايا بتعزيز الوعي المجتمعي تجاه تقنيات البيانات والذكاء الاصطناعي، بوصفها المرجع الوطني لهما في المملكة من تنظيم وتطوير، علاوة على أهمية هذه التقنيات في رسم مستقبل العالم بطريقة غير تقليدية.

النموذج اللغوي

يُعرف النموذج اللغوي بأنه نموذج ذكاء اصطناعي يحدد احتمالية وجود سلسلة معينة من الكلمات في جملة ما، وعندما يتكون النموذج من عدد كبير من المعاملات يطلق عليه "نموذج لغوي كبير".

وتندرج هذه النماذج الكبيرة تحت مجموعة من النماذج تعرف بالنماذج التأسيسية، وهي نماذج مدربة على بيانات مختلفة ويمكن تكييفها بأداء مجموعة واسعة من المهام.

وتختلف النماذج اللغوية الكبيرة عن نماذج اللغات الطبيعية التقليدية من جانبين، وهما حجم بيانات التدريب وعدد المعاملات، في حين يتضمن تطوير النماذج اللغوية الكبيرة 3 خطوات رئيسة هي: جمع مجموعة بيانات من مستندات نصية، وتدريب الخوارزميات لفهم العلاقة بين الكلمات، وتقييم النماذج بصورة متكررة وضبطها.

#الذكاء_الاصطناعي_التوليدي والنماذج اللغوية الكبيرة.. آفاق جديدة بقدرات إبداعية.. وفرص تنموية وزيادة في الإنتاجية..
تعرّف أكثر بزيارة الرابط التالي: https://t.co/HeWFsW54tK#سدايا pic.twitter.com/nQG5VU51jU— SDAIA (@SDAIA_SA) August 14, 2023النماذج اللغوية الكبيرة

يهدف هذا الدليل إلى تقديم لمحة مختصرة عن النماذج اللغوية الكبيرة وحالات استخدامها، واستعراض أبرز النماذج من شركات ومؤسسات أكاديمية، إضافة إلى ذكر بعض التحديات والمخاطر التي قد تنشأ مع اندثار هذه النماذج بصورة عامة، والإشارة إلى أفضل الممارسات في تطوير تلك النماذج والتطرق إلى بعض التوقعات المستقبلية.

وتتميز النماذج اللغوية الكبيرة بقدرتها على القيام بعدة مهام مقارنة بالنماذج المتخصصة التي تقوم بمهمة معينة، ومن أبرز حالات استخدامها: كتابة النصوص والمقالات، وتلخيص وتبسيط النصوص، والترجمة من لغة إلى لغة أخرى، والإجابة عن الأسئلة، وتحليل المشاعر، وتصنيف العناصر إلى فئات، وكتابة الأكواد البرمجية، واستخراج الكلمات الافتتاحية، وكتابة الإعلانات التجارية، والتدقيق النحوي.

نماذج فاعلة

زاد الاهتمام بالنماذج اللغوية الكبيرة بعد أن أطلقت شركة Open AI خدمة لتجربة نموذج Chat GBT مجانًا عام 2022، وبلغ عدد مستخدمي الخدمة وقتها أكثر من مليون مستخدم في أول 5 أيام من إطلاقها.

وتعد هذه النماذج فاعلة جدًا وقادرة على تنفيذ أنواع مختلفة من المهام مثل: إنشاء النصوص، والترجمة والتلخيص بلغات متعددة، ومن المتوقع أن تشكل حالات استخدام النماذج التأسيسية بشكل عام 50% من حالات استخدام معالجة اللغات الطبيعية في عام 2026، بينما كانت تمثل أقل من 5% من حالات الاستخدام في عام 2021.

المصدر: صحيفة اليوم

كلمات دلالية: عودة المدارس عودة المدارس عودة المدارس واس الرياض المملكة العربية السعودية سدايا

إقرأ أيضاً:

OpenAI تواجه اتهامات خطيرة بسبب كتب O’Reilly المحمية بحقوق النشر

تواجه OpenAI مجددًا اتهامات خطيرة بشأن استخدامها لمحتوى محمي بحقوق النشر دون إذن.

 نشرت منظمة AI Disclosures Project غير الربحية، التي أسسها رجل الأعمال تيم أوريلي والخبير الاقتصادي إيلان ستراوس في عام 2024، ورقة بحثية تشير إلى أن الشركة قد استخدمت كتبًا مدفوعة من O’Reilly Media في تدريب نموذجها GPT-4o دون ترخيص.

أدلة على استخدام محتوى غير مرخص

تشير الدراسة إلى أن GPT-4o يظهر قدرة أقوى على التعرف على محتوى الكتب المحجوبة من O’Reilly Media مقارنة بنموذج GPT-3.5 Turbo الأقدم، والذي اعتمد بشكل أكبر على مصادر مجانية متاحة للجمهور، مما يثير تساؤلات حول مصادر البيانات التي استخدمتها OpenAI في تدريب نموذجها الأحدث.

OpenAI تعزز قدرات إنشاء الصور في شات جي بي تيOpenAI تُحسن مساعدها الصوتي ليصبح أكثر تفاعلًا وسلاسة في المحادثاتOpenAI تكشف عن أدوات جديدة لإنشاء وكلاء الذكاء الاصطناعيOpenAI تستعد لإطلاق وكلاء الذكاء الاصطناعي باشتراك 20 ألف دولار شهريامنهجية البحث واختبار كشف المحتوى المحمي

استخدم الباحثون تقنية DE-COP، وهي طريقة تم تقديمها في دراسة أكاديمية عام 2024، لاختبار مدى معرفة النماذج اللغوية بالنصوص المحمية بحقوق النشر، وذلك عبر مقارنة قدرتها على التمييز بين النصوص البشرية الأصلية وإصداراتها المُعاد صياغتها بواسطة الذكاء الاصطناعي.

قام الباحثون بفحص 13,962 فقرة مقتبسة من 34 كتابًا من كتب O’Reilly، وتحليل مدى احتمال تضمينها في بيانات التدريب الخاصة بـ GPT-4o. وأظهرت النتائج أن النموذج الجديد تعرّف على محتوى الكتب المدفوعة أكثر بكثير من النماذج السابقة، حتى بعد أخذ التحسينات في قدرات الذكاء الاصطناعي في الاعتبار.

هل هذا دليل قاطع؟

رغم النتائج المثيرة للجدل، لم يصل البحث إلى إثبات قاطع، حيث أقرّ المؤلفون بأن المنهجية المستخدمة ليست مثالية، وأنه من الممكن أن OpenAI لم تحصل على هذه البيانات مباشرة، بل عبر المستخدمين الذين قاموا بلصق نصوص الكتب داخل ChatGPT.

علاوة على ذلك، لم يتم تحليل نماذج OpenAI الأحدث مثل GPT-4.5 والنماذج المنطقية مثل o3-mini و o1، مما يعني أن هذه النماذج قد لا تكون متأثرة بنفس القدر.

معركة OpenAI مع قوانين حقوق النشر

تأتي هذه الاتهامات في وقت تواجه فيه OpenAI دعاوى قضائية متعددة في الولايات المتحدة بشأن انتهاك حقوق النشر، خاصة وأنها دافعت سابقًا عن استخدام المحتوى المحمي في تدريب الذكاء الاصطناعي وطالبت بتخفيف القيود القانونية في هذا المجال.

ورغم أن OpenAI تمتلك اتفاقيات ترخيص رسمية مع جهات إعلامية ومكتبات محتوى مرئي ومنصات تواصل اجتماعي، إلا أن الاتهامات الجديدة تضعها في موقف محرج، خاصة مع استمرارها في البحث عن بيانات تدريب ذات جودة أعلى، حتى لو كان ذلك يعني توظيف خبراء وصحفيين للمساهمة في تحسين النماذج.

مقالات مشابهة

  • سلطنة عمان تشارك في ملتقى القمة العالمية للذكاء الاصطناعي في أفريقيا
  • أربيل بين المعارض والمتاريس اللغوية.. من سوق للسيارات إلى متجر للغواية
  • أربيل بين المعارض والمتاريس اللغوية.. من سوق للسيارات إلى متجر للغواية - عاجل
  • فتحي عبد الوهاب ينعى زوجة نضال الشافعي بهذه الكلمات
  • 644 مليار دولار الإنفاق العالمي على الذكاء الاصطناعي التوليدي في 2025
  • لماذا قام إيلون ماسك بدمج شركته للذكاء الاصطناعي مع منصة "إكس" وما خطورة ذلك؟
  • OpenAI تواجه اتهامات خطيرة بسبب كتب O’Reilly المحمية بحقوق النشر
  • احصل على SSD محمول بسعة 8 تيرابايت من سامسونج بخصم مميز لفترة محدودة
  • تفوق التنين الصيني في السباق العالمي للذكاء الاصطناعي بعد "ديب سيك"
  • صدمة اقتصادية كبرى تنتظر العالم