"سدايا" تسعى لتطوير مهارات 800 شاب وفتاة في مجالات النماذج اللغوية الكبيرة
تاريخ النشر: 26th, September 2023 GMT
أعلنت الهيئة السعودية للبيانات والذكاء الاصطناعي "سدايا" عن فتح باب التسجيل في المعسكر الأول من (معسكرات LLM) البالغة 32 معسكرًا وينتهي في 30 سبتمبر الجاري؛ بهدف تطوير مهارات 800 من الكفاءات الوطنية الشابة من حديثي التخرج من التخصصات التقنية في مجال النماذج اللغوية الكبيرة.
وينطلق المعسكر الأول في 8 أكتوبر 2023 -افتراضياً - ويستمر 4 أسابيع يتعرف خلالها المتدربون على مبادئ الذكاء الاصطناعي التوليدي، والشبكات العصبية والتعلم العميق، وتحليل بيانات النصوص، إضافة إلى تأهيلهم للحصول على شهادات احترافية في المجال.
ويشترط للالتحاق بالمعسكرات أن يكون المتقدم سعودي الجنسية، ومن حملة الدبلوم أو البكالوريوس في التخصصات التقنية، واجتياز اختبار القبول، فضلاً عن إجادة اللغة الإنجليزية.
ويأتي إطلاق هذه المعسكرات في إطار جهود "سدايا" الرامية إلى تعزيز التوعية في مجالات الذكاء الاصطناعي وبناء القدرات الوطنية في هذه المجالات بما يضمن الارتقاء بالمملكة إلى مصاف الدول الرائدة ضمن الاقتصادات القائمة على البيانات والذكاء الاصطناعي؛ بوصفها المرجع الوطني للبيانات والذكاء الاصطناعي في كل ما يتعلق بهما من تنظيم وتطوير وتعامل في المملكة.
المصدر: صحيفة عاجل
كلمات دلالية: الهيئة السعودية للبيانات والذكاء الاصطناعي سدايا
إقرأ أيضاً:
الذكاء الاصطناعي التوليدي يستعين بالكتب لتطوير برامجه
مع تزايد احتياجات الذكاء الاصطناعي التوليدي، بدأت أوساط قطاع النشر هي الأخرى في التفاوض مع المنصات التي توفر هذه التقنية سعيا إلى حماية حقوق المؤلفين، وإبرام عقود مع الجهات المعنية بتوفير هذه الخدمات لتحقيق المداخيل من محتواها.
واقترحت دار نشر "هاربر كولينز" الأميركية الكبرى أخيرا على بعض مؤلفيها عقدا مع إحدى شركات الذكاء الاصطناعي تبقى هويتها طي الكتمان، يتيح لهذه الشركة استخدام أعمالهم المنشورة لتدريب نماذجها القائمة على الذكاء الاصطناعي التوليدي.
في رسالة اطلعت عليها وكالة فرانس برس، عرضت شركة الذكاء الاصطناعي 2500 دولار أميركي لكل كتاب تختاره لتدريب نموذجها اللغوي "ال ال ام" لمدة ثلاث سنوات.
ولكي تكون برامج الذكاء الاصطناعي قادرة على إنتاج مختلف أنواع المحتوى بناء على طلب بسيط بلغة يومية، ينبغي تغذيتها بكمية متزايدة من البيانات.
بعد التواصل مع دار النشر، أكدت الأخيرة الموافقة على العملية. وتشير إلى أنّ "هاربر كولينز أبرمت عقدا مع إحدى شركات التكنولوجيا المتخصصة بالذكاء الاصطناعي للسماح بالاستخدام المحدود لكتب معينة (...) بهدف تدريب نماذج الذكاء الاصطناعي وتحسين أدائها".
وتوضح دار النشر أيضا أنّ العقد "ينظّم بشكل واضح ما تنتجه النماذج مع احترامها حقوق النشر".
- مواد جديدة
ومع أنّ "هاربر كولينز" هي إحدى كبرى دور النشر التي أبرمت عقودا من هذا النوع، لكنّها ليست الأولى. فدار "ويلي" الأميركية الناشرة للكتب العلمية أتاحت لشركة تكنولوجية كبيرة "محتوى كتب أكاديمية ومهنية منشورة لاستخدام محدد في نماذج التدريب"، مقابل 23 مليون دولار، على ما قالت في مارس عند عرض نتائجها المالية.
يسلط هذا النوع من الاتفاقيات الضوء على المشاكل المرتبطة بتطوير الذكاء الاصطناعي التوليدي، الذي يتم تدريبه على كميات هائلة من البيانات تُجمع من الانترنت، وهو ما قد يؤدي إلى انتهاكات لحقوق الطبع والنشر.
ترى جادا بيستيلي، رئيسة قسم الأخلاقيات لدى "هاغينغ فايس"، وهي منصة فرنسية أميركية متخصصة بالذكاء الاصطناعي، أنّ هذا الإعلان يشكل خطوة إلى الأمام، لأنّ محتوى الكتب يدرّ أموالا. لكنها تأسف لأنّ هامش التفاوض محدود للمؤلفين.
وتقول "ما سنراه هو آلية لاتفاقيات ثنائية بين شركات التكنولوجيا ودور النشر أو أصحاب حقوق الطبع والنشر، في حين ينبغي أن تكون المفاوضات أوسع لتشمل أصحاب العلاقة".
يقول جوليان شوراكي المدير القانوني لاتحاد النشر الفرنسي "نبدأ من مكان بعيد جدا"، مضيفا "إنّه تقدم، فبمجرّد وجود اتفاق يعني أن حوارا ما انعقد وثمة رغبة في تحقيق توازن في ما يخص استخدام البيانات كمصدر، والتي تخضع للحقوق والتي ستولد مبالغ".
في ظل هذه المسائل، بدأ الناشرون الصحافيون أيضا في تنظيم هذا الموضوع. ففي نهاية 2023، أطلقت صحيفة "نيويورك تايمز" الأميركية اليومية ملاحقات ضد شركة "اوبن ايه آي" مبتكرة برنامج "تشات جي بي تي" بتهمة انتهاك حقوق النشر. وقد أبرمت وسائل إعلام أخرى اتفاقيات مع "اوبن ايه آي".
وربما لم يعد أمام شركات التكنولوجيا أي خيار لتحسين منتجاتها سوى باعتماد خيارات تُلزمها دفع أموال، خصوصا مع بدء نفاد المواد الجديدة لتشغيل النماذج.
وأشارت الصحافة الأميركية أخيرا إلى أنّ النماذج الجديدة قيد التطوير تبدو وكأنها وصلت إلى حدودها القصوى.
يقول جوليان شوراكي "يمكن على شبكة الإنترنت، جمع المحتوى القانوني وغير القانوني، وكميات كبيرة من المحتوى المقرصن، مما يشكل مشكلة قانونية. هذا من دون أن ننسى مسألة نوعية البيانات".