في نهاية عام 2021، وبينما تدرب شركة أوبن إيه آي نماذجها للذكاء الاصطناعي، واجهت حينها أزمة في الإمداد. إذ استهلكت كل مخزون النصوص الإنجليزية الموثوقة على الإنترنت أثناء تطويرها لأحدث أنظمتها للذكاء الاصطناعي، وكانت بحاجة إلى المزيد من البيانات الجيدة لتدريب النسخة التالية من نظامها؛ احتاجت للكثير جدا من تلك البيانات.

لذا، ابتكر باحثو أوبن إيه آي، أداة للتعرّف على الكلام تُسمى "ويسبر" (Whisper)، يمكنها نسخ الأصوات من مقاطع فيديو يوتيوب، مما ينتج عنه نصوص محادثة جديدة قد تجعل نظام الذكاء الاصطناعي أكثر ذكاءً. وبحسب ما ذكرته صحيفة نيويورك تايمز، فقد ناقش بعض موظفي الشركة كيف تتعارض تلك الخطوة مع قواعد يوتيوب، إذ يحظر الموقع المملوك لشركة غوغل استخدام مقاطعه في التطبيقات المنفصلة عن المنصة.

في النهاية، فرّغ فريق أوبن إيه آي، أكثر من مليون ساعة من مقاطع فيديو يوتيوب، مستخدما تلك البيانات في تدريب نموذج "جي بي تي-4″، وهو أقوى نموذج للذكاء الاصطناعي تملكه الشركة.

غوغل استفادت من محتوى مقاطع الفيديو على يوتيوب لاستخراج نصوص لتدريب نماذجها للذكاء الاصطناعي (شترستوك) مطاردات يائسة

تحول السباق نحو ريادة مجال الذكاء الاصطناعي التوليدي إلى مطاردات يائسة للوصول إلى أكبر قدر من البيانات الرقمية اللازمة لتطوير تلك التقنيات. وفي سبيل اقتناص هذا الكم الهائل من البيانات، اختصرت شركات التقنية مثل أوبن إيه آي وغوغل وميتا، كل السبل وتجاهلت سياسات الشركات وبحثت في تجاوز القانون، وفقًا لما ذكرته صحيفة نيويورك تايمز.

مثلا في شركة ميتا، التي تمتلك فيسبوك وإنستغرام، تشاور المسؤولون بشأن جمع البيانات المحمية بحقوق الطبع والنشر عبر شبكة الإنترنت، حتى إن كان يعني ذلك مواجهة دعاوى قضائية، وأضافوا أن التفاوض للحصول على تراخيص استخدام المحتوى مع الناشرين والفنانين والموسيقيين وصناعة الأخبار سيستغرق مدة زمنية طويلة.

وعلى غرار ما فعلته شركة أوبن إيه آي، استفادت غوغل من محتوى مقاطع الفيديو على يوتيوب لاستخراج نصوص لتدريب نماذجها للذكاء الاصطناعي، وهو فعل قد ينتهك حقوق النشر الخاصة بصانعي هذا المحتوى.

شريان الحياة للذكاء الاصطناعي

توضح إجراءات تلك الشركات كيف أصبحت البيانات على الإنترنت، من أخبار ومؤلفات روائية ومنشورات على وسائل التواصل الاجتماعي ومقالات ويكيبيديا والصور ومقاطع الفيديو والبودكاست والأفلام وغيرها، شريان الحياة لصناعة الذكاء الاصطناعي الناشئة. إذ يعتمد تطوير أنظمة قوية وتنافسية على وجود ما يكفي من البيانات اللازمة لتعليم تلك النماذج كيفية إنتاج نصوص وصور وأصوات ومقاطع فيديو تشبه ما ينتجه الإنسان بصورة لحظية.

هنا يجب ملاحظة أن حجم البيانات أمر بالغ الأهمية، فقد تعلمت روبوتات المحادثة الرائدة، مثل "شات جي بي تي"، من مجموعات هائلة من النصوص الرقمية التي تصل إلى 3 تريليونات كلمة، أو ما يقرب من ضعف عدد الكلمات المخزنة في مكتبة بودلي، وهي المكتبة البحثية الرئيسية بجامعة أكسفورد، التي تُجمع بها المخطوطات منذ عام 1602. وأوضح الباحثون في مجال الذكاء الاصطناعي أن أكثر البيانات قيمة هي تلك المعلومات فائقة الجودة، كالكتب والمقالات المنشورة التي كتبها وحررها بعناية أفراد متخصصون في مجالاتهم.

في يناير/كانون الثاني عام 2020، نشر جاريد كابلان، عالم الفيزياء النظرية في جامعة جونز هوبكنز، ورقة بحثية رائدة عن الذكاء الاصطناعي أثارت شهية الشركات أكثر للبيانات على شبكة الإنترنت. كان استنتاجه واضحًا وصريحًا: كلما زادت البيانات المتوفرة لتدريب أحد النماذج اللغوية الكبيرة، وهي النماذج التي توجه روبوتات المحادثة، كان أداؤها أفضل. تمامًا كما يتعلّم الطالب الكثير عبر قراءة المزيد من الكتب، يمكن للنماذج اللغوية الكبيرة أن تحدد الأنماط في النصوص على نحو أفضل وتكون أكثر دقة عند حصولها على المزيد من المعلومات.

لسنوات طويلة، كانت شبكة الإنترنت، بمواقع مثل ويكيبيديا وريديت وغيرهما، تبدو مصدرا لا ينضب من البيانات، ولكن مع تطور نماذج الذكاء الاصطناعي، نقّبت شركات التقنية في المزيد من المستودعات. وكانت شركتا غوغل وميتا، بامتلاكهما مليارات المستخدمين ممن ينتجون طلبات بحث ومنشورات على وسائل التواصل الاجتماعي كل يوم، مقيَّدتين بقوانين الخصوصية وسياساتهما الخاصة، مما يمنعهما من الاعتماد على كثير من هذا المحتوى لتدريب نماذج الذكاء الاصطناعي.

لذا، أصبح وضعهم خاصا؛ يمكن لشركات التقنية أن تستنفذ البيانات ذات الجودة العالية على شبكة الإنترنت بحلول عام 2026، وفقًا لمعهد "إيبوك" (Epoch) للأبحاث. فأصبحنا الآن في وضع تستهلك فيه تلك الشركات البيانات بوتيرة أسرع مما يجري إنتاجها من العالم أجمع على الإنترنت.

بيانات اصطناعية

أصبحت شركات التقنية متعطشة للبيانات الجديدة لدرجة أن بعضها بدأ في تطوير البيانات "الاصطناعية". ليست بيانات طبيعية ينتجها البشر، بل هي نصوص وصور وأكواد برمجية تنتجها نماذج الذكاء الاصطناعي، أي أن الأنظمة تتعلم مما تنتجه بنفسها.

مثلا ذكرت شركة أوبن إيه آي، أن كل نموذج من نماذجها للذكاء الاصطناعي يمتلك مجموعة بيانات فريدة من نوعها، تنظمها وتجمعها الشركة بهدف مساعدة النموذج على فهم العالم لكي تحافظ على قدرتها التنافسية في المجال.

وذكر سام ألتمان، سابقا، أن الشركات التي تعمل مثل شركته على تطوير نماذجها، ستضطر في النهاية إلى تدريب تلك النماذج على النصوص التي يولدها الذكاء الاصطناعي أو ما يعرف بالبيانات الاصطناعية. النظرية التي يقترحها السيد ألتمان، والآخرون في هذا المجال، أنه نظرًا لقدرة نموذج الذكاء الاصطناعي على إنتاج نصوص شبيهة بالبشر، فيمكن للأنظمة أن تنتج بيانات إضافية لتطوير إصدارات أفضل من نفسها. وهذا الأمر سيساعد المطورين على ابتكار تقنيات أكثر قوة ويقلل من اعتمادهم على البيانات المحمية بحقوق الطبع والنشر.

استكشف الباحثون في المجال فكرة استخدام البيانات الاصطناعية منذ سنوات، ولكن تطوير نماذج الذكاء الاصطناعي القادرة على تدريب نفسها أسهل قولا مما يبدو عليه فعلا. لأن تلك النماذج التي تتعلم من نتائجها الخاصة قد تقع في دائرة مفرغة بحيث تعزز من عيوبها وأخطائها وقيودها الحالية.

ولمواجهة ذلك، تبحث شركة أوبن إيه آي وغيرها في كيفية عمل نموذجين مختلفين للذكاء الاصطناعي معًا لتوليد بيانات اصطناعية مفيدة وموثوقة أكثر. ينتج أحد النظامين البيانات، بينما يتولى النظام الآخر الحكم على تلك البيانات لفرز الجيد منها عن السيئ. لكن حتى هذا الحل لم يتفق الباحثون حول مدى إمكانية نجاحه من عدمها.

المصدر: الجزيرة

كلمات دلالية: حراك الجامعات حريات نماذج الذکاء الاصطناعی شرکة أوبن إیه آی شرکات التقنیة شبکة الإنترنت من البیانات المزید من

إقرأ أيضاً:

حمدان بن محمد يوجّه بتنظيم مؤتمر «AI@70» ضمن «أسبوع دبي للذكاء الاصطناعي 2026»

دبي - وام
وجّه سموّ الشيخ حمدان بن محمد بن راشد آل مكتوم، ولي عهد دبي، نائب رئيس مجلس الوزراء وزير الدفاع، رئيس مجلس أمناء مؤسسة دبي للمستقبل، اليوم الجمعة بتنظيم مؤتمر جديد في دورة العام المقبل من «أسبوع دبي للذكاء الاصطناعي» يستضيف نخبة خبراء الذكاء الاصطناعي في العالم لوضع خريطة طريق شاملة للسبعين عاماً المقبلة بهدف تسخير الذكاء الاصطناعي لخدمة الإنسانية جمعاء.
وقال سموّه: «ستحتفي دبي خلال الدورة المقبلة لأسبوع دبي للذكاء الاصطناعي بالذكرى الـ 70 للإعلان عن مصطلح»الذكاء الاصطناعي«للمرة الأولى في التاريخ في مؤتمر دارتموث في 1956 وعلى خطى هذا الإعلان الذي غير وجه العالم، نعلن عن تنظيم مؤتمر “AI@70” خلال»أسبوع دبي للذكاء الاصطناعي 2026«بالتعاون مع جامعة دارتموث الأمريكية ليستضيف نخبة الخبراء والمتخصصين من حول العالم في دبي ولنناقش تطوراته خلال السبعين عاماً الماضية ونرسم ملامح فرصه ومستقبله في السبعين عاماً المقبلة».
وينعقد هذا الحدث العالمي تحت عنوان «نحو إنسانية عالمية» وسيقدم منصة لتبادل الرؤى والأفكار وإجراء حوار عميق بين ألمع العقول وأبرز الخبراء في الذكاء الاصطناعي والأعمال والتكنولوجيا والفلسفة والفن والعلوم حول الأسئلة الفلسفية الأساسية التي تشكّل القاعدة البحثية لعصر الذكاء الاصطناعي ومستقبله.
وقال سموّ الشيخ حمدان بن محمد بن راشد آل مكتوم: «نحن في دبي نؤمن بأهمية تلاقي الرؤى والأفكار وتعزيز التعاون وبناء الشراكات الدولية لاستشراف مستقبل الذكاء الاصطناعي وتسخيره لخدمة أغراض التنمية الشاملة والارتقاء بحياة الشعوب والمجتمعات حول العالم».
وأضاف سموه أن دبي وانطلاقاً من مكانتها الدولية عاصمةً عالميةً للمستقبل، ومختبراً لأحدث التطبيقات التكنولوجية، فإنها تواصل تنمية قطاع الذكاء الاصطناعي مع تزايد الشركات المتخصصة في هذا القطاع الواعد التي تتخذ من دبي مقراً لها في ظل التطور الهائل الذي تشهد البنية التحتية الرقمية في الإمارة.
وتابع سموّ الشيخ حمدان بن محمد بن راشد آل مكتوم قائلاً: «الذكاء الاصطناعي يُمثّل التكنولوجيا التحويلية في العصر الحالي، ومن أجل الاستفادة من فوائده الهائلة، ستحتضن دبي أعظم المفكرين في العالم من أجل استكشاف التغييرات التي سيُحدثها، وفهمها، بحيث نكون مستعدّين لما سيحمله المستقبل للبشرية.
ويشكّل الحدث تمهيداً لإطلاق»مختبر الإنسانية«- Humanity Lab - وهو حاضنة ذات برنامج يمتد لثمانية أسابيع، أي المدة نفسها التي استغرقها مؤتمر دارتموث الأول.
وسيقام البرنامج في»كامبس دبي للذكاء الاصطناعي«التابع لمركز دبي المالي العالمي “DIFC Dubai AI Campus”، بهدف دمج الفن والفلسفة والتكنولوجيا لتطوير جيل جديد من منتجات الذكاء الاصطناعي، والتي تعكس التأثيرات العميقة التي يحدثها هذا المجال على الإنسانية.
ويهدف هذا التجمع الاستثنائي من نخبة العقول والخبراء الذي ستستضيفه دبي خلال»AI@70: نحو إنسانية عالمية«إلى وضع أجندة بحثية عالمية طموحة، تركّز على أهم القضايا العلمية والفلسفية والأخلاقية والاجتماعية الأكثر تأثيرًا في مستقبل الذكاء الاصطناعي. ويعمل الحدث على مواءمة الابتكارات التكنولوجية المتقدمة مع التفكير الفلسفي العميق، من أجل بناء فهم أعمق للتحوّلات الكبرى التي يشهدها العالم حالياً.
كما سيسهم في صياغة رؤى ممكنة للمستقبل لم تكن قابلة للتصوّر في الماضي، ويمثل فرصة لوضع ملامح الجيل الجديد من رواد الأعمال والفنانين المدعومين بالذكاء الاصطناعي وهم يستكشفون نماذج وتصورات جديدة كانت مستحيلة من قبل.
يُشار إلى أن مؤتمر»AI@70: نحو إنسانية عالمية' سينظمه مركز دبي المالي العالمي بالتعاون مع شركة آبكو العالمية. وتضم اللجنة التوجيهية للمؤتمر في عضويتها ممثلين عن مركز دبي المالي العالمي، ومستشارين عالميين من آبكو العالمية، وخبراء آخرين في مجال الذكاء الاصطناعي.

مقالات مشابهة

  • شاهد | الولايات المتحدة تواجه معضلةً بشأن في اليمن
  • مؤسسة مراقبة الإنترنت: أكثر من 291 ألف بلاغ عن صور اعتداء جنسي على الأطفال في أوروبا
  • صحيفة عبرية: “أمريكا تواجه معضلة في اليمن مماثلة للمعضلة الإسرائيلية في غزة”
  • فعاليات أسبوع دبي للذكاء الاصطناعي 2025
  • الرئيس الصيني: الذكاء الاصطناعي سيغير أسلوب الحياة البشرية بشكل جذري
  • مختص يوضح الأسباب التي تدفع الأفراد إلى اللجوء للذكاء الاصطناعي .. فيديو
  • شركات ناشئة من أستراليا وإيطاليا والهند تعرض ابتكاراتها في أسبوع دبي للذكاء الاصطناعي
  • عمر العلماء: مؤتمر «AI@70» يعزز مكانة دبي مركزاً للذكاء الاصطناعي
  • حمدان بن محمد يطلق أكاديمية دبي للذكاء الاصطناعي
  • حمدان بن محمد يوجّه بتنظيم مؤتمر «AI@70» ضمن «أسبوع دبي للذكاء الاصطناعي 2026»