شريان الحياة للذكاء الاصطناعي.. كيف تواجه شركات التقنية معضلة انتهاء البيانات؟
تاريخ النشر: 20th, July 2024 GMT
في نهاية عام 2021، وبينما تدرب شركة أوبن إيه آي نماذجها للذكاء الاصطناعي، واجهت حينها أزمة في الإمداد. إذ استهلكت كل مخزون النصوص الإنجليزية الموثوقة على الإنترنت أثناء تطويرها لأحدث أنظمتها للذكاء الاصطناعي، وكانت بحاجة إلى المزيد من البيانات الجيدة لتدريب النسخة التالية من نظامها؛ احتاجت للكثير جدا من تلك البيانات.
لذا، ابتكر باحثو أوبن إيه آي، أداة للتعرّف على الكلام تُسمى "ويسبر" (Whisper)، يمكنها نسخ الأصوات من مقاطع فيديو يوتيوب، مما ينتج عنه نصوص محادثة جديدة قد تجعل نظام الذكاء الاصطناعي أكثر ذكاءً. وبحسب ما ذكرته صحيفة نيويورك تايمز، فقد ناقش بعض موظفي الشركة كيف تتعارض تلك الخطوة مع قواعد يوتيوب، إذ يحظر الموقع المملوك لشركة غوغل استخدام مقاطعه في التطبيقات المنفصلة عن المنصة.
في النهاية، فرّغ فريق أوبن إيه آي، أكثر من مليون ساعة من مقاطع فيديو يوتيوب، مستخدما تلك البيانات في تدريب نموذج "جي بي تي-4″، وهو أقوى نموذج للذكاء الاصطناعي تملكه الشركة.
غوغل استفادت من محتوى مقاطع الفيديو على يوتيوب لاستخراج نصوص لتدريب نماذجها للذكاء الاصطناعي (شترستوك) مطاردات يائسةتحول السباق نحو ريادة مجال الذكاء الاصطناعي التوليدي إلى مطاردات يائسة للوصول إلى أكبر قدر من البيانات الرقمية اللازمة لتطوير تلك التقنيات. وفي سبيل اقتناص هذا الكم الهائل من البيانات، اختصرت شركات التقنية مثل أوبن إيه آي وغوغل وميتا، كل السبل وتجاهلت سياسات الشركات وبحثت في تجاوز القانون، وفقًا لما ذكرته صحيفة نيويورك تايمز.
مثلا في شركة ميتا، التي تمتلك فيسبوك وإنستغرام، تشاور المسؤولون بشأن جمع البيانات المحمية بحقوق الطبع والنشر عبر شبكة الإنترنت، حتى إن كان يعني ذلك مواجهة دعاوى قضائية، وأضافوا أن التفاوض للحصول على تراخيص استخدام المحتوى مع الناشرين والفنانين والموسيقيين وصناعة الأخبار سيستغرق مدة زمنية طويلة.
وعلى غرار ما فعلته شركة أوبن إيه آي، استفادت غوغل من محتوى مقاطع الفيديو على يوتيوب لاستخراج نصوص لتدريب نماذجها للذكاء الاصطناعي، وهو فعل قد ينتهك حقوق النشر الخاصة بصانعي هذا المحتوى.
شريان الحياة للذكاء الاصطناعيتوضح إجراءات تلك الشركات كيف أصبحت البيانات على الإنترنت، من أخبار ومؤلفات روائية ومنشورات على وسائل التواصل الاجتماعي ومقالات ويكيبيديا والصور ومقاطع الفيديو والبودكاست والأفلام وغيرها، شريان الحياة لصناعة الذكاء الاصطناعي الناشئة. إذ يعتمد تطوير أنظمة قوية وتنافسية على وجود ما يكفي من البيانات اللازمة لتعليم تلك النماذج كيفية إنتاج نصوص وصور وأصوات ومقاطع فيديو تشبه ما ينتجه الإنسان بصورة لحظية.
هنا يجب ملاحظة أن حجم البيانات أمر بالغ الأهمية، فقد تعلمت روبوتات المحادثة الرائدة، مثل "شات جي بي تي"، من مجموعات هائلة من النصوص الرقمية التي تصل إلى 3 تريليونات كلمة، أو ما يقرب من ضعف عدد الكلمات المخزنة في مكتبة بودلي، وهي المكتبة البحثية الرئيسية بجامعة أكسفورد، التي تُجمع بها المخطوطات منذ عام 1602. وأوضح الباحثون في مجال الذكاء الاصطناعي أن أكثر البيانات قيمة هي تلك المعلومات فائقة الجودة، كالكتب والمقالات المنشورة التي كتبها وحررها بعناية أفراد متخصصون في مجالاتهم.
في يناير/كانون الثاني عام 2020، نشر جاريد كابلان، عالم الفيزياء النظرية في جامعة جونز هوبكنز، ورقة بحثية رائدة عن الذكاء الاصطناعي أثارت شهية الشركات أكثر للبيانات على شبكة الإنترنت. كان استنتاجه واضحًا وصريحًا: كلما زادت البيانات المتوفرة لتدريب أحد النماذج اللغوية الكبيرة، وهي النماذج التي توجه روبوتات المحادثة، كان أداؤها أفضل. تمامًا كما يتعلّم الطالب الكثير عبر قراءة المزيد من الكتب، يمكن للنماذج اللغوية الكبيرة أن تحدد الأنماط في النصوص على نحو أفضل وتكون أكثر دقة عند حصولها على المزيد من المعلومات.
لسنوات طويلة، كانت شبكة الإنترنت، بمواقع مثل ويكيبيديا وريديت وغيرهما، تبدو مصدرا لا ينضب من البيانات، ولكن مع تطور نماذج الذكاء الاصطناعي، نقّبت شركات التقنية في المزيد من المستودعات. وكانت شركتا غوغل وميتا، بامتلاكهما مليارات المستخدمين ممن ينتجون طلبات بحث ومنشورات على وسائل التواصل الاجتماعي كل يوم، مقيَّدتين بقوانين الخصوصية وسياساتهما الخاصة، مما يمنعهما من الاعتماد على كثير من هذا المحتوى لتدريب نماذج الذكاء الاصطناعي.
لذا، أصبح وضعهم خاصا؛ يمكن لشركات التقنية أن تستنفذ البيانات ذات الجودة العالية على شبكة الإنترنت بحلول عام 2026، وفقًا لمعهد "إيبوك" (Epoch) للأبحاث. فأصبحنا الآن في وضع تستهلك فيه تلك الشركات البيانات بوتيرة أسرع مما يجري إنتاجها من العالم أجمع على الإنترنت.
بيانات اصطناعيةأصبحت شركات التقنية متعطشة للبيانات الجديدة لدرجة أن بعضها بدأ في تطوير البيانات "الاصطناعية". ليست بيانات طبيعية ينتجها البشر، بل هي نصوص وصور وأكواد برمجية تنتجها نماذج الذكاء الاصطناعي، أي أن الأنظمة تتعلم مما تنتجه بنفسها.
مثلا ذكرت شركة أوبن إيه آي، أن كل نموذج من نماذجها للذكاء الاصطناعي يمتلك مجموعة بيانات فريدة من نوعها، تنظمها وتجمعها الشركة بهدف مساعدة النموذج على فهم العالم لكي تحافظ على قدرتها التنافسية في المجال.
وذكر سام ألتمان، سابقا، أن الشركات التي تعمل مثل شركته على تطوير نماذجها، ستضطر في النهاية إلى تدريب تلك النماذج على النصوص التي يولدها الذكاء الاصطناعي أو ما يعرف بالبيانات الاصطناعية. النظرية التي يقترحها السيد ألتمان، والآخرون في هذا المجال، أنه نظرًا لقدرة نموذج الذكاء الاصطناعي على إنتاج نصوص شبيهة بالبشر، فيمكن للأنظمة أن تنتج بيانات إضافية لتطوير إصدارات أفضل من نفسها. وهذا الأمر سيساعد المطورين على ابتكار تقنيات أكثر قوة ويقلل من اعتمادهم على البيانات المحمية بحقوق الطبع والنشر.
استكشف الباحثون في المجال فكرة استخدام البيانات الاصطناعية منذ سنوات، ولكن تطوير نماذج الذكاء الاصطناعي القادرة على تدريب نفسها أسهل قولا مما يبدو عليه فعلا. لأن تلك النماذج التي تتعلم من نتائجها الخاصة قد تقع في دائرة مفرغة بحيث تعزز من عيوبها وأخطائها وقيودها الحالية.
ولمواجهة ذلك، تبحث شركة أوبن إيه آي وغيرها في كيفية عمل نموذجين مختلفين للذكاء الاصطناعي معًا لتوليد بيانات اصطناعية مفيدة وموثوقة أكثر. ينتج أحد النظامين البيانات، بينما يتولى النظام الآخر الحكم على تلك البيانات لفرز الجيد منها عن السيئ. لكن حتى هذا الحل لم يتفق الباحثون حول مدى إمكانية نجاحه من عدمها.
المصدر: الجزيرة
كلمات دلالية: حراك الجامعات حريات نماذج الذکاء الاصطناعی شرکة أوبن إیه آی شرکات التقنیة شبکة الإنترنت من البیانات المزید من
إقرأ أيضاً:
الذكاء الاصطناعي يختار الملاعب الأكثر رعبا في العالم
باتت الأجواء الجماهيرية جزءا أصيلا من عالم الرياضة وخاصة في كرة القدم، فكثير من عشاق الساحرة المستديرة ينتظرون مباريات بعينها لفرق تمتلك قاعدة جماهيرية تُوصف بالعشق والجنون، وتصنع من المدرجات حالة من الرعب للمنافسين.
وربما هذا ما يؤكد صحة المقولة الدارجة إن الجماهير هي اللاعب رقم 12 في كرة القدم، حيث تتسلح الفرق بجماهيرها عندما تستضيف مباراة مهمة أو حاسمة من أجل وضع الضغط على الفريق الزائر.
اقرأ أيضا list of 2 itemslist 1 of 2أبرز 10 نجوم تنتهي عقودهم الصيف المقبلlist 2 of 2لاعبون في الليغا انهارت قيمتهم السوقية في 2024end of listوبالطبع، فإن كثيرا من الرياضيين واللاعبين اعتادوا على التعامل مع هذه المواقف الصعبة، لكن هناك آخرين يعانون كثيرا في اللعب على مثل هذه الملاعب.
وعلى مرّ السنين عرفت كرة القدم العديد من الملاعب التي اكتسبت شهرتها عالميا بسبب أجوائها التي جعلت منها جحيما بالنسبة للفرق الزائرة.
وتاليا نستعرض 10 من الملاعب التي صنفت من قبل الذكاء الاصطناعي على أنها الأكثر رعبا في العالم: ملعب إيبروكسهو الملعب الخاص بفريق غلاسكو رينجرز الأسكتلندي، ويستوعب حوالي 51 ألف متفرج، تُعرف جماهيره بالجنون في التشجيع لدرجة أن أي فريق يزور الملعب قلّما يخرج فائزا.
يصف "شات جي بي تي" الملعب بالقول "يتميز ملعب رينجرز بأجواء استثنائية ومثيرة للغاية خاصة عندما يحتضن مباراة الديربي ضد سيلتيك".
ملعب أزتيكايخوض منتخب المكسيك مبارياته البيتية على هذا الملعب الخاص بفريق كلوب أميركا الذي يتسع لحوالي 87 ألف مشجع.
إعلانويُعتبر ملعب أزتيكا واحدا من أكبر الملاعب في العالم، وتجعل أجواء الصخب الذي يرافق مباريات المنتخب الوطني منه مكانا مخيفا للغاية خاصة عندما تمتلئ المدرجات بالجماهير، وبالمناسبة سيستضيف الملعب بعض المباريات في النسخة المقبلة من نهائيات كأس العالم 2026.
يصف "شات جي بي تي" الملعب بالقول "يُعتبر ملعب أزتيكا أحد أكبر الملاعب في العالم حيث يشكل حجمه وارتفاعه تحديا مخيفا خاصة للفرق غير المعتادة على أجوائه".
ملعب راجكو ميتيتشهو الملعب الخاص بفريق النجم الأحمر الصربي، ويتسع لحوالي 55 ألف متفرج، ولا يُعد غريبا عليه المشاهد المخيفة كالألعاب النارية الموجودة بكثرة على المدرجات لدرجة تصدم بعض المشجعين الزاحفين خلف أنديتهم في المسابقات الأوروبية.
يصف "شات جي بي تي" الملعب "يُعرف ملعب ريد ستار باسم ماراكانا أيضا وهو يخلق بيئة شرسة وعدائية خاصة أثناء مباريات الديربي وفي المباريات الأوروبية حيث تطلق الجماهير الألعاب النارية المصاحبة للصخب الموجود على المدرجات".
ملعب سان سيرويخوض فريقا ميلان وإنتر مبارياتهما البيتية محليا وأوروبيا على هذا الملعب الذي يستوعب حوالي 75 ألف متفرج، وعلى مدار سنوات عديدة استضاف الملعب الكثير من المباريات التاريخية سواء بين الناديين أو مع الفرق التي تزورهما.
ويسمح تصميم الملعب لجميع الموجودين على المدرجات بالحصول على رؤية مثالية لما يجري داخل أرض الملعب، وفي الوقت نفسه لا يفارق الصخب والضجيج حناجر المشجعين.
يصف "شات جي بي تي" الملعب "لقد شهد سان سيرو ليالي أوروبية شهيرة، تصميمه البنياني المهيب وجماهيره الصاخبة تجعله أحد أكثر الملاعب إثارة للرهبة في كرة القدم".
رامس بارك (تورك تيليكوم أرينا)هو ملعب فريق غلطة سراي التركي، ويستوعب ما يقرب من 52 ألف متفرج، يتميز النادي التركي بأن لديه مشجعين أقل ما يمكن وصفهم بأنهم مجانين حيث يحوّلون الملعب إلى مكان أشبه "بالجحيم".
إعلانيصف "شات جي بي تي" هذا الملعب بالقول "يشتهر ملعب غلطة ساري بأجوائه النارية العدائية، وتوجد فيه لافتات مكتوب عليها مرحبا بكم في الجحيم، يمكن أن يصل فيه مستوى الضوضاء إلى مرحلة لا تُطاق بالنسبة للفريق الزائر".
سلتيك باركهو ملعب سلتيك أحد أكبر الأندية في أسكتلندا، وتستوعب مدرجاته ما يقارب من 60 ألف متفرج، يكون في أبهى حلة أثناء مباراة الديربي ضد غلاسكو رينجرز.
أشاد النجم البرتغالي كريستيانو رونالدو بالأجواء الحماسية على المدرجات حين لعب ضد الفريق الأسكتلندي أثناء وجوده مع ريال مدريد.
ويقول عنه "شات جي بي تي": "يشتهر سلتيك بارك بهدير جماهير وأداء للهتافات والأناشيد المحفزة لفريقهم خاصة في الليالي الأوروبية وهو بمثابة حصن للعملاق الأسكتلندي".
ملعب ماراكانايحتضن ملعب ماراكانا مباريات فريقي فلامنغو وفلومينينسي، بالإضافة إلى المباريات المهمة للمنتخب البرازيلي ويتسع لحوالي 78 ألف متفرج، وبالتالي هو ثاني الملاعب في هذه القائمة الذي يتقاسمه فريقان بعد سان سيرو.
يستضيف الملعب أحد أعنف الديربيات في العالم عندما يلعب فلامنغو وفلومينينسي ضد بعضهما، كما يتحول إلى جحيم عندما يزور فريق آخر هذا الملعب الذي وُصف بأنه الأكثر رهبة في البلاد.
يقول "شات جي بي تي" عن الملعب "هو ملعب أسطوري تاريخي يمكن لأجواء ماراكانا النابضة بالحياة خلال المباريات الكبيرة أن تذهل أي زائر".
أنفيلدلا يوجد ملعب في إنجلترا يرهب الفرق الزائرة مثل أنفيلد معقل ليفربول، الذي يتسع لحوالي 61 ألف متفرج، فهناك الجميع يردد الأغنية الشهيرة قبل بدء المباريات "لن تسير وحدك"، أما أثناء اللعب فلا يتوقف الضجيج والصخب على الإطلاق لدرجة أنه اعتُبر بمثابة "الكابوس" للفريق الزائر.
يقول "شات جي بي تي" عنه "يشتهر ملعب ليفربول بجماهيره المتحمسة وأدائها المذهل لأغنية لن تسير وحدك، الليالي الأوروبية هناك لا يمكن نسيانها".
إعلان سيغنال إيدونا باركهو ملعب بوروسيا دورتموند الألماني، ويتسع لحوالي 81 ألف متفرج، تجمع أجواؤه الرهيبة بين العاطفة والجنون، وكل مباراة تُلعب هناك هي مكسب حقيقي للمشجع المحايد العاشق لكرة القدم.
هناك يلعب المنافسون تحت ضغط الجماهير وصيحاته حيث يشعرون في العادة بعدم الراحة، والفوز على بوروسيا دورتموند يتطلب الكثير من الثبات والخبرة.
يقول "شات جي بي تي" عنه "يشتهر الملعب باكتساح اللون الأصفر لمدرجاته، وفيه مدرج مكون من طابق واحد يتسع لحوالي 25 ألف متفرج، الصخب لا يفارق أجواءه وهو ما يجعل المباراة ضد دورتموند صعبة وقاسية على الزوّار".
لا بومبونيراهو الملعب الأكثر رعبا في العالم وفق موقع "غيف مي سبورت" البريطاني، يتسلح فريق بوكا جونيورز بخوض مبارياته عليه أمام 57 ألف متفرج لا يغيبون عن المدرجات مهما كانت أهمية اللقاء.
تصميم الملعب الفريد يعطي انطباعا أن المشجعين هم جزء أصيل منه وهو ما يزيد من رهبته بالنسبة للمنافسين.
يقول "شات جي بي تي" عن الملعب "المدرجات شديدة الانحدار وهيكله يجعلان من الملعب كأنه قلعة تهتز، ويواجه المنافسون أجواء مرعبة من الهتافات المتواصلة والألعاب النارية".