جوجل تستخدم نسخًا من مقاطع فيديو YouTube لتدريب نماذج الذكاء الاصطناعي
تاريخ النشر: 7th, April 2024 GMT
قامت OpenAI وGoogle بتدريب نماذج الذكاء الاصطناعي الخاصة بهما على النص المكتوب من مقاطع فيديو YouTube، مما قد ينتهك حقوق الطبع والنشر لمنشئي المحتوى، وفقًا لصحيفة نيويورك تايمز. التقرير، الذي يصف المدى الذي قطعته شركات OpenAI وGoogle وMeta من أجل تعظيم كمية البيانات التي يمكنهم تغذيتها لأنظمة الذكاء الاصطناعي الخاصة بهم، يستشهد بالعديد من الأشخاص الذين لديهم معرفة بممارسات الشركات.
وفقًا لصحيفة نيويورك تايمز، استخدمت OpenAI أداة Whisper للتعرف على الكلام لنسخ أكثر من مليون ساعة من مقاطع فيديو YouTube، والتي تم استخدامها بعد ذلك لتدريب GPT-4. ذكرت المعلومات سابقًا أن OpenAI استخدمت مقاطع فيديو وبودكاست على YouTube لتدريب نظامي الذكاء الاصطناعي. وبحسب ما ورد كان رئيس OpenAI جريج بروكمان من بين الأشخاص في هذا الفريق. وفقًا لقواعد Google، لا يُسمح بـ "القصاص أو التنزيل غير المصرح به لمحتوى YouTube"، حسبما صرح مات براينت، المتحدث باسم Google، لصحيفة نيويورك تايمز، قائلاً أيضًا إن الشركة لم تكن على علم بأي استخدام من هذا القبيل من قبل OpenAI.
ومع ذلك، يزعم التقرير أن هناك أشخاصًا في Google كانوا يعرفون ولكنهم لم يتخذوا أي إجراء ضد OpenAI لأن Google كانت تستخدم مقاطع فيديو YouTube لتدريب نماذج الذكاء الاصطناعي الخاصة بها. أخبرت Google صحيفة نيويورك تايمز أنها تفعل ذلك فقط مع مقاطع الفيديو من المبدعين الذين وافقوا على ذلك. تواصلت Engadget مع Google وOpenAI للتعليق.
يزعم تقرير نيويورك تايمز أيضًا أن جوجل طلبت من فريق تعديل سياسة الخصوصية الخاصة بها في يونيو 2023 لتغطية استخدامها للمحتوى المتاح للجمهور على نطاق أوسع، بما في ذلك مستندات جوجل وجداول بيانات جوجل، لتدريب نماذج ومنتجات الذكاء الاصطناعي الخاصة بها. وتم نشر التغييرات، التي تقول جوجل إنها تم إجراؤها من أجل الوضوح، في يوليو. وقال براينت لصحيفة نيويورك تايمز إن هذا النوع من البيانات لا يُستخدم إلا بإذن المستخدمين الذين اشتركوا في اختبارات الميزات التجريبية لجوجل، وأن الشركة "لم تبدأ التدريب على أنواع إضافية من البيانات بناءً على هذا التغيير في اللغة". أضاف التغيير Bard كمثال على ما يمكن استخدام هذه البيانات من أجله.
المصدر: بوابة الوفد
كلمات دلالية: الذکاء الاصطناعی الخاصة لصحیفة نیویورک تایمز
إقرأ أيضاً:
أوبن إيه آي تحذف بالخطأ بيانات مهمة لدعوى قضائية رفعتها نيويورك تايمز
في خطوة غير مقصودة، حذف مهندسو شركة "أوبن إيه آي" بيانات حساسة ترجع لأدلة مهمة جمعتها صحيفة نيويورك تايمز وصحف كبرى أخرى في دعوى قضائية تخص بيانات تدريب الذكاء الاصطناعي. وفقا لوثيقة محكمة صدرت الأربعاء.
وزعمت الوثيقة أن فِرق القانون الخاصة بالصحف قضت 150 ساعة عمل بحثا عن بيانات تدريب الذكاء الاصطناعي التابعة لشركة "أوبن إيه آي" للعثور على حالات تتضمن مقالاتهم الإخبارية. وفقا لموقع "ذا فيرج".
ولم توضح الوثيقة كيف حدث هذا الخطأ أو ما البيانات المحذوفة على وجه التحديد. وذكرت أن شركة "أوبن إيه آي" اعترفت بالخطأ الذي اقترفته وحاولت استرداد البيانات.
ولكن ما استُعيد من البيانات كان غير كامل وغير موثوق، لذلك لا يمكن الاستعانة بهذه البيانات المُسترجعة، فالبيانات الحقيقية كانت تدل على استخدام "أوبن إيه آي" مقالات المؤسسات الإخبارية مثل نيويورك تايمز في بناء نماذج الذكاء الاصطناعي.
أعلنت نيويورك تايمز الحرب على "أوبن إيه آي" في ديسمبر/كانون الأول الماضي (غيتي)ووصف محامو "أوبن إيه آي" الحادثة بأنها خلل تقني تسبب بمسح البيانات من دون قصد، ومن جهة أخرى قال محامو نيويورك تايمز إنهم لا يملكون سببا مقنعا يجعلهم يعتقدون أن هذا الخلل كان متعمدا.
وقد أعلنت نيويورك تايمز الحرب على "أوبن إيه آي" في ديسمبر/كانون الأول الماضي، مدعية أن "أوبن إيه آي" وشريكتها مايكروسوفت قامتا ببناء أدوات الذكاء الاصطناعي اعتمادا على نسخ واستخدام ملايين المقالات الصحفية.
وقد طالبت صحيفة نيويورك تايمز بمقاضاة شركة "أوبن إيه آي" بمليارات الدولارات كتعويض قانوني وفعلي لاتهامها بنسخ أعمالها.
ولقد أنفقت الصحيفة بالفعل أكثر من مليون دولار في محاربة شركة "أوبن إيه آي" في المحكمة وهو مبلغ كبير لا تستطيع أي صحيفة أخرى تحمله.
ومن جهة أخرى أبرمت شركة "أوبن إيه آي" العديد من الصفقات مع شركات إعلامية مختلفة مثل صحيفة "أكسيل سبرينغر" (Axel Springer) الألمانية و"كوندي ناست" (Conde Nast) الأميركية بالإضافة لشركة "فوكس ميديا" (Vox Media)، وهذا يشير إلى أن العديد من الشركات الإعلامية تفضل الشراكة بدلا من القتال.
ورفضت شركة "أوبن إيه آي" الانضمام إلى صحيفة نيويورك تايمز في تقديم أي تحديث للمحكمة يخص الحادثة. وعوضا عن ذلك قُدم البيان من قبل جينيفر مايزل المحامية التي تمثل المؤسسات الإخبارية من أجل إخطار المحكمة رسميا بما حدث.