كيف يغيّر الذكاء الاصطناعي التوليدي طريقة كتابة الأوراق العلمية؟
تاريخ النشر: 19th, July 2024 GMT
على مدى السنوات العشر الماضية، ظهرت مجموعة واسعة من الكلمات والعبارات من الغموض إلى الاستخدام الشائع في العلوم، وهي كلمات تعكس التغييرات التي يشهدها البحث العلمي والأحداث الأوسع داخل العلم والمجتمع.
تظهر هذه التغييرات التي يحدثها الذكاء الاصطناعي في الأوراق والمراجعات والمقالات التي ينتجها العلماء باستمرار، وهذا يثير سؤالاً مثيرا للاهتمام حول تأثير الذكاء الاصطناعي على العلوم.
منذ إصدار "شات جي بي تي" رسميا يوم 30 نوفمبر/تشرين الثاني 2022، أثر على العديد من جوانب حياتنا، ولم تكن الكتابة الأكاديمية والبحوث العلمية محصنة.
وتمكن العلماء منذ ذلك الحين من استخدام نماذج اللغة الكبيرة "إل إل إم إس" (LLMs) -وهي أنظمة ذكاء اصطناعي قادرة على فهم وتوليد لغة بشرية من خلال معالجة كميات هائلة من البيانات النصية- لمراجعة جميع الأوراق العلمية التي ينتجونها وتحريرها وكتابتها أحيانًا من الصفر، ولكن مدى الاستخدام الفعلي لهذا النوع من الذكاء الاصطناعي لا يزال غير معروف.
في الواقع، استكشف عدد كبير من الأبحاث بالفعل مزايا وعيوب نماذج اللغات الكبيرة، وحاول العديد من الباحثين رسم خريطة لتطور العلوم من خلال التغييرات في اللغة التي ينتجونها.
آخر هذه المحاولات قام بها عالم الأبحاث ديمتري كوباك وزملاؤه في معهد هيرتي للذكاء الاصطناعي في مجال صحة الدماغ في توبنغن بألمانيا.
وجد كوباك وزملاؤه طريقة لقياس تأثير أنظمة الذكاء الاصطناعي على الأدبيات العلمية أو العلوم المبسطة منذ عام 2022، وقارنوها بتأثير الأحداث الرئيسية الأخرى في العلوم.
بدأ كوباك وزملاؤه بتنزيل الخلاصات من أكثر من 14 مليون ورقة بحثية منشورة على قاعدة بيانات الطب الحيوي "بابميد" (PubMed) منذ عام 2010، ثم أزالوا بعد ذلك الكلمات والعبارات الشائعة التي لا علاقة لها بكتابة المؤلفين من قاعدة البيانات، مثل "حقوق الطبع والنشر" أو "كيفية الاستشهاد بهذه المقالة".
بعد ذلك، حسبوا عدد المرات التي ظهرت فيها كل كلمة أطول من ثلاثة أحرف كل عام. وأخيرًا، نظروا إلى الكلمات الـ800 الأكثر شعبية، وكيف يتغير تواترها كل عام؟ وكيف تؤثر ليس على الطريقة التي يكتب بها العلماء فحسب، بل على الطريقة التي يتم بها إجراء العلوم؟
تغييرات مفاجئةكشفت النتائج على الفور عن بعض الاتجاهات الواضحة في العلوم. على سبيل المثال، بلغ تكرار كلمة "إيبولا" (مرض يصيب الإنسان بسبب عدوى فيروسية) ذروته في عام 2015، وكلمة "زيكا" (عدوى فيروسية تنتقل عن طريق البعوض) في عام 2017.
حدث أحد أكبر التغييرات في عام 2020 مع زيادة هائلة في استخدام كلمات مثل الإغلاق والوباء والجهاز التنفسي و"ريمديسيفير" (دواء جديد مضاد للفيروسات) أثناء تفشي جائحة كورونا، وهو حدث معروف على نطاق واسع أنه كان له أحد أكبر التأثيرات على النشر العلمي والمنشآت والمؤسسات البحثية في التاريخ.
وللمفاجأة، حدث تغيير أكبر في عام 2024 مع زيادة في كلمات مثل "حاسم ومهم ومحتمل". ومن الغريب أن هذه الكلمات ليست مرتبطة بالمحتوى العلمي للورقة البحثية، بل بأسلوب الكتابة.
في الواقع، يشير الباحثون إلى أن هذه هي بالضبط نوعية الكلمات التي تفضلها نماذج اللغة الكبيرة المدرَّبة مسبقًا على كميات هائلة من البيانات، والتي يقولون إنها "تغير الخطاب العلمي على نطاق غير مسبوق".
ويقول كوباك وزملاؤه إن الزيادة غير المسبوقة في الكلمات النمطية الزائدة في عام 2024 تسمح باستخدامها دلالة على استخدام "شات جي بي تي"، ويشيرون إلى أن وتيرة تكرار مئات الكلمات زادت بشكل مفاجئ بعد أن أصبح "شات جي بي تي" متاحًا ومستخدمًا على نطاق واسع جدًا حيث وصل إلى 100 مليون مستخدم نشط غير مسبوق بعد 3 أشهر من إصداره، ويعتبر أحد المعالم الرئيسية لنماذج اللغة إلى جانب "جي بي تي-4".
أوراق بحثية بالذكاء الاصطناعيوضع كوباك وزملاؤه حدًا أدنى لعدد الأوراق البحثية التي تأثرت بنماذج اللغة الكبيرة. تشير البيانات إلى أن ما لا يقل عن 10% من الأوراق البحثية المنشورة على موقع "بابميد" الطبي للأبحاث في عام 2024 قد تأثرت بهذه الطريقة.
وخلص الباحثون إلى أنه "مع فهرسة 1.5 مليون ورقة بحثية حاليًا في موقع بابميد سنويًا، فإن هذا يعني أن نماذج اللغة الكبيرة تساعد في كتابة ما لا يقل عن 150 ألف ورقة بحثية سنويًا".
لاحظ الفريق أن مساعدة الذكاء الاصطناعي كانت أكثر شيوعًا في الأبحاث المقدمة من البلدان التي لم تكن اللغة الإنجليزية هي لغتها الأولى، والتي غالبًا ما تتم معاقبة باحثيها لأن أوراقهم تبدو أقل احترافية من أقرانهم الذين يكتبون بالإنجليزية.
قد يشير ذلك إلى أن غير المتحدثين بالإنجليزية يستخدمون أنظمة الذكاء الاصطناعي التوليدي لتحقيق تكافؤ الفرص في الكتابة العلمية، أو أن المتحدثين باللغة الإنجليزية يستخدمونها بالقدر نفسه لكنهم أكثر مهارة في إزالة تأثيرها من أوراقهم البحثية قبل النشر، وفي كلتا الحالتين، يبدو أن استخدام نماذج اللغة الكبيرة منتشر على نطاق واسع.
وإذا كان النشر العلمي يؤخذ مثالا على تأثير الذكاء الاصطناعي، فمن المحتمل أن تواجه مجالات النشر الأخرى القائمة على العلوم الاجتماعية والتكنولوجيا والهندسة والرياضيات تحديات أيضًا، ويكون لها نتائج مماثلة.
المصدر: الجزيرة
كلمات دلالية: حراك الجامعات حريات الذکاء الاصطناعی على نطاق جی بی تی فی عام إلى أن
إقرأ أيضاً:
آبل تكشف خطتها لتطوير الذكاء الاصطناعي بتحليل بيانات المستخدمين
في محاولة للرد على الانتقادات المتعلقة بضعف أداء أدوات الذكاء الاصطناعي التي أطلقتها مؤخرًا، خاصة فيما يتعلق بتلخيص الإشعارات، كشفت شركة "آبل" يوم الإثنين عن آلية جديدة لتحسين نماذج الذكاء الاصطناعي الخاصة بها، تعتمد على تحليل بيانات المستخدمين بطريقة تراعي الخصوصية، باستخدام ما يعرف بـ"البيانات الاصطناعية".
تحسين الذكاء الاصطناعي دون المساس بالخصوصيةوأوضحت الشركة في منشور رسمي على مدونتها التقنية أنها تستخدم تقنية "الخصوصية التفاضلية" (Differential Privacy)، والتي تتيح تحليل البيانات بشكل آمن من دون جمع محتوى المستخدمين الفعلي، مما يسمح بتحسين أداء النماذج من دون المساس بخصوصية الأفراد.
وتعتمد آبل على إنشاء بيانات اصطناعية تشبه في الشكل والخصائص بيانات المستخدمين الحقيقية، لكنها لا تتضمن أي محتوى فعلي قام المستخدم بإنتاجه.
وفقًا لآبل، تبدأ العملية بإنشاء مجموعة كبيرة من الرسائل الإلكترونية الاصطناعية حول مواضيع متنوعة، ثم يتم تحويل كل رسالة إلى ما يُعرف بـ"التمثيل الرقمي" (Embedding)، وهو نموذج يعكس الخصائص الأساسية للرسالة مثل اللغة، الموضوع، والطول.
بعد ذلك، يتم إرسال هذه التمثيلات الرقمية إلى عدد محدود من أجهزة المستخدمين الذين اختاروا مشاركة تحليلات الجهاز مع آبل (Device Analytics)، حيث تقوم الأجهزة بمقارنة هذه التمثيلات مع عينات من الرسائل الحقيقية لتحديد مدى دقتها، وبالتالي إبلاغ آبل بأي تحسينات مطلوبة.
نماذج مستهدفة بالتحسينأكدت آبل أنها بدأت باستخدام هذه التقنية لتحسين نموذج Genmoji، وهو النظام المسؤول عن إنشاء رموز تعبيرية مخصصة اعتمادًا على الذكاء الاصطناعي، كما تخطط لتوسيع استخدامها لتشمل ميزات أخرى مثل Image Playground لإنشاء صور تفاعلية، و أداة Image Wand لتحسين الصور بواسطة الذكاء الاصطناعي.
بالاضافة إلى أداة Memories Creation، لإنشاء الذكريات تلقائيًا من صور المستخدم، وأداة Writing Tools لتحسين تجربة الكتابة، واخيراً أداة Visual Intelligence لفهم وتحليل الصور والمحتوى المرئي.
كما أشارت الشركة إلى أنها ستعتمد هذه الطريقة لاحقًا لتحسين ميزة تلخيص الرسائل الإلكترونية، والتي تلقت انتقادات لكونها غير دقيقة أو غير مفيدة.
خلاصةفي ظل المنافسة الشرسة بين عمالقة التكنولوجيا لتطوير حلول ذكاء اصطناعي فعالة وآمنة، يبدو أن آبل تسير في طريق مختلف، يركز على الخصوصية كأولوية مطلقة.
فيما يمثل استخدام البيانات الاصطناعية نقلة نوعية في كيفية تحسين المنتجات دون التضحية بثقة المستخدم – وهي ركيزة أساسية في فلسفة آبل منذ سنوات.