كيف نقيس ذكاء الآلات؟ أداء المهام الطويلة والمعقدة يكشف الإجابة!
تاريخ النشر: 28th, April 2025 GMT
ابتكر علماء طريقة جديدة لقياس مدى كفاءة أنظمة الذكاء الاصطناعي (AI)، وذلك عبر تقييم سرعة أدائها مقارنة بالبشر في تنفيذ المهام الصعبة.
وعلى الرغم من أن أنظمة الذكاء الاصطناعي تتفوق عادة على البشر في مهام التنبؤ بالنصوص والمعرفة العامة، إلا أنها تظهر فاعلية أقل عند تكليفها بمشاريع أكثر تعقيدًا، مثل تقديم المساعدة التنفيذية عن بُعد.
ولغرض قياس هذه الفجوة في الأداء بدقة، اقترحت دراسة جديدة تقييم أنظمة الذكاء الاصطناعي بناءً على مدة إنجازها للمهام مقارنة بالوقت الذي يحتاجه الإنسان للقيام بالمهمة نفسها. وقد نشر الباحثون نتائجهم عبر قاعدة بيانات الأبحاث الأولية arXiv، ومازالت في طور الدراسة. بحسب موقع livescience .
اقرأ أيضاً..644 مليار دولار الإنفاق العالمي على الذكاء التوليدي خلال 2025
قياس مدة المهام
قال الباحثون "إنهم وجدوا أن قياس مدة المهام التي يمكن للنماذج إكمالها يعد وسيلة مفيدة لفهم قدرات الذكاء الاصطناعي الحالية. إذ يبدو أن وكلاء الذكاء الاصطناعي غالبًا ما يواجهون صعوبة في ربط سلسلة من الإجراءات الطويلة معًا أكثر من افتقارهم إلى المهارات أو المعرفة اللازمة لحل خطوات فردية."
وقد أظهرت نتائج الدراسة أن نماذج الذكاء الاصطناعي أتمت المهام التي تستغرق أقل من أربع دقائق بالنسبة للبشر بنسبة نجاح تقارب 100%. ولكن نسبة النجاح انخفضت بشكل حاد إلى 10% فقط للمهام التي تستغرق أكثر من أربع ساعات.
لاحظ الباحثون أن النماذج الأقدم من الذكاء الاصطناعي كان أداؤها أضعف في إنجاز المهام الطويلة مقارنة بالأنظمة الأحدث، وهو أمر كان متوقعًا. وأشارت الدراسة إلى أن طول المهام التي تستطيع نماذج الذكاء الاصطناعي العامة إكمالها بنسبة موثوقية تبلغ 50% قد تضاعف تقريبًا كل سبعة أشهر خلال السنوات الست الماضية.
حدود جديدة لقياس قدرات الذكاء الاصطناعي؟
قد يمثل هذا المعيار الجديد المحتمل خطوة مهمة لفهم مستوى الذكاء والقدرات الحقيقية لأنظمة الذكاء الاصطناعي بشكل أفضل.
قال الباحث سهراب كازيرونيان:"من غير المرجح أن يغير هذا المقياس نفسه مسار تطوير الذكاء الاصطناعي، لكنه سيساعد في تتبع مدى سرعة التقدم المحرز في أنواع معينة من المهام التي من المتوقع أن تُستخدم فيها أنظمة الذكاء الاصطناعي".
وأضاف: "قياس أداء الذكاء الاصطناعي بناءً على المدة الزمنية التي يستغرقها البشر لإنجاز مهمة معينة يُعد مقياسًا بديلاً مثيرًا للاهتمام لقياس الذكاء والقدرات العامة. أولاً: لأنه لا يوجد مقياس واحد يعبر بدقة عما نعنيه بكلمة (ذكاء). ثانيًا: لأن احتمالية تنفيذ مهمة طويلة الأمد من دون انحراف أو خطأ تصبح منخفضة للغاية. وثالثًا: لأنه يمثل مقياسًا مباشرًا لنوع المهام التي نطمح لاستخدام الذكاء الاصطناعي فيها، وهي حل المشكلات المعقدة التي يواجهها البشر. ورغم أن هذا المقياس قد لا يغطي جميع الجوانب الدقيقة لقدرات الذكاء الاصطناعي، إلا أنه بلا شك يمثل مؤشرًا مهمًا ومفيدًا".
من جانبها، أيدت إلينور واتسون، عضوة في معهد مهندسي الكهرباء والإلكترونيات (IEEE) ومهندسة أخلاقيات الذكاء الاصطناعي في جامعة Singularity، أهمية هذه الأبحاث. وقالت:"إن قياس أداء الذكاء الاصطناعي بناءً على مدة إنجاز المهام يُعد أداة (قيمة وبديهية)، إذ يعكس تعقيدات العالم الواقعي بشكل مباشر، ويقيس مدى قدرة أنظمة الذكاء الاصطناعي على الحفاظ على سلوك منظم وموجه نحو الهدف على مدى فترات زمنية طويلة"، مقارنة بالاختبارات التقليدية التي تقيم أداء الذكاء الاصطناعي في مشكلات قصيرة ومعزولة.
تسارع تطور الذكاء الاصطناعي يبشر بعصر الوكلاء العامين
بعيدًا عن تقديم مقياس معياري جديد، يكمن الأثر الأكبر للدراسة في تسليط الضوء على السرعة المتزايدة لتطور أنظمة الذكاء الاصطناعي، خاصة في قدرتها المتنامية على التعامل مع المهام الطويلة والمعقدة.
وفي هذا السياق، تتوقع إلينور واتسون أن ظهور وكلاء ذكاء اصطناعي عامين قادرين على أداء مجموعة متنوعة من المهام أصبح وشيكًا.
وأضافت واتسون:"بحلول عام 2026، سنشهد تحول الذكاء الاصطناعي ليصبح أكثر عمومية، حيث سيتمكن من التعامل مع مهام متنوعة تمتد على مدار يوم كامل أو أسبوع، بدلاً من الاكتفاء بمهام قصيرة ومحددة النطاق".
وأشارت إلى أن هذا التطور قد يحمل تأثيرات كبيرة على قطاع الأعمال، إذ يمكن لأنظمة الذكاء الاصطناعي حينها تولي جزء كبير من أعباء العمل الاحترافية، مما قد يؤدي إلى خفض التكاليف، وزيادة الكفاءة، وفي الوقت نفسه إتاحة الفرصة للبشر للتركيز على المهام الإبداعية والاستراتيجية والتفاعلية مع الآخرين.
الذكاء الاصطناعي ينتقل من دور المساعد إلى مدير شخصي موثوق
قالت إلينور واتسون إن الذكاء الاصطناعي، بالنسبة للمستهلكين، سيتطور من مجرد مساعد بسيط إلى مدير شخصي موثوق، قادر على التعامل مع مهام حياتية معقدة، مثل تخطيط السفر، ومراقبة الصحة، وإدارة المحافظ المالية،على مدار أيام أو أسابيع، مع الحاجة إلى إشراف بشري محدود للغاية.وترى أن قدرة أنظمة الذكاء الاصطناعي على تنفيذ مجموعة واسعة من المهام الطويلة قد تُحدث تأثيرًا كبيرًا في طريقة تفاعل المجتمع مع الذكاء الاصطناعي واستخدامه خلال السنوات القليلة المقبلة.
وأضافت: "أن أدوات الذكاء الاصطناعي المتخصصة ستستمر في أداء وظائف معينة بكفاءة ضمن مجالاتها المحددة، إلا أن الوكلاء العامين الأقوياء القادرين على التنقل بمرونة بين مختلف أنواع المهام سيبرزون بقوة.
هذه الأنظمة ستدمج المهارات المتخصصة ضمن سير عمل أوسع موجه نحو الأهداف، مما سيُعيد تشكيل أنماط الحياة اليومية والممارسات المهنية بطرق جوهرية".
لمياء الصديق (أبوظبي)
المصدر: صحيفة الاتحاد
كلمات دلالية: التكنولوجيا المتقدمة العصر الرقمي الذكاء الاصطناعي التقنيات الرقمية أنظمة الذکاء الاصطناعی المهام التی
إقرأ أيضاً:
مخاطر الذكاء الاصطناعي على التعليم والبحث العلمي
يحظى موضوع الذكاء الاصطناعي باهتمام واسع عبر العالم في المناقشات والمنتديات والمجادلات حول الموضوع. ولقد سبق أن تناولت هذا الموضوع في مقالين بهذه الجريدة الرصينة: أحدهما عن الذكاء الاصطناعي والإبداع، والآخر عن الذكاء الاصطناعي والترجمة. ولكن هذا الموضوع يحتمل المزيد من التأملات دائمًا، إذ إن له أبعادًا كثيرةً لا حصر لها؛ ولذلك فإنني أريد في هذا المقال التنويه إلى تأثير الذكاء الاصطناعي على العملية التعليمية والبحث العلمي.
وقد يبدو أن استخدام كلمة «تأثير» أفضل من استخدام كلمة «مخاطر» الواردة في عنوان هذا المقال؛ لأن هذه الكلمة الأخيرة قد لا تبدو محايدة، وإنما تنطوي على حكم مسبق يتخذ موقفًا متحيزًا ضد تقنيات الذكاء الاصطناعي. وهذا تفسير غير صحيح؛ لأن كلمة «مخاطر» تعني أن هناك طريقًا نسير عليه -أو ينبغي أن نسير فيه- ولكنه يكون محفوفًا بالمخاطر التي ينبغي أن ندركها لكي يمكن اجتنابها. فلا مراء في أن الذكاء الاصطناعي يمثل ثورة كبرى في المعرفة البشرية.
هذه الثورة المعرفية تتمثل في القدرة الهائلة للآلة على توفير بيانات ضخمة في أي مجال معرفي، بل يمكن لبرامج هذه الآلة أن تؤلف نصوصًا أو موضوعات بحثية أو تصمم ابتكارات ومخترعات باستخدام هذه البيانات.
ولقد أثمرت هذه الثورة المعرفية بوجه خاص في مجال تطبيقات العلوم الدقيقة، وعلى رأسها الرياضيات البحتة التي تمتد جذورها في النهاية في المنطق الرياضي، كما لاحظ ذلك برتراند رسل بشكل مدهش في مرحلة مبكرة للغاية في كتابه أصول الرياضيات!
ولا شك أيضًا في أن الذكاء الاصطناعي له استخدامات مثمرة في مجال العملية التعليمية، إذ إنه يسهِّل على المعلم والطالب معًا بلوغ المعلومات المهمة والحديثة في مجال الدراسة، ويقدِّم المعلومات للطلبة بطريقة شيقة ويشجعهم على البحث والاستكشاف بأنفسهم.
وهنا على وجه التحديد مكمن المشكلة، فعندما نقول: «إن الذكاء الاصطناعي يشجع الطلبة على البحث والاستكشاف بأنفسهم»، فإننا ينبغي أن نأخذ هذه العبارة بمعناها الدقيق، وهو أن الذكاء الاصطناعي هو ذكاء الآلة، والآلة دائمًا هي أداة للاستخدام، وبالتالي فإنها لا يمكن أن تكون بديلًا لدور المستخدِم الذي يجب أن يقوم بنفسه بالبحث والاستكشاف. وهذا يعني أن سوء استخدام الذكاء الاصطناعي والتعويل عليه في عملية التعلم، سيؤدي إلى القضاء على روح المبادرة والاكتشاف، وسيحول دون تعلم مهارات التفكير الناقد critical thinking وتنميتها من خلال عملية التفاعل المباشر بين الطلبة والمعلم. وتلك كلها مخاطر حقيقية على التعليم.
ولا تقل عن ذلك مخاطر الذكاء الاصطناعي في البحث العلمي الذي يصبح تكريسًا لسوء استخدام هذا الذكاء في مراحل التعليم المختلفة. بل إن المخاطر هنا تصبح أشد وأكثر ضررًا؛ لأنها تتعلق بتكوين باحثين وأساتذة يُرَاد لهم أو يُرجى منهم أن يكونوا علماء حقيقيين في مجالاتهم البحثية المتنوعة. ولعل أشد هذه المخاطر هو شيوع السرقات العلمية من خلال برامج الذكاء الاصطناعي التي تقوم بعملية التأليف من خلال كتابات ودراسات وبحوث منشورة؛ وهو ما قد يشجع الباحث على استخدام المادة المُقدّمة له باعتبارها من تأليفه ودون ذكر للمصادر الأصلية التي استُمدت منها هذه المادة.
حقًّا أن الذكاء الاصطناعي نفسه قد ابتكر برامج لاكتشاف السرقات العلمية (لعل أشهرها برنامج Turnitin)؛ ولكن هذا لا يمنع الباحثين الذين يفتقرون إلى أخلاقيات البحث العلمي من التحايل على مثل هذه البرامج من خلال التمويه، وذلك بتطعيم البحث بمادة موثقة من مصادرها، بحيث يبدو البحث مقبولًا في الحد الأدنى من نسبة الاقتباسات المشروعة! وهذا أمر لا ينتمي إلى البحث العلمي ولا إلى الإبداع والابتكار.
وبصرف النظر عن مسألة السرقات العلمية، فإن الاعتماد على الذكاء الاصطناعي في البحث العلمي له مخاطر أخرى تتمثل في أن المادة المقتبَسة كثيرًا ما تكون مشوهة أو غير دقيقة، وهذا يتبدى -على سبيل المثال- في حالة النصوص المقتبسة المترجَمة التي تقع في أخطاء فادحة وتقدم نصًا مشوهًا لا يفهم مقاصد المؤلف الأصلي، وهذا ما فصلت القول فيه في مقال سابق. وفضلًا عن ذلك، فإن برامج الذكاء الاصطناعي لا تخلو من التحيز (بما في ذلك التحيز السياسي)؛ ببساطة لأنها مبرمَجة من خلال البشر الذين لا يخلون من التحيز في معتقداتهم، وهذا ما يُعرف باسم «الخوارزميات المتحيزة» biased algorithms.
ما يُستفاد من هذا كله هو أن الذكاء الاصطناعي ينبغي الاستعانة به في إطار الوعي بمخاطره؛ ومن ثم بما ينبغي اجتنابه، ولعل هذا ما يمكن تسميته «بأخلاقيات الذكاء الاصطناعي»، وهي أخلاقيات ينبغي أن تَحكم برامج هذا الذكاء مثلما تَحكم المستخدم نفسه.