لجريدة عمان:
2025-05-02@07:34:59 GMT

الذكاء الاصطناعي يسعى إلى فهم العالم

تاريخ النشر: 14th, January 2025 GMT

اللغة مليئة بالأقوال المأثورة التي لها صلة بالرؤية مثل: مَن سَمِع ليس كمن رأى، والصورة تساوي ألف كلمة، وبعيد عن العين بعيد عن البال... والقائمة تطول.

السبب وراء ذلك أن البشر يستمدُّون الكثير من المعاني والفهم من أبصارهم. لكن الرؤية لم تكن دائما ممكنة. فحتى قبل حوالي 540 مليون سنة عاشت كل الكائنات العضوية تحت سطح الماء ولم يكن باستطاعة أي منها رؤية الأشياء.

فقط مع ظهور «ثلاثيات الفصوص» صار من الممكن للحيوانات ولأول مرة إدراك وفرة ضوء الشمس حولها.

ما أعقب ذلك كان لافتا. فخلال الفترة التالية التي تراوحت بين 10 ملايين إلى 15 مليون سنة دشَّنت القدرةُ على الإبصار حقبةً تعرف باسم الانفجار «الكامبري». وهي المرحلة التي ظهر فيها أسلاف معظم الحيوانات الحديثة.

أما اليوم فنحن نعيش انفجارا كامبريا معاصرا في الذكاء الاصطناعي. إذ يبدو كأنَّ أداةً جديدة محيرة للعقل تصبح متاحة كل أسبوع.

في البداية كانت وراء ثورةِ الذكاء الاصطناعي التوليدي نماذجُ اللغة الكبيرة مثل «شات جي بي تي» والذي يقلد الذكاء اللفظي للبشر. لكني أعتقد أن الذكاء الذي يرتكز على الرؤية أو ما أسميه الذكاء المكاني هو الأكثر أهمية. اللغة مهمة. غير أن قدرتنا كبشر على إدراك العالم والتفاعل معه ترتكز في معظمها على ما نراه.

منذ فترة طويلة سعى حقل فرعي للذكاء الاصطناعي يُعرف بالرؤية الحاسوبية إلى تعليم الحواسيب على اكتساب نفس الذكاء المكاني الذي لدى البشر أو أفضل منه. حقق هذا الحقل تقدما سريعا خلال فترة الـ15 عاما الماضية. واسترشادا مني باعتقادٍ جوهري وهو وجوب أن تكون منفعة البشر هي الغاية المركزية من تطوير الذكاء الاصطناعي كرستُ مساري المهني له.

الطفل لا يعلِّمه أحد على الرؤية. يَعْقَل الأطفالُ العالمَ من خلال التجارب والأمثال. وعيونهم مثل الكاميرات البيولوجية تلتقط «الصورة» خمس مرات في الثانية. وفي سن الثالثة يكون الطفل قد شاهد مئات الملايين من مثل هذه الصور.

نحن نعلم من خلال عقود من الأبحاث أن التعرُّف على الأشياء عنصر أساسي للرؤية. لذلك بدأنا تعليم الحواسيب هذه القدرة. ولم يكن هذا أمرا يسيرا. هنالك طرق لا نهائية لتحويل صورة ثلاثية الأبعاد للقطَّة مثلا إلى صورة ثنائية الأبعاد وذلك اعتمادا على زاوية الرؤية ووضعية الجسم والخلفية وتفاصيل أخرى. ولكي يتعرف الحاسوب على القطة في صورة ما يحتاج إلى الكثير من المعلومات مثلما هي الحال مع الطفل.

لم يكن ذلك ممكنا إلى أن اجتمعت معا ثلاثة عناصر في منتصف العشرية الأولى من هذا القرن. ففي تلك اللحظة الحاسمة للذكاء الاصطناعي اقترنت خوارزميات تُعرف باسم الشبكات العصبية الالتفافية وكانت موجودة منذ عقود بكل من وحدات معالجة الرسومات الحديثة والبيانات الكبيرة المتمثلة في بلايين الصور من الإنترنت والكاميرات الرقمية وما إلى ذلك. (الشبكات العصبية تعمل مثل الدماغ البشري. وهي قادرة على التعرُّف على خصائص الصور التي تحصل عليها من البيانات الكبيرة. تساعدها في ذلك وحدات معالجة الرسومات الحديثة التي تتيح للحاسوب معالجة متزامنة وبسرعة عالية للمعلومات الكثيرة عن الصور - المترجم).

ساهم مختبرنا بعنصر «البيانات الكبيرة» في الاقتران بين هذه العناصر الثلاثة. ففي عام 2007 وفي مشروع تحت اسم «إميدْج نَيت» أو شبكة الصور أوجدنا قاعدة بيانات لحوالي 15 مليون صورة مُعلَّمة عبر 22000 فئة تصنيفية للأشياء. ثم شرعنا نحن وباحثون آخرون في تدريب نماذج شبكة عصبية باستخدام الصور وعلاماتها النصية. تعلمت هذه النماذج وصف صور لم تُشاهَد من قبل باستخدام جمل بسيطة. وعلى غير المتوقع، ساعد التقدم السريع في أنظمة التعرف على الصور والتي أوجدناها باستخدام قاعدة بيانات «إميدج نيت» في إطلاق ازدهار الذكاء الاصطناعي الحديث.

مع تقدم التقنية دشنت نماذجٌ توليدية جديدة أدواتِ الذكاء الاصطناعي التوليدي. في مجال اللغة أتاح ذلك إيجاد الدردشات الآلية مثل «شات جي بي تي». أما في جانب الرؤية فالأنظمة الحديثة لا تتعرف على الصور والفيديوهات فقط بل يمكنها أيضا توليدها استجابةً لأوامر نصية. والنتائج التي تحققها مثيرة للإعجاب. لكنها لا تزال ذات بُعدين.

لكي تحصل الحواسيب على الذكاء المكاني للبشر يجب أن يكون بمقدورها نَمْذَجَة العالم وتعقُّل الأشياء والأماكن والتفاعل في كل من الزمن والحيِّز ثلاثي الأبعاد. باختصار نحن بحاجة إلى الانتقال من نماذج اللغة الكبيرة إلى نماذج العالم الكبيرة.

بدأنا نشهد «ومضات» من هذا في المختبرات الأكاديمية والصناعية. ومع أحدث نماذج الذكاء الاصطناعي المدربة باستخدام النصوص والصور وأفلام الفيديو والبيانات المكانية من المجسَّات (المستشعرات) والمشغِّلات (العضلات) الروبوتية يمكننا السيطرة على الروبوتات باستخدام الأوامر النصية كأن نطلب منها مثلا فصل الهاتف من الشاحن أو إعداد ساندويتش بسيط. أو يمكن للنموذج بإعطائه صورة ذات بعدين تحويلها إلى عدد لانهائي من صور أمكنة ثلاثية الأبعاد.

تطبيقات هذه التقنية لا نهاية لها. لكم أن تتخيلوا روبوتات يمكنها التنقل في منازل عادية لرعاية كبار السن ومجموعة من الأيدي الروبوتية التي لا تتعب وهي تعاون طبيبا جراحا أو تُستخدَم في التشبيه والتدريب والتعليم. هذا حقا ذكاء اصطناعي يتمركز حول البشر. والذكاء المكاني هو المجال التالي لانطلاقه. ما استغرق مئات الملايين من السنوات لكي يتجلَّى في عقول البشر يحتاج إلى سنوات فقط لكي يظهر في الحواسيب. ونحن البشر سنكون المستفيدين.

فَي- فَي لِي المديرة المشاركة لمبادرة الذكاء الاصطناعي الذي يتمحور حول الإنسان (إتش أيه آي) بجامعة ستانفورد والرئيسة التنفيذية لشركة ويرلد لابس (مختبرات العالم)

عن الإيكونومست

المصدر: لجريدة عمان

كلمات دلالية: الذکاء الاصطناعی

إقرأ أيضاً:

مايكروسوفت.. نماذج صغيرة تنافس عمالقة الذكاء الاصطناعي

في سباق متسارع  في مشهد الذكاء الاصطناعي، أعلنت مايكروسوفت عن مجموعة جديدة من نماذج الذكاء الاصطناعي تحت اسم Phi 4، والتي تتميز بحجمها الصغير وأدائها القوي، لتنافس نماذج أكبر وأكثر شهرة مثل o3-mini من OpenAI.وفق موقع "تك كرانش" التقني.

من خلال Phi 4، تضع مايكروسوفت نفسها في موقع المنافسة المباشرة مع عمالقة القطاع، مقدمة نماذج مفتوحة المصدر يمكنها التعامل مع مهام معقدة كحل المسائل الرياضية، البرمجة، وتحليل البيانات، وكل ذلك بكفاءة تضاهي نماذج أضخم وأكثر تعقيدًا.

اقرأ أيضاً.. مايكروسوفت".. قصة نجاح من الحوسبة إلى الذكاء الاصطناعي والسحابة
أكدت مايكروسوفت أنها اعتمدت في تطوير هذه النماذج الجديدة على أساليب تدريب عصرية وتقنيات متطورة مثل "التعلم المعزز" و"التقطير المعرفي"، لضمان الحصول على أداء قوي بالرغم  من الحجم الصغير نسبيًا. وأوضحت الشركة أن هدفها الأساسي هو توفير ذكاء اصطناعي قوي حتى للأجهزة التي لا تتمتع بمواصفات تقنية عالية، ما يسمح باستخدامه في بيئات تحتاج إلى رد فعل سريع، مثل الأجهزة المحمولة وتطبيقات إنترنت الأشياء (IoT).

3 نماذج رئيسية:

Phi 4 reasoning plus وPhi 4 reasonin و Phi 4 mini reasonin ..جميع هذه النماذج مصنفة ضمن نماذج "الاستدلال" (Reasoning)، والتي تركز على التحقق الدقيق من صحة الحلول للمسائل المعقدة، وهو ما يجعلها مثالية لمهام تتعلق بالرياضيات، العلوم، والبرمجة.

أخبار ذات صلة جناح «تريندز» في «أبوظبي للكتاب» يناقش الثقافة والذكاء الاصطناعي ويطلق كتابين أكاديمية الفضاء الوطنية تعلن عن الدفعة الثانية من مسار «التطبيقات الفضائية»


تم تدريب Phi 4 mini reasoning  كمساعد تعليمي ذكي على مليون مسألة رياضية اصطناعية باستخدام نموذج R1 من شركة DeepSeek الصينية.. ويقدم أدوات تعليمية مثل التدريس التفاعلي على أجهزة خفيفة الوزن، ويتميز بأداء عالي رغم الحجم الصغير.
Phi 4 reasoning: النموذج الثاني في السلسلة يضم 14 مليار معلمة، وتم تدريبه على بيانات ويب عالية الجودة إلى جانب عروض مختارة من نموذج o3-mini. يقدم حلولاً في مسائل الرياضيات، البرمجة، والعلوم كما يتميز بأداء متفوق في المجالات التقنية المعقدة.
Phi 4 reasoning plus:  نموذج يتميز بدقة تضاهي النماذج العملاقة هذا النموذج هو نسخة مطورة من Phi-4 الأصلي، مُهيأ ليحقق دقة أعلى في مهام محددة. يُقارب أداء نموذج R1 (رغم أن الأخير يحتوي على 671 مليار معلمة).في الاختبارات: تساوى تقريبًا مع o3-mini في اختبار OmniMath  ويمتاز بقوة أداء هائلة مقابل حجم أصغر.


لماذا هذه النماذج مهمة؟
عائلة Phi تقدم لمطوري التطبيقات أدوات ذكاء اصطناعي قوية بحجم صغير، مناسبة لتطبيقات الحوسبة على الحافة (Edge AI) — أي التطبيقات التي تعمل على الأجهزة مباشرة من دون الحاجة لخوادم ضخمة.
تهدف مايكروسوفت، من خلال هذه النماذج إلى تمكين المطورين من بناء تطبيقات أسرع، وأخف، وأكثر ذكاءً.

مع إطلاق نماذج Phi 4 الجديدة، تثبت مايكروسوفت أنها ماضية بقوة نحو إعادة تشكيل مشهد الذكاء الاصطناعي، ليس فقط من حيث الأداء، بل من خلال تقديم حلول عملية تناسب احتياجات المطورين والتطبيقات الحديثة.

وبينما يواصل الذكاء الاصطناعي التوليدي لعب دور أكبر في التعليم، البرمجة، والأعمال، فمن المتوقع أن تصبح نماذج مثل Phi 4 جزءًا أساسيًا من الأدوات المستخدمة لتطوير تطبيقات ذكية تعمل بكفاءة وسرعة على الأجهزة الطرفية. هذه الخطوة قد تفتح الباب أمام موجة جديدة من الابتكار.

ومع توافر هذه النماذج عبر منصة Hugging Face، فإن الطريق أصبح ممهدًا أمام مجتمع المطورين لاستكشاف إمكانياتها، وتوظيفها لبناء الجيل القادم من التطبيقات الذكية.

لمياء الصديق (أبوظبي)

مقالات مشابهة

  • جوجل تتيح ميزة تعديل الصور بالذكاء الاصطناعي في Gemini
  • تقني يوضح كيف يستفيد الكفيف من تقنيات الذكاء الاصطناعي؟ ..فيديو
  • ويكيبيديا تدخل عصر الذكاء الاصطناعي دون الاستغناء عن المحررين
  • مايكروسوفت.. نماذج صغيرة تنافس عمالقة الذكاء الاصطناعي
  • ديباك شوبرا: الذكاء الاصطناعي أداة لاكتشاف الذات
  • خبراء يحذِّرون: الذكاء الاصطناعي يجعل البشر أغبياء
  • اشتعلت حرب الذكاء الاصطناعي بين الصين وأميركا: من يكسب المعركة؟
  • مخاطر الذكاء الاصطناعي على التعليم والبحث العلمي
  • أشرف زكي: هناك بعض الصور التي لا نرضى عنها جميعا في تغطية الجنازات
  • كانت معدّة للتهريب.. شاهدوا كميات البنزين الكبيرة التي تم ضبطها في عكار (صورة)