لجريدة عمان:
2024-11-08@20:42:52 GMT

الصورة في مخيّلة الذكاء الاصطناعي

تاريخ النشر: 27th, January 2024 GMT

يحاول بعضٌ مِنَّا أن يترجم أفكاره إلى صور تفرزها مخيّلته الواسعة، ويحاول البعض -خصوصا في فترة الطفولة- أن يجعل من هذه الأفكار صورا يرسمها على الأوراق البيضاء؛ علّها تسعف خواطره المشدودة إلى أمنيات يتوق إليها أو رغبات يرجوها أن تتحقق؛ فيجد ضالتَه -الممكنة- عبر الإبداع في تحويل هذه المشاعر والأفكار إلى صور -ساكنة- تَعبْر به -في لحظتها- إلى عالَم مفقود يتجسّده الخيال ينشد بواسطته واقعه المفقود.

لم تعدْ هذه الأمنية محصورة على خربشات الأطفال وإبداع الرسامين بل غدا الأمر ممكنا عبر وسائل الذكاء الاصطناعي ونماذجها القادرة على توليد الصور وفقا للطريقة نفسها «الخيال». قبل البدء في تناول موضوع توليد نماذج الذكاء الاصطناعي للصور، ألفت انتباه القارئ أنه سبق أن ناقشنا نماذج الذكاء الاصطناعي التوليدية ومستجداتها في مقالات سابقة كان معظمها مُتعلِّقًا بقدرات هذه النماذج الإنشائية -التنبؤية- للنصوص، وعرضنا آلية عمل هذه النماذج من الناحية الرقمية والتطبيقية مع مقارنات بين أشهر النماذج التوليدية «شات جي بي تي» و«بَارْد»؛ حيث تفاعلنا مع هذه النماذج عبر الحوارات التي آلت إلى فهمٍ أوسعَ لقدرات هذه النماذج وسلوكها فيما يتعلق بإنشاء النصوص الحوارية، ومن المهم أن نذكّرَ بقاعدةٍ أساسيةٍ تعمل عليها خوارزميات نماذج الذكاء الاصطناعي التوليدية مفادها أن آلية العمل الرقمية للنماذج التوليدية تتبنى مبدأ التنبؤ للنص، وتستمر عملية التنبؤ -الأفضل- للكلمة بعد كل كلمة حتى تكتمل عملية إنشاء النص المطلوب، وتتضاعف قدرات هذه النماذج في التنبؤ النصّي بتضاعف عملية التدرّب التي تستمر مع التفاعل البشري وممارسته المستمرة.

أعود إلى موضوعنا الخاص بهذا المقال الذي يتناول قدرات أخرى لنماذج الذكاء الاصطناعي، وهي القدرة على توليد الصور وتخيّلها وفقا للوصف البشري الذي يعين به النموذج التوليدي على التخّيل المناسب للصورة المقترحة، وسيكون التركيز في هذا المقال على أحد أهم أدوات توليد الصور المستعملة في الذكاء الاصطناعي التي تُعرف بـ«دالي» «DALL.E» المندرجة تحت مظلة نموذج «شات جي بي تي 4». سنتطرق إلى تعريف القارئ بهذه الأداة الذكية، وآلية عملها وقدراتها، وعرض التجربة الشخصية بعد استعمال هذه الأداة التي أمكن أن تحدد مفاصل القوة والضعف لديها. أضافت شركة «OpenAI» أداة «دالي» لأول مرة في عام 2021م؛ لتكون ضمن الأدوات الذكية التابعة لـ«شات جي بي تي 4» الذي أُلحِقَت به -مؤخرا- أدوات أخرى بعضها تُعدّ فرعيةً تندرج تحت مظلة الأدوات الرئيسة مثل أداة «دالي»؛ إذ نجد -حتى اللحظة- وجود ما يقرب من اثنتي عشرة أداة فرعية تابعة لأداة «دالي» تتعلق جميعها بالصور وتوليدها -تتشابه في وظائفها التوليدية العامة للصور- وأُخِذَ اسم «دالي DALL.E» من اسم الفنان التشكيلي الأسباني «سلفادور دالي» «Salvador Dali» (1904م- 1989م) الذي يُعدّ علما من أعلام المدرسة السريالية الخاصة بالفنون، وكذلك ارتبط جزءٌ آخر لاسم الأداة من شخصية WALL-E من ابتكار شركة «Pixar» المتخصصة في الإنتاج الفني «الكارتوني» عن طريق الأنظمة الحاسوبية.

من المهم أن نطوفَ -بشكل مختصر- داخل هذه الأداة الذكية؛ لنعرفَ خباياها الرقمية التي تجعل منها أداةً ذكيةً قادرةً على تخيّل الصور وتوليدها. تتبنّى خوارزمية الذكاء الاصطناعي في «دالي» نظامَ التعلّمِ العميق «Deep Learning» الذي يعمل وفق أنظمة رياضية تعينه في أهم مراحله «مرحلة التعلّم أو التدرّب»، وإحدى أهم هذه الأنظمة ما يُعرف بـ«الانتشار الخلفي» «BackPropagation» -الذي سبق تناوله في مقالات سابقة- وكذلك «دالة الكلفة» «Cost Function» التي تُعرف أيضا بـ«دالة الخسارة» «Loss Function» التي تعمل جنبا إلى جنب مع نظام «الانتشار الخلفي»؛ لتقييم قدرة تدرّب الخوارزمية على البيانات المُعطَاة وقياس تناسبها وملاءمتها، وهذه من المبادئ العامّة التي تشترك فيها معظم خوارزميات الذكاء الاصطناعي التي تعتمد على نظام «التعلّم العميق»، وسبق شرحه أيضا في مقالات سابقة. نُقرّب النظرَ في هذا المقال فيما يتعلق بآلية عمل أداة «دالي» التي تكون مرحلة «التدرّب» أولى الأعمال التي تباشرها خوارزمية هذه الأداة وأهمها، وهنا يكون التدرّب على مجموعة كبيرة من الصور المتعددة التي تمنح هذه الأداة القدرة على فهم أنماط متباينة للصور وتخيّل مفاصلها الفنية وفق طريقة تشبه -إلى حد كبير- آلية الدماغ البشري في تخيّل الصور وتوليدها الذهني -يقظة ومناما.

تتكون المنظومة الرقمية الرئيسة في خوارزمية «دالي» من نظام يُعرف بـ«المُشفِّر الآلي» «Auto-encoder» الذي يتفرّع منه نظامان هما: المُشفِّر «Encoder» الذي يعمل على استقبال الصور، وكاسر التشفير «Decoder» الذي يعمل على توليد الصور بعد فك شيفرتها الرقمية، ويمكن تشبيه هذا النظام الرئيس -الذي تعتمد عليه أداة «دالي»- بنظام «المحوِّل» «Transformer» الذي يعمل عليه نموذج «شات جي بي تي» في توليد النصوص- وسبق شرحه في مقال سابق- إلا أنه في مراحل التدرّب عند أداة «دالي»، يتدخل نظام «المحوِّل» الذي يعمل على نقل النص التوصيفي للصور -الذي يصفه الإنسان للنموذج بواسطة النص- فيحوّله إلى مدخل آخر يساعد خوارزمية «دالي» على تخيّل الصور وتوليدها، وهذا ما يفسّر السعة الحاسوبية الكبيرة التي تتطلبها أداة «دالي» مقارنة بالسعة الحاسوبية الأقل المُتطلبة للنموذج التوليدي الخاص بالنصوص. هناك تفاصيل تقنية معقدّة تتعلق بآلية عمل خوارزميات «دالي» وتفرعاتها الرياضية التي لا أرى أن هذا المقال يتسع لتناولها، ولا أرى ضرورةً لسردها؛ إذ يمكن للقارئ -المهتم بهذه التفاصيل- السعي في فهمها عبر المصادر الرقمية المفتوحة والمتعددة، وإنما أردت أن أفتحَ باب التشويق في كشف لثام هذه الأداة التي اكتشفت -عبر تجربتي الشخصية لها- بعضا من زوايا قوتها وضعفها كما سيتضح في السطور الآتية.

لست من هواة الفن والصور -إلى حدِّ الشغف- وارتباطاتها الوظيفية -الرسم والتصوير- وكان استعمالي لأداة «دالي» رغبةً في فهم عمل خوارزمية هذه الأداة، والتأمل في قدرتها على تخيّل الصور وتوليدها؛ فجربت طرقا عدة في التفاعل مع هذه الأداة منها إعطاء وصفٍ -نصّي- باللغتين العربية والإنجليزية لصورٍ تجوب في خاطري أو أستوحيها من محيط بيئتي، وتجربة منح الوصف عموما -لا تفصيل فيه- ومنحه تفصيلا دقيقا للصورة المطلوبة، وطلب تعديل الصور -بعد توليدها- عبر حذفٍ أو إضافةٍ، وخرجت بنتائج أسعفتي في فهم بعضٍ من سلوك خوارزمية هذه الأداة من حيثُ مفاصلُ القوةِ والضعف؛ فوجدت الأداة قادرة -نسبيا- على التفاعل مع النص الواصف للصورة؛ لتحوّل الوصف النصّي إلى صورة تحاكي الصور الواقعية -من حيث جودتها- وتزداد الصورة واقعيةً -في عكسها للصورة المطلوبة- كلما زادت تفاصيل الوصف النصّي، وتقل الواقعية مع الابتعاد عن تقديم التفاصيل الدقيقة والاكتفاء بالوصف -النصّي- العام. تقع كذلك خوارزمية «دالي» في مأزق التحليل غير الدقيق للوصف النصّي -في بعض الحالات- إذ تتجاوز أداة «دالي» -في حالات كثيرة- بعضَ ملامح توصيف الصورة المطلوبة حتى مع الطلبات -المتكررة- للتعديل وتجنب تجاوز هذه الملامح؛ فتظل الخوارزمية عاجزة -في هذه الحالات- عن بلوغ أفضل درجات التفاعل بين النص التوصيفي للصورة وبين الصورة الناتجة من تأويل النص، وهذا ما يمكن اعتباره أمرا واردا عند بداية الطريق لهذه النماذج الرقمية، ويمكن تجاوز مثل هذه التعرجات الرقمية وتحسينها في نسخٍ قادمة لهذه النماذج بعد التطويرات التي ستُمنَحُ لمثل هذه النماذج الذكية، ولا عجب أن نرى ما هو أكثر دهشةً في قادم السنوات المقبلة فيما يتعلق بالثورة الرقمية بما في ذلك توليد الصور الذي سيُحدث نقلة نوعية -مفتوحة للجميع- في تخيّل الصور وتوليدها عبر خوارزميات الذكاء الاصطناعي.

د. معمر بن علي التوبي أكاديمي وباحث عُماني

المصدر: لجريدة عمان

كلمات دلالية: الذکاء الاصطناعی هذه النماذج شات جی بی تی هذه الأداة هذا المقال الذی یعمل النص ی التی ت الذی ی

إقرأ أيضاً:

"دبي للسلع المتعددة" يتعاون مع "آي بي إم" لتعزيز قطاع الذكاء الاصطناعي

أعلن مركز دبي للسلع المتعددة، انضمام شركة "آي بي إم للاستشارات" شريكاً لمركز الذكاء الاصطناعي.

وبموجب الشراكة، ستتعاون شركة "آي بي إم للاستشارات" مع مركز دبي للسلع المتعددة في بحث العديد من مجالات التعاون، بهدف دعم نمو قطاع الذكاء الاصطناعي في إمارة دبي.
ويشمل التعاون تعزيز المحتوى الفكري، وتقديم التوجيهات الإرشادية وتنظيم الندوات التعليمية، وغيرها من المؤتمرات المتخصصة، وفعاليات الابتكار التنافسي "الهاكاثون"، والعديد من المبادرات الأخرى.
ويتيح مركز الذكاء الاصطناعي بالتعاون مع مجموعة من الشركاء، للشركات الوصول إلى تقنيات الذكاء الاصطناعي، وتطوير البرمجيات والتطبيقات المخصصة المعززة بالذكاء الاصطناعي، إلى جانب برامج المسرعات وفرص دخول الأسواق.
ونجح المركز، منذ إطلاقه خلال شهر سبتمبر (أيلول) الماضي، في جذب واستقطاب نحو 60 شركة متخصصة في الذكاء الاصطناعي، ما يجعله أحد أبرز الوجهات للشركات المتخصصة في مجال الذكاء الاصطناعي، والتي تتطلع إلى توسيع نطاق أعمالها دولياً انطلاقاً من إمارة دبي.

نمو اقتصادي

وقال أحمد حمزة، المدير التنفيذي للمنطقة الحرة التابعة لمركز دبي للسلع المتعددة، إن الجهود المبذولة في تطوير التطبيقات العملية للذكاء الاصطناعي تعد أحد الأهداف الأساسية لمركز الذكاء الاصطناعي، حيث يمكن تحقيق مكاسب شاملة وقيمة ملموسة عبر تعزيز الاعتماد على حلول الذكاء الاصطناعي.
وأضاف:"تُشير التقديرات أن الذكاء الاصطناعي سيسهم في تحقيق نمو اقتصادي يصل إلى 15 تريليون دولار بحلول عام 2030، ونحن لدينا قناعة راسخة بأن يكون الذكاء الاصطناعي رافداً رئيسياً لدعم النمو الاقتصادي العالمي، ومن هنا تبرز أهمية شراكاتنا الجديدة مع "آي بي إم للاستشارات"، والتي ستضيف قيمة كبيرة إلى المركز".
وبدوره، قال بيل فاريل، الشريك الإداري لمنطقة الشرق الأوسط وأفريقيا لدى شركة "آي بي إم للاستشارات": "لا يمكننا إغفال الفرص الهائلة التي يوفرها الذكاء الاصطناعي، خصوصاً في دبي، وتُعد المنظومات الرئيسية والحيوية، مثل مركز الذكاء الاصطناعي في مركز دبي للسلع المتعددة، محاور ارتكاز أساسية لدفع عجلة الابتكار في مجال الذكاء الاصطناعي، مما يسمح لنا بالتعاون في مجموعة واسعة من الحلول التقنية الناشئة".

مقالات مشابهة

  • تزويد Notepad من مايكروسوفت بالذكاء الاصطناعي
  • (غوغل) تطلق أداة جديدة لإنشاء مقاطع فيديو احترافية بسهولة
  • جوجل تطلق أداة جديدة لصناعة الفيديوهات المدعومة بالذكاء الاصطناعي
  • الذكاء الاصطناعي.. هل هو أداة لتحرير البشرية أم تهديد لوجودها؟ تقرير
  • عباس أبو الحسن يثير الهلع بين جمهوره بشأن الذكاء الاصطناعي
  • شراكة بين مركز الذكاء الاصطناعي التابع لـ «دبي للسلع» و«آي بي إم للاستشارات»
  • وزير السياحة: قوة تعلم آلة الذكاء الاصطناعي عظيمة وهذه التحديات التي تواجهنا
  • "دبي للسلع المتعددة" يتعاون مع "آي بي إم" لتعزيز قطاع الذكاء الاصطناعي
  • واتساب يتيح التحقق من الصور المزيفة بإضافة ميزة جديدة.. تعرف على الطريقة
  • مدبولي: الذكاء الاصطناعي هو الحاضر