لجريدة عمان:
2025-03-20@00:19:20 GMT

الصورة في مخيّلة الذكاء الاصطناعي

تاريخ النشر: 27th, January 2024 GMT

يحاول بعضٌ مِنَّا أن يترجم أفكاره إلى صور تفرزها مخيّلته الواسعة، ويحاول البعض -خصوصا في فترة الطفولة- أن يجعل من هذه الأفكار صورا يرسمها على الأوراق البيضاء؛ علّها تسعف خواطره المشدودة إلى أمنيات يتوق إليها أو رغبات يرجوها أن تتحقق؛ فيجد ضالتَه -الممكنة- عبر الإبداع في تحويل هذه المشاعر والأفكار إلى صور -ساكنة- تَعبْر به -في لحظتها- إلى عالَم مفقود يتجسّده الخيال ينشد بواسطته واقعه المفقود.

لم تعدْ هذه الأمنية محصورة على خربشات الأطفال وإبداع الرسامين بل غدا الأمر ممكنا عبر وسائل الذكاء الاصطناعي ونماذجها القادرة على توليد الصور وفقا للطريقة نفسها «الخيال». قبل البدء في تناول موضوع توليد نماذج الذكاء الاصطناعي للصور، ألفت انتباه القارئ أنه سبق أن ناقشنا نماذج الذكاء الاصطناعي التوليدية ومستجداتها في مقالات سابقة كان معظمها مُتعلِّقًا بقدرات هذه النماذج الإنشائية -التنبؤية- للنصوص، وعرضنا آلية عمل هذه النماذج من الناحية الرقمية والتطبيقية مع مقارنات بين أشهر النماذج التوليدية «شات جي بي تي» و«بَارْد»؛ حيث تفاعلنا مع هذه النماذج عبر الحوارات التي آلت إلى فهمٍ أوسعَ لقدرات هذه النماذج وسلوكها فيما يتعلق بإنشاء النصوص الحوارية، ومن المهم أن نذكّرَ بقاعدةٍ أساسيةٍ تعمل عليها خوارزميات نماذج الذكاء الاصطناعي التوليدية مفادها أن آلية العمل الرقمية للنماذج التوليدية تتبنى مبدأ التنبؤ للنص، وتستمر عملية التنبؤ -الأفضل- للكلمة بعد كل كلمة حتى تكتمل عملية إنشاء النص المطلوب، وتتضاعف قدرات هذه النماذج في التنبؤ النصّي بتضاعف عملية التدرّب التي تستمر مع التفاعل البشري وممارسته المستمرة.

أعود إلى موضوعنا الخاص بهذا المقال الذي يتناول قدرات أخرى لنماذج الذكاء الاصطناعي، وهي القدرة على توليد الصور وتخيّلها وفقا للوصف البشري الذي يعين به النموذج التوليدي على التخّيل المناسب للصورة المقترحة، وسيكون التركيز في هذا المقال على أحد أهم أدوات توليد الصور المستعملة في الذكاء الاصطناعي التي تُعرف بـ«دالي» «DALL.E» المندرجة تحت مظلة نموذج «شات جي بي تي 4». سنتطرق إلى تعريف القارئ بهذه الأداة الذكية، وآلية عملها وقدراتها، وعرض التجربة الشخصية بعد استعمال هذه الأداة التي أمكن أن تحدد مفاصل القوة والضعف لديها. أضافت شركة «OpenAI» أداة «دالي» لأول مرة في عام 2021م؛ لتكون ضمن الأدوات الذكية التابعة لـ«شات جي بي تي 4» الذي أُلحِقَت به -مؤخرا- أدوات أخرى بعضها تُعدّ فرعيةً تندرج تحت مظلة الأدوات الرئيسة مثل أداة «دالي»؛ إذ نجد -حتى اللحظة- وجود ما يقرب من اثنتي عشرة أداة فرعية تابعة لأداة «دالي» تتعلق جميعها بالصور وتوليدها -تتشابه في وظائفها التوليدية العامة للصور- وأُخِذَ اسم «دالي DALL.E» من اسم الفنان التشكيلي الأسباني «سلفادور دالي» «Salvador Dali» (1904م- 1989م) الذي يُعدّ علما من أعلام المدرسة السريالية الخاصة بالفنون، وكذلك ارتبط جزءٌ آخر لاسم الأداة من شخصية WALL-E من ابتكار شركة «Pixar» المتخصصة في الإنتاج الفني «الكارتوني» عن طريق الأنظمة الحاسوبية.

من المهم أن نطوفَ -بشكل مختصر- داخل هذه الأداة الذكية؛ لنعرفَ خباياها الرقمية التي تجعل منها أداةً ذكيةً قادرةً على تخيّل الصور وتوليدها. تتبنّى خوارزمية الذكاء الاصطناعي في «دالي» نظامَ التعلّمِ العميق «Deep Learning» الذي يعمل وفق أنظمة رياضية تعينه في أهم مراحله «مرحلة التعلّم أو التدرّب»، وإحدى أهم هذه الأنظمة ما يُعرف بـ«الانتشار الخلفي» «BackPropagation» -الذي سبق تناوله في مقالات سابقة- وكذلك «دالة الكلفة» «Cost Function» التي تُعرف أيضا بـ«دالة الخسارة» «Loss Function» التي تعمل جنبا إلى جنب مع نظام «الانتشار الخلفي»؛ لتقييم قدرة تدرّب الخوارزمية على البيانات المُعطَاة وقياس تناسبها وملاءمتها، وهذه من المبادئ العامّة التي تشترك فيها معظم خوارزميات الذكاء الاصطناعي التي تعتمد على نظام «التعلّم العميق»، وسبق شرحه أيضا في مقالات سابقة. نُقرّب النظرَ في هذا المقال فيما يتعلق بآلية عمل أداة «دالي» التي تكون مرحلة «التدرّب» أولى الأعمال التي تباشرها خوارزمية هذه الأداة وأهمها، وهنا يكون التدرّب على مجموعة كبيرة من الصور المتعددة التي تمنح هذه الأداة القدرة على فهم أنماط متباينة للصور وتخيّل مفاصلها الفنية وفق طريقة تشبه -إلى حد كبير- آلية الدماغ البشري في تخيّل الصور وتوليدها الذهني -يقظة ومناما.

تتكون المنظومة الرقمية الرئيسة في خوارزمية «دالي» من نظام يُعرف بـ«المُشفِّر الآلي» «Auto-encoder» الذي يتفرّع منه نظامان هما: المُشفِّر «Encoder» الذي يعمل على استقبال الصور، وكاسر التشفير «Decoder» الذي يعمل على توليد الصور بعد فك شيفرتها الرقمية، ويمكن تشبيه هذا النظام الرئيس -الذي تعتمد عليه أداة «دالي»- بنظام «المحوِّل» «Transformer» الذي يعمل عليه نموذج «شات جي بي تي» في توليد النصوص- وسبق شرحه في مقال سابق- إلا أنه في مراحل التدرّب عند أداة «دالي»، يتدخل نظام «المحوِّل» الذي يعمل على نقل النص التوصيفي للصور -الذي يصفه الإنسان للنموذج بواسطة النص- فيحوّله إلى مدخل آخر يساعد خوارزمية «دالي» على تخيّل الصور وتوليدها، وهذا ما يفسّر السعة الحاسوبية الكبيرة التي تتطلبها أداة «دالي» مقارنة بالسعة الحاسوبية الأقل المُتطلبة للنموذج التوليدي الخاص بالنصوص. هناك تفاصيل تقنية معقدّة تتعلق بآلية عمل خوارزميات «دالي» وتفرعاتها الرياضية التي لا أرى أن هذا المقال يتسع لتناولها، ولا أرى ضرورةً لسردها؛ إذ يمكن للقارئ -المهتم بهذه التفاصيل- السعي في فهمها عبر المصادر الرقمية المفتوحة والمتعددة، وإنما أردت أن أفتحَ باب التشويق في كشف لثام هذه الأداة التي اكتشفت -عبر تجربتي الشخصية لها- بعضا من زوايا قوتها وضعفها كما سيتضح في السطور الآتية.

لست من هواة الفن والصور -إلى حدِّ الشغف- وارتباطاتها الوظيفية -الرسم والتصوير- وكان استعمالي لأداة «دالي» رغبةً في فهم عمل خوارزمية هذه الأداة، والتأمل في قدرتها على تخيّل الصور وتوليدها؛ فجربت طرقا عدة في التفاعل مع هذه الأداة منها إعطاء وصفٍ -نصّي- باللغتين العربية والإنجليزية لصورٍ تجوب في خاطري أو أستوحيها من محيط بيئتي، وتجربة منح الوصف عموما -لا تفصيل فيه- ومنحه تفصيلا دقيقا للصورة المطلوبة، وطلب تعديل الصور -بعد توليدها- عبر حذفٍ أو إضافةٍ، وخرجت بنتائج أسعفتي في فهم بعضٍ من سلوك خوارزمية هذه الأداة من حيثُ مفاصلُ القوةِ والضعف؛ فوجدت الأداة قادرة -نسبيا- على التفاعل مع النص الواصف للصورة؛ لتحوّل الوصف النصّي إلى صورة تحاكي الصور الواقعية -من حيث جودتها- وتزداد الصورة واقعيةً -في عكسها للصورة المطلوبة- كلما زادت تفاصيل الوصف النصّي، وتقل الواقعية مع الابتعاد عن تقديم التفاصيل الدقيقة والاكتفاء بالوصف -النصّي- العام. تقع كذلك خوارزمية «دالي» في مأزق التحليل غير الدقيق للوصف النصّي -في بعض الحالات- إذ تتجاوز أداة «دالي» -في حالات كثيرة- بعضَ ملامح توصيف الصورة المطلوبة حتى مع الطلبات -المتكررة- للتعديل وتجنب تجاوز هذه الملامح؛ فتظل الخوارزمية عاجزة -في هذه الحالات- عن بلوغ أفضل درجات التفاعل بين النص التوصيفي للصورة وبين الصورة الناتجة من تأويل النص، وهذا ما يمكن اعتباره أمرا واردا عند بداية الطريق لهذه النماذج الرقمية، ويمكن تجاوز مثل هذه التعرجات الرقمية وتحسينها في نسخٍ قادمة لهذه النماذج بعد التطويرات التي ستُمنَحُ لمثل هذه النماذج الذكية، ولا عجب أن نرى ما هو أكثر دهشةً في قادم السنوات المقبلة فيما يتعلق بالثورة الرقمية بما في ذلك توليد الصور الذي سيُحدث نقلة نوعية -مفتوحة للجميع- في تخيّل الصور وتوليدها عبر خوارزميات الذكاء الاصطناعي.

د. معمر بن علي التوبي أكاديمي وباحث عُماني

المصدر: لجريدة عمان

كلمات دلالية: الذکاء الاصطناعی هذه النماذج شات جی بی تی هذه الأداة هذا المقال الذی یعمل النص ی التی ت الذی ی

إقرأ أيضاً:

الذكاء الاصطناعي يساعد في تقيّيم الأدوية الجديدة

توصل معهد «غوستاف روسي» للسرطان إلى أن الذكاء الاصطناعي يسهّل عملية اختيار المشاركين في الدراسات التي تقيّم الأدوية الجديدة، إذ تسهم هذه التكنولوجيا في تحديد المريض المناسب في الوقت المناسب لإجراء أفضل تجربة سريرية.
يعد معهد «غوستاف روسي» للسرطان في باريس أحد مؤسسي شركة «كلينيو» الناشئة التي تشجع على الوصول إلى التجارب السريرية. 
ويقول «أرنو بايل»، أخصائي الأورام بالمعهد: إن «علاجات الأورام تتطور بسرعة كبيرة. المشاركة في تجربة سريرية تُمثل فرصة محتملة للاستفادة من علاج لن يكون متاحا في السوق قبل سنوات».
ونتيجة لنقص المرضى، يتباطأ تطوير الدواء المحتمل أو حتى يتوقف في بعض الأحيان إذا لم يكن من الممكن إجراء الدراسات.
وبحسب الجمعية الفرنسية لشركات الأدوية «ليم»، فإن 85% من التجارب السريرية تواجه تأخيرا مرتبطا بعوائق تحول من دون الاستعانة بالمرضى.
ولحل هذه المشكلة، بدأت شركات الأدوية الكبرى في الدخول في شراكات مع شركات ناشئة تستخدم الذكاء الاصطناعي لتوجيه المرضى إلى التجارب التي تناسبهم بشكل أفضل.
تعتمد الشركتان الفرنسيتان «كلينيو» و«باتلينك» على قواعد بيانات رسمية متنوعة تحصي مختلف التجارب السريرية.
وتعمل خوارزميات الذكاء الاصطناعي على تنظيف هذه البيانات المحدثة تلقائيا وتنظيمها ومراجعتها لتقديم تجارب للمرضى تتوافق مع احتياجاتهم.
بشكل عام، لا تتاح للمريض فرصة الانضمام إلى تجربة سريرية إلا إذا كانت مفتوحة في المركز الاستشفائي الذي يتابع حالته، وغالبا في المدن الكبيرة.
ويُنظر إلى الذكاء الاصطناعي باعتباره وسيلة لتعميم الوصول إلى التجارب السريرية، بغض النظر عن مكان الإقامة، ولكنه يساهم أيضا في تمثيل أفضل للتنوع في هذه التجارب.
بدلا من البدء بدراسة ثم البحث عن مريض، وهو ما يحدث عادة، «نبدأ بمريض ثم نجد بسهولة الدراسة التي تناسبه»، على ما توضح رئيسة شركة «باتلينك» إليز خالقي.
وتوضح إليز خالقي «إنها في الأساس أداة مطابقة» تعتمد على البيانات المتعلقة بوضع المريض الصحي وعمره وموقعه.
كما أضافت خالقي «يولّد الذكاء الاصطناعي أسئلة تلقائية استنادا إلى كل معايير الإدراج والاستبعاد للدراسات السريرية» في مختلف أنحاء العالم.
وأكدت خالقي أن «هذه التقنية تسهم أيضا في ترجمة النصوص العلمية، التي تُعد الإنجليزية هي لغتها المرجعية، وتجعلها «أكثر قابلية للفهم بالنسبة للمرضى».

أخبار ذات صلة المجلس الرمضاني العلمي يناقش «الذكاء الاصطناعي إلى أين؟» استطلاع جديد يكشف: الذكاء الاصطناعي العام بعيد المنال

مقالات مشابهة

  • طحنون بن زايد يبحث مع رئيس «أوراكل» آخر تطورات الذكاء الاصطناعي والتكنولوجيا المتقدمة
  • طحنون بن زايد يبحث مع رئيس «أوراكل» في واشنطن آخر تطورات الذكاء الاصطناعي والتكنولوجيا المتقدمة
  • الذكاء الاصطناعي يرعى المسنين في الصين
  • «الإمارات العلمي» ينظم «الذكاء الاصطناعي إلى أين؟»
  • الذكاء الاصطناعي يساعد في تقيّيم الأدوية الجديدة
  • كيف يمكن للمصور أن يلتقط صورا تبقى في الذاكرة وتؤثر في الوعي الجماعي واتخاذ القرار؟!
  • مايكروسوفت تعمل على جلب ميزة تلخيص النص بالذكاء الاصطناعي إلى تطبيق المفكرة
  • سحر Gemini.. الذكاء الاصطناعي لجوجل يزيل العلامات المائية من الصور
  • الصدر يعلق على استخدام الذكاء الاصطناعي
  • الذكاء الاصطناعي يفك لغزاً علمياً استعصى على العلماء لعقد كامل