تمكن باحثون من معهد ماساتشوستس للتكنولوجيا (MIT) وشركة NVIDIA من تطوير أداة جديدة لتوليد الصور تعتمد على الذكاء الاصطناعي، تمتاز بسرعة فائقة وجودة عالية مع استهلاك أقل للطاقة، ويمكن تشغيلها محليًا على أجهزة الحاسوب المحمولة أو الهواتف الذكية.

 

الأداة الجديدة التي تحمل اسم HART (اختصارًا لـ Hybrid Autoregressive Transformer) تمثل دمجًا مبتكرًا بين تقنيتين شائعتين في هذا المجال: النماذج التوليدية التسلسلية (autoregressive) ونماذج الانتشار (diffusion).

حيث تعتمد HART على النموذج التسلسلي لرسم الصورة بشكل سريع وإجمالي، ثم تستخدم نموذج الانتشار صغير الحجم لتوضيح التفاصيل الدقيقة وتحسين جودة الصورة.

 

 

اقرأ أيضاً.. الذكاء الاصطناعي يهدد مستقبل التصوير الفوتوغرافي

 

السرعة والكفاءة



وتتميز HART بقدرتها على إنتاج صور تضاهي أو تتفوق على الصور التي تولدها نماذج الانتشار المتقدمة، لكنها تفعل ذلك بسرعة أكبر بنحو تسع مرات، مع تقليل استهلاك الموارد الحاسوبية بنسبة تصل إلى 31% مقارنةً بأحدث النماذج. ويكفي أن يدخل المستخدم وصفًا نصيًا بسيطًا لتقوم الأداة بتوليد الصورة المطلوبة.


ويُتوقع أن تفتح هذه التقنية آفاقًا واسعة في عدة مجالات، مثل تدريب السيارات الذاتية القيادة في بيئات افتراضية واقعية، وتصميم مشاهد غنية لألعاب الفيديو، وحتى مساعدة الروبوتات على إتمام مهام معقدة في العالم الحقيقي.


يقول الباحث هاوتيان تانغ، المؤلف المشارك في الدراسة: "تمامًا كما يرسم الفنان لوحة من خلال تحديد الشكل العام أولًا، ثم يعود لإضافة التفاصيل الدقيقة بضربات فرشاة صغيرة، هذا ما تفعله HART بالضبط".

 

 

أخبار ذات صلة «AIM للاستثمار» تستشرف مستقبل الذكاء الاصطناعي الذكاء الاصطناعي يتفوق في رصد تشوهات الجنين

تحسين الجودة



وقد واجه الباحثون تحديات أثناء تطوير الأداة، خاصة في كيفية دمج نموذج الانتشار بطريقة تكمّل عمل النموذج التسلسلي دون أن تؤدي إلى تراكم الأخطاء. وخلصوا إلى أن أفضل طريقة هي استخدام نموذج الانتشار فقط في المرحلة النهائية لمعالجة التفاصيل الدقيقة.

ومن أبرز ما يميز HART أنها تعتمد بشكل أساسي على نموذج تسلسلي مشابه للنماذج اللغوية الكبيرة (LLMs) مثل ChatGPT، مما يسهل دمجها مستقبلاً مع نماذج توليدية متعددة الوسائط تجمع بين الرؤية واللغة، وهو ما يمهد الطريق لتطبيقات جديدة مثل شرح خطوات تركيب قطعة أثاث بالصوت والصورة.

 



مستقبل HART



ويطمح الفريق البحثي إلى تطوير HART مستقبلًا ليشمل مجالات أوسع مثل توليد الفيديوهات والتنبؤ بالأصوات، مستفيدين من قابلية الأداة للتوسع والعمل عبر وسائط متعددة.

وقد تم تمويل هذا البحث من قبل عدة جهات منها مختبر MIT-IBM Watson للذكاء الاصطناعي، ومركز MIT وAmazon Science Hub، وبرنامج MIT لتقنيات الذكاء الاصطناعي، ومؤسسة العلوم الوطنية الأمريكية، كما تبرعت NVIDIA بالبنية التحتية اللازمة لتدريب النموذج.

 

إسلام العبادي(أبوظبي)

المصدر: صحيفة الاتحاد

كلمات دلالية: إنفيديا التصوير الذكاء الاصطناعي الذکاء الاصطناعی

إقرأ أيضاً:

واتساب يختبر إنشاء صور الملف الشخصي بالذكاء الاصطناعي

أميرة خالد

بدأ تطبيق المراسلة الشهير «واتساب»، المملوك لشركة «ميتا»، اختبار ميزة جديدة لمستخدمي أجهزة «أندرويد» تتيح إنشاء صور للملف الشخصي باستخدام الذكاء الاصطناعي عبر المساعد الذكي «Meta AI».

وتتيح هذه الخاصية للمستخدمين الذين لديهم إمكانية الوصول إلى مساعد «Meta AI» إنشاء صورة شخصية بناءً على وصف نصي، دون الحاجة لاستخدام صورهم الفعلية.

ووفقًا لموقع «WABetaInfo» المتخصص في أخبار «واتساب»، يمكن للمستخدم إدخال تفاصيل حول الصورة التي يريدها، ليقوم الذكاء الاصطناعي بإنشائها وفقًا للوصف.

وتهدف الميزة إلى توفير خيار جديد للأشخاص الذين لا يفضلون مشاركة صورهم الشخصية، لكنهم يرغبون في صورة مميزة تعبر عنهم.

حاليًا، تتوفر الميزة لعدد محدود من المستخدمين في النسخة التجريبية من التطبيق على «أندرويد»، ومن المتوقع أن يتم توسيع نطاقها تدريجيًا خلال الأسابيع المقبلة.

مقالات مشابهة

  • أبل تطلق ثورة صحية.. طبيب بالذكاء الاصطناعي
  • واتساب يختبر إنشاء صور الملف الشخصي بالذكاء الاصطناعي
  • دراسة: معاقبة الذكاء الاصطناعي لا تمنعه من الكذب والغش وتجعله يبحث عن حيل جديدة
  • هتقلب الموازين ..واتساب تعلن عن ميزة جديدة مدعومة بالذكاء الاصطناعي
  • إعلان بالذكاء الاصطناعي يثير الجدل في مصر
  • استوديو جيبلي وكابوس الذكاء الاصطناعي
  • «ChatGPT» يغير قواعد إنشاء الصور باستخدام الذكاء الاصطناعي
  • أداة جديدة من أمازون مدعومة بالذكاء الاصطناعي
  • صور وفيديوهات تهاني عيد الفطر 2025 بالذكاء الاصطناعي