ثورة في توليد الصور بالذكاء الاصطناعي.. أداة جديدة أسرع 9 مرات وتعمل على هاتفك
تاريخ النشر: 29th, March 2025 GMT
تمكن باحثون من معهد ماساتشوستس للتكنولوجيا (MIT) وشركة NVIDIA من تطوير أداة جديدة لتوليد الصور تعتمد على الذكاء الاصطناعي، تمتاز بسرعة فائقة وجودة عالية مع استهلاك أقل للطاقة، ويمكن تشغيلها محليًا على أجهزة الحاسوب المحمولة أو الهواتف الذكية.
الأداة الجديدة التي تحمل اسم HART (اختصارًا لـ Hybrid Autoregressive Transformer) تمثل دمجًا مبتكرًا بين تقنيتين شائعتين في هذا المجال: النماذج التوليدية التسلسلية (autoregressive) ونماذج الانتشار (diffusion).
اقرأ أيضاً.. الذكاء الاصطناعي يهدد مستقبل التصوير الفوتوغرافي
السرعة والكفاءة
وتتميز HART بقدرتها على إنتاج صور تضاهي أو تتفوق على الصور التي تولدها نماذج الانتشار المتقدمة، لكنها تفعل ذلك بسرعة أكبر بنحو تسع مرات، مع تقليل استهلاك الموارد الحاسوبية بنسبة تصل إلى 31% مقارنةً بأحدث النماذج. ويكفي أن يدخل المستخدم وصفًا نصيًا بسيطًا لتقوم الأداة بتوليد الصورة المطلوبة.
ويُتوقع أن تفتح هذه التقنية آفاقًا واسعة في عدة مجالات، مثل تدريب السيارات الذاتية القيادة في بيئات افتراضية واقعية، وتصميم مشاهد غنية لألعاب الفيديو، وحتى مساعدة الروبوتات على إتمام مهام معقدة في العالم الحقيقي.
يقول الباحث هاوتيان تانغ، المؤلف المشارك في الدراسة: "تمامًا كما يرسم الفنان لوحة من خلال تحديد الشكل العام أولًا، ثم يعود لإضافة التفاصيل الدقيقة بضربات فرشاة صغيرة، هذا ما تفعله HART بالضبط".
أخبار ذات صلة
تحسين الجودة
وقد واجه الباحثون تحديات أثناء تطوير الأداة، خاصة في كيفية دمج نموذج الانتشار بطريقة تكمّل عمل النموذج التسلسلي دون أن تؤدي إلى تراكم الأخطاء. وخلصوا إلى أن أفضل طريقة هي استخدام نموذج الانتشار فقط في المرحلة النهائية لمعالجة التفاصيل الدقيقة.
ومن أبرز ما يميز HART أنها تعتمد بشكل أساسي على نموذج تسلسلي مشابه للنماذج اللغوية الكبيرة (LLMs) مثل ChatGPT، مما يسهل دمجها مستقبلاً مع نماذج توليدية متعددة الوسائط تجمع بين الرؤية واللغة، وهو ما يمهد الطريق لتطبيقات جديدة مثل شرح خطوات تركيب قطعة أثاث بالصوت والصورة.
مستقبل HART
ويطمح الفريق البحثي إلى تطوير HART مستقبلًا ليشمل مجالات أوسع مثل توليد الفيديوهات والتنبؤ بالأصوات، مستفيدين من قابلية الأداة للتوسع والعمل عبر وسائط متعددة.
وقد تم تمويل هذا البحث من قبل عدة جهات منها مختبر MIT-IBM Watson للذكاء الاصطناعي، ومركز MIT وAmazon Science Hub، وبرنامج MIT لتقنيات الذكاء الاصطناعي، ومؤسسة العلوم الوطنية الأمريكية، كما تبرعت NVIDIA بالبنية التحتية اللازمة لتدريب النموذج.
إسلام العبادي(أبوظبي)
المصدر: صحيفة الاتحاد
كلمات دلالية: إنفيديا التصوير الذكاء الاصطناعي الذکاء الاصطناعی
إقرأ أيضاً:
واتساب يختبر إنشاء صور الملف الشخصي بالذكاء الاصطناعي
أميرة خالد
بدأ تطبيق المراسلة الشهير «واتساب»، المملوك لشركة «ميتا»، اختبار ميزة جديدة لمستخدمي أجهزة «أندرويد» تتيح إنشاء صور للملف الشخصي باستخدام الذكاء الاصطناعي عبر المساعد الذكي «Meta AI».
وتتيح هذه الخاصية للمستخدمين الذين لديهم إمكانية الوصول إلى مساعد «Meta AI» إنشاء صورة شخصية بناءً على وصف نصي، دون الحاجة لاستخدام صورهم الفعلية.
ووفقًا لموقع «WABetaInfo» المتخصص في أخبار «واتساب»، يمكن للمستخدم إدخال تفاصيل حول الصورة التي يريدها، ليقوم الذكاء الاصطناعي بإنشائها وفقًا للوصف.
وتهدف الميزة إلى توفير خيار جديد للأشخاص الذين لا يفضلون مشاركة صورهم الشخصية، لكنهم يرغبون في صورة مميزة تعبر عنهم.
حاليًا، تتوفر الميزة لعدد محدود من المستخدمين في النسخة التجريبية من التطبيق على «أندرويد»، ومن المتوقع أن يتم توسيع نطاقها تدريجيًا خلال الأسابيع المقبلة.