ثورة في توليد الصور بالذكاء الاصطناعي.. أداة جديدة أسرع 9 مرات وتعمل على هاتفك
تاريخ النشر: 29th, March 2025 GMT
تمكن باحثون من معهد ماساتشوستس للتكنولوجيا (MIT) وشركة NVIDIA من تطوير أداة جديدة لتوليد الصور تعتمد على الذكاء الاصطناعي، تمتاز بسرعة فائقة وجودة عالية مع استهلاك أقل للطاقة، ويمكن تشغيلها محليًا على أجهزة الحاسوب المحمولة أو الهواتف الذكية.
الأداة الجديدة التي تحمل اسم HART (اختصارًا لـ Hybrid Autoregressive Transformer) تمثل دمجًا مبتكرًا بين تقنيتين شائعتين في هذا المجال: النماذج التوليدية التسلسلية (autoregressive) ونماذج الانتشار (diffusion).
اقرأ أيضاً.. الذكاء الاصطناعي يهدد مستقبل التصوير الفوتوغرافي
السرعة والكفاءة
وتتميز HART بقدرتها على إنتاج صور تضاهي أو تتفوق على الصور التي تولدها نماذج الانتشار المتقدمة، لكنها تفعل ذلك بسرعة أكبر بنحو تسع مرات، مع تقليل استهلاك الموارد الحاسوبية بنسبة تصل إلى 31% مقارنةً بأحدث النماذج. ويكفي أن يدخل المستخدم وصفًا نصيًا بسيطًا لتقوم الأداة بتوليد الصورة المطلوبة.
ويُتوقع أن تفتح هذه التقنية آفاقًا واسعة في عدة مجالات، مثل تدريب السيارات الذاتية القيادة في بيئات افتراضية واقعية، وتصميم مشاهد غنية لألعاب الفيديو، وحتى مساعدة الروبوتات على إتمام مهام معقدة في العالم الحقيقي.
يقول الباحث هاوتيان تانغ، المؤلف المشارك في الدراسة: "تمامًا كما يرسم الفنان لوحة من خلال تحديد الشكل العام أولًا، ثم يعود لإضافة التفاصيل الدقيقة بضربات فرشاة صغيرة، هذا ما تفعله HART بالضبط".
أخبار ذات صلة
تحسين الجودة
وقد واجه الباحثون تحديات أثناء تطوير الأداة، خاصة في كيفية دمج نموذج الانتشار بطريقة تكمّل عمل النموذج التسلسلي دون أن تؤدي إلى تراكم الأخطاء. وخلصوا إلى أن أفضل طريقة هي استخدام نموذج الانتشار فقط في المرحلة النهائية لمعالجة التفاصيل الدقيقة.
ومن أبرز ما يميز HART أنها تعتمد بشكل أساسي على نموذج تسلسلي مشابه للنماذج اللغوية الكبيرة (LLMs) مثل ChatGPT، مما يسهل دمجها مستقبلاً مع نماذج توليدية متعددة الوسائط تجمع بين الرؤية واللغة، وهو ما يمهد الطريق لتطبيقات جديدة مثل شرح خطوات تركيب قطعة أثاث بالصوت والصورة.
مستقبل HART
ويطمح الفريق البحثي إلى تطوير HART مستقبلًا ليشمل مجالات أوسع مثل توليد الفيديوهات والتنبؤ بالأصوات، مستفيدين من قابلية الأداة للتوسع والعمل عبر وسائط متعددة.
وقد تم تمويل هذا البحث من قبل عدة جهات منها مختبر MIT-IBM Watson للذكاء الاصطناعي، ومركز MIT وAmazon Science Hub، وبرنامج MIT لتقنيات الذكاء الاصطناعي، ومؤسسة العلوم الوطنية الأمريكية، كما تبرعت NVIDIA بالبنية التحتية اللازمة لتدريب النموذج.
إسلام العبادي(أبوظبي)
المصدر: صحيفة الاتحاد
كلمات دلالية: إنفيديا التصوير الذكاء الاصطناعي الذکاء الاصطناعی
إقرأ أيضاً:
"الشؤون الدينية" تحذّر من مقاطع مفبركة بالذكاء الاصطناعي بمواقع التواصل
نفى المتحدث باسم رئاسة الشؤون الدينية بالمسجد الحرام والمسجد النبوي الشيخ عبدالله بن حمد الصولي، وجود حسابات باسم أصحاب الفضيلة أئمة وخطباء الحرمين الشريفين في مواقع ووسائل التواصل الاجتماعي.
وحذَّر من المواقع المنتحِلَة والوهمية التي تبث محتوى غير صحيح وكاذبًا، وتصنع مقاطع صوتية مركبة غير حقيقية باستخدام التقنيات الذكية، مختلِقةً على لسان أصحاب الفضيلة أئمة الحرمين الشريفين من خلال المقاطع المصطنعة بما يعرف بالذكاء الاصطناعي.
وأكد أن أي محتوى لا يصدر من موقع الرئاسة وحساباتها الرسمية فهو غير معتمد، ولا يمتّ لأصحاب الفضيلة أئمة الحرمين الشريفين بصِلة، مشددًا على أهمية أخذ المحتوى من المصادر الموثوقة لجهاز الشؤون الدينية، مؤكدًا أن الرئاسة عازمة على اتخاذ الإجراءات الرسمية حيال تطبيق قوانين الجرائم المعلوماتية لكل من يسيء إلى أئمة وخطباء الحرمين الشريفين.
ونبَّه الصولي إلى ضرورة تحري الدقة نحو مصدر ما يُسمع ويُشاهد ويُتداول عن أصحاب الفضيلة أئمة الحرمين الشريفين وخطبائهما، داعيًا جميع المهتمين بأخبار ومنجزات ومحتوى رئاسة الشؤون الدينية عبر مواقع التواصل الاجتماعي إلى الحذر من الانسياق وراء هذه الحسابات الوهمية والمغرضة، التي تسعى إلى اختراق الأمن الفكري والمجتمعي، وإيجاد لبسٍ ديني، وخلط علمي ومعرفي.