لا تعد شركة Apple واحدة من أفضل اللاعبين في لعبة الذكاء الاصطناعي اليوم، ولكن نموذج الذكاء الاصطناعي الجديد مفتوح المصدر للشركة لتحرير الصور يُظهر ما يمكنها المساهمة به في هذا المجال. النموذج المسمى تحرير الصور الموجهة MLLM (MGIE)، والذي يستخدم نماذج اللغة الكبيرة متعددة الوسائط (MLLMs) لتفسير الأوامر المستندة إلى النص عند معالجة الصور.

بمعنى آخر، تتمتع الأداة بالقدرة على تحرير الصور بناءً على النص الذي يكتبه المستخدم. وعلى الرغم من أنها ليست الأداة الأولى التي يمكنها القيام بذلك، إلا أن "التعليمات البشرية تكون في بعض الأحيان مختصرة جدًا بحيث لا يمكن للطرق الحالية التقاطها ومتابعتها"، كما يقول المشروع. يقرأ الورق (PDF).

قامت الشركة بتطوير MGIE مع باحثين من جامعة كاليفورنيا، سانتا باربرا. يتمتع MLLMs بالقدرة على تحويل المطالبات النصية البسيطة أو الغامضة إلى تعليمات أكثر تفصيلاً ووضوحًا يمكن لمحرر الصور نفسه اتباعها. على سبيل المثال، إذا أراد المستخدم تعديل صورة بيتزا بيبروني "لجعلها أكثر صحية"، يمكن أن يفسرها MLLMs على أنها "إضافة طبقة نباتية" وتحرير الصورة على هذا النحو.
بالإضافة إلى تغيير إجراء تغييرات كبيرة على الصور، يمكن لـ MGIE أيضًا قص الصور وتغيير حجمها وتدويرها، بالإضافة إلى تحسين السطوع والتباين وتوازن الألوان، كل ذلك من خلال المطالبات النصية. يمكنه أيضًا تعديل مناطق معينة من الصورة ويمكنه، على سبيل المثال، تعديل شعر وعينين وملابس الشخص الموجود بها، أو إزالة العناصر الموجودة في الخلفية.

كما لاحظ VentureBeat، أصدرت Apple النموذج من خلال GitHub، ولكن يمكن للمهتمين أيضًا تجربة العرض التوضيحي الذي يتم استضافته حاليًا على Hugging Face Spaces. لم توضح شركة Apple بعد ما إذا كانت تخطط لاستخدام ما تعلمته من هذا المشروع في أداة أو ميزة يمكنها دمجها في أي من منتجاتها

المصدر: بوابة الوفد

إقرأ أيضاً:

الشحومي: لا يمكن بناء اقتصاد ابتكاري في ليبيا في غياب أنظمة الدفع الإلكتروني

قال المحلل الاقتصادي الليبي، مدير صندوق رأسمال الجريء في المملكة المتحدة منذر الشحومي، إنه لا يمكن الحديث عن اقتصاد ابتكاري في ليبيا في غياب الإنترنت السريع، أو أنظمة الدفع الإلكتروني، فتطوير شبكات الاتصال وإتاحة بوابات دفع للشركات الناشئة وتحفيز المصارف على احتضان خدمات مالية رقمية ليست كماليات، بل أُسُس بناء اقتصاد القرن الـ21، والحل ليس فقط في البناء، بل في التشريع، وهو ما يفرض على مصرف ليبيا المركزي وهيئة سوق المال، بحسب المتحدث، أن يتبنيا نموذج “الحاضنة التنظيمية” التي تسمح للشركات الناشئة باختبار منتجاتها قبل خضوعها الكامل للضوابط.

أضاف في مقابلة مع موقع “اندبندنت عربية”، أن الابتكار لا يزدهر في بيئات تخشى الفشل أو تخضع للاحتكار، وإذا أردنا شباباً يخوضون المغامرة، فعلينا أن نحميهم قانونياً إذا فشلوا، وأن نحميهم من الشركات الكبرى إذا نجحوا، موضحاً أن تحديث قوانين الإفلاس، وتسهيل الخروج من المشاريع المتعثرة، وحماية الملكية الفكرية، ومنع الاحتكار، كلها شروط جوهرية لبناء بيئة تجرّب وتتعلم.

ويضيف، “إن كانت الحكومة جادة فعليها أن تبدأ بنفسها: رقمنة الخدمات الحكومية، من السجل التجاري إلى الضرائب، ستخلق سوقاً أولية للشركات التقنية المحلية، وتوفر نموذجاً يُحتذى في الانفتاح والفاعلية”.

مقالات مشابهة

  • استوديو جيبلي وكابوس الذكاء الاصطناعي
  • إيلون ماسك يعلن بيع منصته الاجتماعية إلى شركته للذكاء الاصطناعي إكس ايه آي
  • شركة ماسك للذكاء الاصطناعي تستحوذ على إكس.. صفقة بقيمة 45 مليار دولار
  • ثورة في توليد الصور بالذكاء الاصطناعي.. أداة جديدة أسرع 9 مرات وتعمل على هاتفك
  • استحواذ شركة ماسك للذكاء الاصطناعي على منصة "إكس"
  • "إكس يه ي" للذكاء الاصطناعي تستحوذ على منصة "إكس"
  • إيلون ماسك يعلن استحواذ شركته للذكاء الاصطناعي على منصة " X"
  • xAI للذكاء الاصطناعي تستحوذ على إكس
  • اختُتام الدورة الثانية لأكبر هاكاثون وطني للذكاء الاصطناعي
  • الشحومي: لا يمكن بناء اقتصاد ابتكاري في ليبيا في غياب أنظمة الدفع الإلكتروني