آبل تطلق نموذجًا للذكاء الاصطناعي يحرر الصور بناءً على الأوامر النصية
تاريخ النشر: 8th, February 2024 GMT
لا تعد شركة Apple واحدة من أفضل اللاعبين في لعبة الذكاء الاصطناعي اليوم، ولكن نموذج الذكاء الاصطناعي الجديد مفتوح المصدر للشركة لتحرير الصور يُظهر ما يمكنها المساهمة به في هذا المجال. النموذج المسمى تحرير الصور الموجهة MLLM (MGIE)، والذي يستخدم نماذج اللغة الكبيرة متعددة الوسائط (MLLMs) لتفسير الأوامر المستندة إلى النص عند معالجة الصور.
قامت الشركة بتطوير MGIE مع باحثين من جامعة كاليفورنيا، سانتا باربرا. يتمتع MLLMs بالقدرة على تحويل المطالبات النصية البسيطة أو الغامضة إلى تعليمات أكثر تفصيلاً ووضوحًا يمكن لمحرر الصور نفسه اتباعها. على سبيل المثال، إذا أراد المستخدم تعديل صورة بيتزا بيبروني "لجعلها أكثر صحية"، يمكن أن يفسرها MLLMs على أنها "إضافة طبقة نباتية" وتحرير الصورة على هذا النحو.
بالإضافة إلى تغيير إجراء تغييرات كبيرة على الصور، يمكن لـ MGIE أيضًا قص الصور وتغيير حجمها وتدويرها، بالإضافة إلى تحسين السطوع والتباين وتوازن الألوان، كل ذلك من خلال المطالبات النصية. يمكنه أيضًا تعديل مناطق معينة من الصورة ويمكنه، على سبيل المثال، تعديل شعر وعينين وملابس الشخص الموجود بها، أو إزالة العناصر الموجودة في الخلفية.
كما لاحظ VentureBeat، أصدرت Apple النموذج من خلال GitHub، ولكن يمكن للمهتمين أيضًا تجربة العرض التوضيحي الذي يتم استضافته حاليًا على Hugging Face Spaces. لم توضح شركة Apple بعد ما إذا كانت تخطط لاستخدام ما تعلمته من هذا المشروع في أداة أو ميزة يمكنها دمجها في أي من منتجاتها
المصدر: بوابة الوفد
إقرأ أيضاً:
بمميزات جديدة.. إكس تطلق تطبيقا مستقلا لـ Grok AI
أطلق Grok، المساعد الذكي الذي تم دمجه سابقا في منصة إكس (المعروفة بـ تويتر)، كتطبيق مستقل مما يسمح له بالتوسع خارج نطاق الموقع الاجتماعي.
يحتفظ التطبيق، الذي طورته شركة xAI، بطابعه المحادثاتي الجذاب والذي تصفه الشركة بأنه "فكاهي وجذاب". يقدم Grok ميزات متعددة، مثل إنشاء الصور، تلخيص النصوص، والإجابة على الأسئلة.
وكانت إكس قد أطلقت Grok في بداية ديسمبر 2024 لفئة محدودة من المستخدمين، ويقدم خيار وصول مجاني للمساعد الذكي، في السابق، كان يتم الوصول إلى Grok فقط عبر اشتراك X Premium، الذي يبدأ من 8 دولارات شهريا.
يتيح الإصدار المجاني من Grok إجراء 10 طلبات كل ساعتين وثلاثة طلبات يوميا لتحليل الصور، وهذه القيود قد تنطبق أيضا على التطبيق المستقل.
ويمكن للمستخدمين تسجيل الدخول باستخدام حساباتهم على آبل أو جوجل أو إكس، أو عبر البريد الإلكتروني، حتى الآن، ليس من الواضح ما إذا كان مشتركو إكس بريميوم سيحصلون على مزايا إضافية عند استخدام التطبيق كما هو الحال في إكس.
ورغم أن Grok يواجه تحديات مثل عدم الدقة المتوقعة ومخرجات الصور الغريبة، إلا أنه يفترق بقدرته على التعامل مع "الأسئلة الصعبة" التي تتجنبها أدوات الذكاء الاصطناعي الأخرى، كما يتوفر جزء من نموذج Grok AI كبرمجيات مفتوحة المصدر، مما يجعله جذابا للمطورين والباحثين.
وتظهر لقطات الشاشة للتطبيق واجهة بسيطة تحتوي على الشاشة الرئيسية وميزات إنشاء الصور وخيارات تسجيل الدخول، على عكس التكامل بـ إكس، يوفر التطبيق وصولا إلى Grok دون الحاجة لتسجيل الدخول إلى منصة إكس.
على الرغم من توفر Grok بشكل موسع، إلا أنه يواجه تدقيقا بشأن دقته وقدراته في إنشاء الصور، لا تزال قدرته على تقديم استجابات فريدة وجودة عالية غير واضحة، ومع ذلك، قد يجذب النموذج مفتوح المصدر وتوفره المستقل مجموعة أكبر من المستخدمين.
إكس تضيف منشئ صور جديد لـ Grok
أضافت منصة إكس إلى روبوت الدردشة الخاصة بها Grok، منشئ صور جديدا يعمل بالذكاء الاصطناعي، يسمي Aurora، وهو قادر على إنتاج صور أكثر واقعية عن مثيليه الآخرين الموجودين في البرنامج.
وبإمكان أي شخص على منصة إكس استخدام Aurora مثلما هو الحال بالنسبة لـ Grok، ويمكن الوصول إلى منشئ الصور عبر زر Grok الموجود في تطبيق إكس للهواتف وعلى شبكة الإنترنت، وبإمكانه إنشاء صور للشخصيات العامة وتلك المحمية بحقوق النشر مثل الشخصية الكرتونية ميكي ماوس.