نموذج الفيديو الجديد من Google AI أقل سوءًا في الفيزياء
تاريخ النشر: 17th, December 2024 GMT
قد تكون Google قد بدأت مؤخرًا في طرح الذكاء الاصطناعي التوليدي Veo لعملاء المؤسسات، لكن الشركة لا تضيع أي وقت في طرح إصدار جديد من أداة الفيديو للمختبرين الأوائل. في يوم الاثنين، أعلنت Google عن معاينة Veo 2. وفقًا للشركة، فإن Veo 2 "يفهم لغة التصوير السينمائي". في الممارسة العملية، يعني هذا أنه يمكنك الرجوع إلى نوع معين من الفيلم أو التأثير السينمائي أو العدسة عند مطالبة النموذج.
بالإضافة إلى ذلك، تقول Google أن النموذج الجديد لديه فهم أفضل للفيزياء في العالم الحقيقي والحركة البشرية. إن النمذجة الصحيحة للبشر أثناء الحركة هي شيء تكافح جميع النماذج التوليدية للقيام به. لذا فإن ادعاء الشركة بأن Veo 2 أفضل عندما يتعلق الأمر بكلا نقطتي المشكلة جدير بالملاحظة. بالطبع، العينات التي قدمتها الشركة ليست كافية لمعرفة ذلك على وجه اليقين؛ سيأتي الاختبار الحقيقي لقدرات Veo 2 عندما يطلب منه شخص ما إنشاء مقطع فيديو لروتين لاعبة جمباز. أوه، وبالحديث عن الأشياء التي تكافح معها نماذج الفيديو، تقول Google إن Veo ستنتج قطعًا أثرية مثل الأصابع الإضافية "بشكل أقل تكرارًا".
بشكل منفصل، تطرح Google تحسينات على Imagen 3. فيما يتعلق بنموذج النص إلى الصورة، تقول الشركة إن أحدث إصدار يولد صورًا أكثر سطوعًا وأفضل تكوينًا. بالإضافة إلى ذلك، يمكنه تقديم أنماط فنية أكثر تنوعًا بدقة أكبر. في الوقت نفسه، فهو أيضًا أفضل في اتباع الإرشادات بدقة أكبر. كان الالتزام الفوري مشكلة سلطت الضوء عليها عندما جعلت الشركة Imagen 3 متاحًا لعملاء Google Cloud في وقت سابق من هذا الشهر، لذا إذا لم يكن هناك شيء آخر، فإن Google على دراية بالمجالات التي تحتاج فيها نماذج الذكاء الاصطناعي الخاصة بها إلى العمل.
سيتم طرح Veo 2 تدريجيًا لمستخدمي Google Labs في الولايات المتحدة. في الوقت الحالي، ستحد Google من المختبرين لتوليد ما يصل إلى ثماني ثوانٍ من اللقطات بدقة 720 بكسل. للتوضيح، يمكن لبرنامج Sora إنشاء ما يصل إلى 20 ثانية من لقطات بدقة 1080 بكسل، على الرغم من أن القيام بذلك يتطلب اشتراكًا شهريًا في ChatGPT Pro بقيمة 200 دولار أمريكي. أما بالنسبة لأحدث التحسينات التي تم إدخالها على Imagen 3، فهي متاحة لمستخدمي Google Labs في أكثر من 100 دولة من خلال ImageFX.
المصدر: بوابة الوفد
إقرأ أيضاً:
OPPO تنجح في الوصول لمستوى جديد من قدرات الذكاء الاصطناعي في ColorOS 15
OPPO تقدم تجارب الذكاء الاصطناعي المتقدمة، بالإضافة إلى Google Gemini وميزة "Circle to Search" مع Google، في نظامها القادم ColorOS 15
مع ColorOS، كان هدفنا دائمًا هو تقديم تجربة سهلة الاستخدام، متناغمة ومُميزة من خلال الذكاء والتعاون مع الشركات والمؤسسات الكبرى. من خلال دمج Google Gemini 1.5 Pro و1.5 Flash في مجالات اللغة والمساعدة والبحث، يتم تعزيز ColorOS 15 بالذكاء الاصطناعي لزيادة الإنتاجية والإبداع، بما يتجاوز احتياجات العملاء على نحو لم يحدث من قبل."
نيكول تشانغ، المديرة العامة لمنتجات الذكاء الاصطناعي في OPPO
إطلاق العنان لإمكانيات الذكاء الاصطناعي للارتقاء بالأداء والانتاجية
يستفيد ColorOS 15 من قدرات الذكاء الاصطناعي المتقدمة من Google، مما يمنح المستخدمين مجموعة من الحلول المتطورة.
من خلال الاستفادة من نماذج Gemini، يعزز ColorOS 15 الإنتاجية مباشرة داخل تطبيقات OPPO Notes وDocuments عبر إعادة صياغة الهيكل وتحسين اللغة في ثوانٍ. ومع ميزة AI Recording Summary، يقوم النظام بذكاء بتلخيص التسجيلات الصوتية، مما ينتج ملاحظات اجتماعات أو ملخصات عالية الجودة، ويوفر ساعات من العمل اليدوي.
Google Gemini وميزة Circle to Search مع Google
يقدم ColorOS 15 أيضًا ميزة Circle to Search مع Google على أجهزة OPPO الذكية. من خلال الضغط المطول على زر الصفحة الرئيسية أو شريط التنقل، يمكن للمستخدمين البحث فورًا عما يظهر على الشاشة دون الحاجة إلى التبديل بين التطبيقات.كما يأتي ColorOS 15 مع تطبيق Google Gemini. تحدث مع Gemini، مساعدك الذكي من Google، لتعزيز إنتاجيتك وإبداعك. احصل على المساعدة في الكتابة والتعلم والتخطيط والمزيد. يمكنك أيضًا التفاعل مباشرة مع Gemini للعصف الذهني للحصول على أفكار، وتبسيط الموضوعات المعقدة، والتدرب على اللحظات المهمة مع استجابات في الوقت الفعلي.
سيتم إطلاق ColorOS 15، الذي يتميز بقدرات الذكاء الاصطناعي المتقدمة من Google، خلال الإطلاق العالمي لسلسلة OPPO Find X8 القادمة.