جوجل تطلقVeo 2.. ثورة جديدة في عالم إنشاء الفيديو
تاريخ النشر: 17th, December 2024 GMT
أعلنت جوجل اليوم عن إطلاق نموذج Veo 2 المتقدم لتوليد مقاطع الفيديو، إلى جانب تحسينات على نموذج الصور Imagen 3 وتجربة جديدة تُسمى Whisk، والتي تستعرض قدرات الذكاء الاصطناعي الحديثة المدعومة بنموذج "جيميني".
يأتي Veo 2 كتحديث لنموذج Veo الذي تم الكشف عنه لأول مرة في مؤتمر Google I/O 2024، حيث يتميز الإصدار الجديد بفهم أعمق لفيزياء العالم الحقيقي، مع قدرة محسنة على التقاط تفاصيل دقيقة لحركات الإنسان وتعبيراته.
اقرأ أيضاً.. "جوجل" تتحدى المنافسين بتحديثات ثورية لمحرك البحث
ويسعى النموذج الجديد إلى تقديم مستوى أعلى من الواقعية في محتوى الفيديو المُنتج. ويتيح Veo 2 للمستخدمين تخصيص المشاهد بدقة، حيث يمكنهم تحديد أنماط تصوير متنوعة مثل اللقطات القريبة وزوايا التصوير الواسعة باستخدام عدسات افتراضية، إضافة إلى إمكانية تطبيق تأثيرات سينمائية كعمق المجال الضحل لعزل الهدف عن الخلفية. كما يتميز النموذج الجديد بقدرته على تقليل "الهلوسة" في المحتوى، مع دمج علامة مائية رقمية غير مرئية تحمل اسم SynthID لضمان أصالة الإنتاج.
أخبار ذات صلة
أوضحت جوجل أن Veo 2 سيُطرح ضمن منصة VideoFX الموجودة في Google Labs، مع توسيع نطاق الوصول تدريجيًا ليشمل عددًا أكبر من المستخدمين، بينما سيظل التسجيل متاحًا عبر قائمة الانتظار. كما أكدت الشركة أن Veo 2 سيصل قريبًا إلى يوتيوب شورتس وبعض منتجات جوجل الأخرى خلال العام المقبل.
وصرحت جوجل في بيانها: "نحن حريصون على التوسع المدروس لتجربة Veo، لضمان تحسين جودة النموذج وسلامته أثناء عملية الطرح التدريجي عبر VideoFX ويوتيوب وVertex AI".
اقرأ أيضاً.. "جوجل" تكشف عن شريحة ثورية فائقة الدقة
إلى جانب Veo 2، كشفت جوجل عن تحسينات جديدة على نموذج Imagen 3، الذي بات قادرًا على إنتاج صور أكثر إشراقًا ووضوحًا، مع تفاصيل أغنى وتركيب دقيق. يتميز هذا النموذج بقدرته على إنتاج أنماط فنية متعددة بدقة عالية، مما يجعله أداة فعالة لمصممي المحتوى المرئي حول العالم. وسيتم طرح Imagen 3 عالميًا عبر منصة ImageFX.
وفي خطوة أخرى لاستعراض إمكانيات نماذج الذكاء الاصطناعي الحديثة، أطلقت جوجل تجربة جديدة تُدعى Whisk، وهي أداة تتيح للمستخدمين إدخال صور محددة لاستخدامها كمدخلات لإنشاء محتوى مخصص. يمكن للمستخدم اختيار صورة
المصدر: وكالاتالمصدر: صحيفة الاتحاد
كلمات دلالية: الفيديوهات الصور الذكاء الاصطناعي جوجل
إقرأ أيضاً:
Amazon تعلن عن نموذجها الجديد للذكاء الاصطناعي
يمانيون/ منوعات
أعلنت Amazon عن نموذج الذكاء الاصطناعي الجديد Nova Sonic المخصص للتعامل مع الأوامر والبيانات الصوتية.
وأشار الخبراء في Amazon إلى أن النموذج الجديد قادر على التعرف على الكلام والتحليل وتأليف الجمل والعبارات الصوتية، ويمكنه إجراء محادثات مع المستخدم ذات طابع منطقي وواقعي، كما يمكن استعمال هذا النموذج مع مساعد Alexa الصوتي في العديد من الأجهزة الإلكترونية.
وقال روهيت براساد، النائب الأول لرئيس قسم الذكاء الاصطناعي في Amazon:”النموذج الجديد يمكنه العمل مع مساعد +Alexa الذكي الذي أطلقته شركتنا مؤخرا، كما أن Nova Sonic قادر على إجراء محادثات واقعية مع المستخدم، يراعي فيها صمت أو مقاطعات الطرف الآخر، ويمكنه أن يجيب على أسئلة المستخدم مباشرة”.
وأشار براساد إلى أن النموذج الجديد أقل عرضة للأخطاء مقارنة بنماذج الذكاء الاصطناعي الأخرى المصممة لمعالجة الكلام والأصوات، ويمكنه التعرف على صوت المستخدم وسط الضوضاء، كما نوه إلى أن Amazon تخطط في المستقبل لإطلاق نماذج ذكاء اصطناعي قادرة على التعامل مع بيانات مختلفة مثل الصور والفيديوهات.
وبحسب معيار Multilingual LibriSpeech لاختبار التعرف على الكلام بلغات ولهجات مختلفة، سجّل Nova Sonic معدل خطأ بلغ 4.2% فقط عند التعامل مع اللغات والفرنسية والإنكليزية والإيطالية والألمانية والإسبانية.