في هذه المرحلة، ربما تحب فكرة إنشاء مقاطع فيديو واقعية باستخدام الذكاء الاصطناعي التوليدي، أو تعتقد أنها مسعى مفلس أخلاقيًا يقلل من قيمة الفنانين وسيؤدي إلى عصر كارثي من التزييف العميق لن نهرب منه أبدًا. من الصعب إيجاد أرضية مشتركة. لن تغير Meta العقول مع Movie Gen، أحدث نموذج للذكاء الاصطناعي لإنشاء الفيديو، ولكن بغض النظر عن رأيك في إنشاء الوسائط بالذكاء الاصطناعي، فقد ينتهي به الأمر إلى أن يكون معلمًا مهمًا للصناعة.

يمكن لـ Movie Gen إنتاج مقاطع فيديو واقعية إلى جانب الموسيقى والمؤثرات الصوتية بمعدل 16 إطارًا في الثانية أو 24 إطارًا في الثانية بدقة تصل إلى 1080 بكسل (تمت ترقيتها من 768 × 768 بكسل). يمكنه أيضًا إنشاء مقاطع فيديو مخصصة إذا قمت بتحميل صورة، والأهم من ذلك، يبدو أنه من السهل تحرير مقاطع الفيديو باستخدام أوامر نصية بسيطة. والجدير بالذكر أنه يمكنه أيضًا تحرير مقاطع فيديو عادية غير الذكاء الاصطناعي مع النص. من السهل أن نتخيل كيف يمكن أن يكون ذلك مفيدًا لتنظيف شيء قمت بتصويره على هاتفك من أجل Instagram. Movie Gen هو مجرد بحث بحت في الوقت الحالي - لن تطلقه Meta للجمهور، لذلك لدينا القليل من الوقت للتفكير في ما يعنيه كل هذا.

تصف الشركة Movie Gen بأنه "الموجة الثالثة" من أبحاث الذكاء الاصطناعي التوليدي، بعد أدوات إنشاء الوسائط الأولية مثل Make-A-Scene، بالإضافة إلى العروض الأحدث باستخدام نموذج Llama AI. إنه مدعوم بنموذج محول 30 مليار معلمة يمكنه إنشاء 16 مقطع فيديو مدته 16 ثانية بمعدل 16 إطارًا في الثانية، أو لقطات مدتها 10 ثوانٍ بمعدل 24 إطارًا في الثانية. كما يحتوي على نموذج صوتي 13 مليار معلمة يمكنه إنشاء 45 ثانية من محتوى 48 كيلو هرتز مثل "الصوت المحيط، والمؤثرات الصوتية (Foley)، والموسيقى الخلفية الآلية" المتزامنة مع الفيديو. كتب فريق Movie Gen في ورقة بحثهم أنه لا يوجد دعم صوتي متزامن حتى الآن "بسبب اختياراتنا التصميمية".


تقول Meta إن Movie Gen تم تدريبه في البداية على "مجموعة من مجموعات البيانات المرخصة والمتاحة للجمهور"، بما في ذلك حوالي 100 مليون مقطع فيديو ومليار صورة ومليون ساعة من الصوت. لغة الشركة غامضة بعض الشيء عندما يتعلق الأمر بالمصادر - فقد اعترفت Meta بالفعل بتدريب نماذج الذكاء الاصطناعي الخاصة بها على بيانات من حساب كل مستخدم أسترالي، ومن غير الواضح حتى ما تستخدمه الشركة خارج منتجاتها الخاصة.

أما بالنسبة للمقاطع الفيديو الفعلية، فإن Movie Gen تبدو مثيرة للإعجاب بالتأكيد للوهلة الأولى. تقول Meta أنه في اختبار A/B الخاص بها، فضل الناس عمومًا نتائجها مقارنة بنموذج Sora من OpenAI ونموذج Gen3 من Runway. يبدو البشر الذين يعملون بالذكاء الاصطناعي في Movie Gen واقعيين بشكل مدهش، دون العديد من العلامات الواضحة لفيديو الذكاء الاصطناعي (العيون والأصابع المزعجة، على وجه الخصوص).
"بينما توجد العديد من حالات الاستخدام المثيرة لهذه النماذج الأساسية، من المهم ملاحظة أن الذكاء الاصطناعي التوليدي ليس بديلاً عن عمل الفنانين والرسامين المتحركين"، كتب فريق Movie Gen في منشور على مدونة. "نحن نشارك هذا البحث لأننا نؤمن بقوة هذه التكنولوجيا في مساعدة الناس على التعبير عن أنفسهم بطرق جديدة وتوفير الفرص للأشخاص الذين قد لا تتاح لهم هذه الفرص بخلاف ذلك."

لا يزال من غير الواضح ما الذي سيفعله المستخدمون الرئيسيون بفيديو الذكاء الاصطناعي التوليدي، على الرغم من ذلك. هل سنملأ خلاصاتنا بفيديو الذكاء الاصطناعي، بدلاً من التقاط صورنا ومقاطع الفيديو الخاصة بنا؟ أم سيتم تفكيك Movie Gen إلى أدوات فردية يمكن أن تساعد في شحذ المحتوى الخاص بنا؟ يمكننا بالفعل إزالة الكائنات بسهولة من خلفيات الصور على الهواتف الذكية وأجهزة الكمبيوتر، ويبدو أن تحرير الفيديو الأكثر تطورًا باستخدام الذكاء الاصطناعي هو الخطوة المنطقية التالية.

المصدر: بوابة الوفد

كلمات دلالية: الذکاء الاصطناعی التولیدی إطار ا فی الثانیة مقاطع فیدیو

إقرأ أيضاً:

«ميتا» تكشف عن أداة ذكاء اصطناعي تنتج مقاطع صوت وصورة

أعلنت شركة ميتا المالكة لفيسبوك، اليوم الجمعة، أنها أنشأت نموذج ذكاء اصطناعي جديدا أطلقت عليه اسم (موفي جين) يمكنه إنشاء مقاطع مصورة مصحوبة بالصوت لتبدو واقعية وفقا لطلبات المستخدم.

وقالت ميتا إن بإمكان هذا النموذج منافسة أدوات من شركات ناشئة رائدة في مجال إنشاء الوسائط مثل أوبن إيه.آي وإليفن لابز.

 

وتضمنت عينات من إنتاج موفي جين كشفت عنها ميتا مقاطع مصورة لحيوانات تسبح وتطفو، وأخرى تستخدم صورا حقيقية لأشخاص لتصويرهم وهم مثلا يرسمون على قماش.

وقالت ميتا في منشور على مدونتها إن موفي جين يمكنه أيضا إنشاء موسيقى خلفية وتأثيرات صوتية متزامنة مع عرض محتوى المقطع المصور، مع إمكانية استخدام الأداة لإجراء تعديلات على المقاطع.

وفي أحد المقاطع من إنتاج موفي جين، طلبت ميتا من الأداة وضع كرات تستخدم للزينة في يدي رجل يركض بمفرده في الصحراء، بينما في مقطع آخر غيرت موقف سيارات حيث كان رجل يتزلج على أرض جافة إلى أخرى تغطيها بركة مياه.

وقالت ميتا إن مدة المقطع المصور الذي ينتجه موفي جين يمكن أن تصل إلى 16 ثانية بينما يمكن أن يصل طول المقطع الصوتي إلى 45 ثانية.

 

 

 

مقالات مشابهة

  • Meta تكشف عن أداة “Movie Gen” لإنشاء الفيديو بتقنية الذكاء الإصطناعي
  • ميتا تنتج مقاطع مصورة واقعية بـ«الذكاء»
  • «ميتا» تطرح نموذجها الجديد «موفي جن» لتوليد الفيديو بالذكاء الاصطناعي
  • «ميتا» تكشف عن أداة ذكاء اصطناعي تنتج مقاطع صوت وصورة
  • ينتج صوتاً وصورة.. ميتا تكشف عن الذكاء الاصطناعي الجديد موفي جين
  • اكتشف الميزات الجديدة المدعومة بالذكاء الاصطناعي في واتساب لتحسين تجربتك
  • عبد الله آل حامد يبحث توظيف الذكاء الاصطناعي في المحتوى الإعلامي
  • قفزة علمية هائلة.. علماء يرسمون أول خريطة كاملة لدماغ ذبابة الفاكهة
  • الكويت.. «الذكاء الاصطناعي» يدخل مدارس التعليم الثانوي