خد بالك.. جوجل تعلن عن نموذج جديد للذكاء اصطناعي يثير المخاوف فما القصة؟
تاريخ النشر: 19th, March 2024 GMT
كشفت جوجل عن نموذج “فلوجر” VLOGGER الجديد للذكاء اصطناعي والذي يتيح القيام بتحويل الصور الثابتة إلى مقاطع فيديو متحركة.
ووفقًا لما ذكره باحثو جوجل يمكن لهذا النموذج توليد بعض مقاطع الفيديو الواقعية لأشخاص يقومون بالتحدث والتحرك ويظهرون بعض التعبيرات الجسدية والإيماءات وذلك من صورة ثابتة واحدة.
وتعتمد تلك التقنية على إنتاج الكثير من اللقطات الواقعية والقيام بتجميعها في مقطع فيديووتفتح تلك التقنية الباب لعدد أكبر من التطبيقات المحتملة لها، إلا أنها في الوقت نفسه تثير بعض المخاوف بشأن إساءة استخدامها لمحاولة التضليل وإنتاج مقاطع فيديو على نحو يشبه آليات الكثير من آليات التزييف العميق
على الرغم أن مقاطع الفيديو التي نشرها باحثو جوجل تعد ليست مثالية وبها بعض الأخطاء، وتعد قصيرة نسبيًا ولها ولها خلفية ثابتة ثلاثية الأبعاد، إلا أنها تمثل طفرة كبيرة في تحريك الصور الثابتة.
ويمكن القيام باستخدام نموذج" VLOGGER في العديد من الاستخدامات، ومنها القيام بدبلجة بعض من مقاطع الفيديو تلقائيًا عبر تبديل المسار الصوتي، ومحاولة ملء الإطارات المفقودة في مقاطع الفيديو، وإنشاء مجموعة من الصور الرمزية والواقعية للألعاب والواقع الافتراضي، و ربوتوتات لدردشة يمكنها التفاعل مع المستخدمين بطريقة أفضل.
المصدر: صدى البلد
كلمات دلالية: ذكاء اصطناعي مقاطع فيديو مقاطع الفیدیو
إقرأ أيضاً:
شركة بايدو الصينية تطلق نموذجين جديدين للذكاء الاصطناعي مع احتدام المنافسة في الصناعة
الاقتصاد نيوز - متابعة
أطقلت شركة بايدو الصينية، الأحد، نموذجين جديدين من الذكاء الاصطناعي، بما في ذلك نموذج جديد يركز على الاستدلال، الذي قالت إنه ينافس نموذج ديب سيك DeepSeek، في إطار سعيها للتميز في سباق الذكاء الاصطناعي شديد التنافس.
إطلاق شركة ديب سيك الصينية الناشئة لنماذج الذكاء الاصطناعي التي تقول إنها توازي أو حتى تتفوق على النماذج الرائدة في الولايات المتحدة بتكلفة أقل بكثير، قد أحدث ضجة في الصناعة وأعاد تنشيط سباق الذكاء الاصطناعي العالمي.
من جهتها، قالت بايدو عن أحد النماذج الجديدة: "نموذج ERNIE X1 يقدم أداءً يعادل أداء DeepSeek R1 ولكن بنصف التكلفة فقط." وأضافت أن X1 يتمتع بـ "قدرات أقوى في الفهم والتخطيط والتفكير والتطور"، مشيرة إلى أنه أول نموذج تفكير عميق يستخدم الأدوات بشكل مستقل.
وبحسب بايدو أيضاً إن نموذجها الأخير من الجيل الأساسي، ERNIE 4.5، يمتلك "قدرة ممتازة على الفهم متعدد الوسائط. كما أن لديه قدرة لغوية أكثر تقدماً، وتم تحسين قدراته في الفهم والتوليد والمنطق والذاكرة بشكل شامل".
ويمتلك النموذج الجديد "ذكاء عاطفي عالي"، ويمكنه فهم الميمات الشبكية والكاريكاتير الساخر بسهولة، حسبما قالت بايدو.
كانت بايدو واحدة من أوائل شركات التكنولوجيا الصينية التي أطلقت روبوت محادثة على غرار تشات جي بي تي، لكنها واجهت صعوبة في تحقيق اعتماد واسع لنموذجها "إرني" للغة الكبيرة، على الرغم من ادعائها بأنه يقدم أداءً قابلاً للمقارنة مع نموذج GPT-4 الخاص بـ أوبن إيه آي OpenAI، وسط منافسة شديدة.
تستطيع الأنظمة الذكية متعددة الوسائط معالجة ودمج أنواع مختلفة من البيانات بما في ذلك النصوص والفيديو والصور والصوت، ويمكنها تحويل المحتوى عبر هذه الصيغ.
ليصلك المزيد من الأخبار اشترك بقناتنا على التيليكرام