جوجل تكشف عن Veo وImagen 3 أحدث نماذجها لإنشاء وسائط الذكاء الاصطناعي
تاريخ النشر: 15th, May 2024 GMT
كل شيء يعتمد على الذكاء الاصطناعي طوال الوقت في Google I/O! أعلنت شركة جوجل عن محركاتها الجديدة لإنشاء وسائط الذكاء الاصطناعي: Veo، والتي يمكنها إنتاج مقاطع فيديو "عالية الجودة" بدقة 1080 بكسل؛ وImagen 3، أحدث إطار عمل لتحويل النص إلى صورة.
لا يبدو أي منهما ثوريًا بشكل خاص، لكنهما وسيلة لـ Google لمواصلة الكفاح ضد نموذج فيديو Sora الخاص بـ OpenAI و Dall-E 3، وهي الأداة التي أصبحت عمليًا مرادفة للصور المولدة بواسطة الذكاء الاصطناعي.
تدعي Google أن Veo لديه "فهم متقدم للغة الطبيعية والدلالات المرئية" لإنشاء أي فيديو يدور في ذهنك. يمكن أن تستمر مقاطع الفيديو التي تم إنشاؤها بواسطة الذكاء الاصطناعي "لأكثر من دقيقة". Veo قادر أيضًا على فهم التقنيات السينمائية والبصرية، مثل مفهوم الفاصل الزمني. ولكن في الواقع، ينبغي أن يكون ذلك بمثابة رهانات على طاولة نموذج إنشاء فيديو يعمل بالذكاء الاصطناعي، أليس كذلك؟
لإثبات أن Veo لا يسعى لسرقة وظائف الفنانين، عقدت Google أيضًا شراكة مع دونالد جلوفر وGilga، الاستوديو الإبداعي الخاص به، لإظهار قدرات النموذج. في مقطع فيديو ترويجي قصير جدًا، نرى جلوفر وطاقم العمل يستخدمون نصًا لإنشاء فيديو لسيارة مكشوفة تصل إلى منزل أوروبي، ومركب شراعي ينزلق عبر المحيط. وفقًا لجوجل، يمكن لـ Veo محاكاة فيزياء العالم الحقيقي بشكل أفضل من نماذجه السابقة، كما أنه قام بتحسين كيفية عرض لقطات عالية الوضوح.
يقول جلوفر في الفيديو، وهو يكسب راتبه من جوجل: "سيصبح الجميع مخرجًا، ويجب أن يصبح الجميع مخرجًا". "في قلب كل هذا هو مجرد رواية القصص. كلما اقتربنا من أن نكون قادرين على رواية قصصنا لبعضنا البعض، كلما زاد فهمنا لبعضنا البعض."
يبقى أن نرى ما إذا كان أي شخص سيرغب بالفعل في مشاهدة مقاطع الفيديو التي تم إنشاؤها بواسطة الذكاء الاصطناعي، بعيدًا عن الفضول المرضي المتمثل في رؤية محاولة الآلة لإعادة إنشاء عمل الفنانين البشريين خوارزميًا. لكن هذا لا يمنع Google أو OpenAI من الترويج لهذه الأدوات والأمل في أن تكون مفيدة (أو على الأقل تحقيق قدر كبير من المال). سيكون Veo متاحًا داخل أداة VideoFX من Google اليوم لبعض منشئي المحتوى، وتقول الشركة إنه سيأتي أيضًا إلى YouTube Shorts ومنتجات أخرى. إذا أصبح Veo جزءًا مدمجًا من YouTube Shorts، فهذه ميزة واحدة على الأقل يمكن أن تتفوق عليها Google على TikTok.
أما بالنسبة لـ Imagen 3، فإن جوجل تقدم الوعود المعتادة: يُقال إنها نموذج الشركة "الأعلى جودة" لتحويل النص إلى صورة، مع "مستوى مذهل من التفاصيل" للحصول على "صور واقعية ونابضة بالحياة" وعدد أقل من الأعمال الفنية. سيكون الاختبار الحقيقي، بالطبع، هو معرفة كيفية تعامله مع المطالبات مقارنة بـ Dall-E 3. تقول Google إن Imagen 3 يتعامل مع النص بشكل أفضل من ذي قبل، كما أنه أكثر ذكاءً في التعامل مع التفاصيل من المطالبات الطويلة.
تعمل جوجل أيضًا مع فناني تسجيل مثل Wyclef Jean وBjorn لاختبار Music AI Sandbox، وهي مجموعة من الأدوات التي يمكن أن تساعد في إنشاء الأغاني والإيقاعات. لقد رأينا لمحة سريعة فقط عن هذا، ولكنها أدت إلى بعض العروض التوضيحية المثيرة للاهتمام:
https://www.youtube.com/watch?list=PLqYmG7hTraZA7o7KkLWoVscoELWRGu3Xg&v=6ydG1mqID-s
يصبح الذكاء الاصطناعي أكثر ذكاءً يومًا بعد يوم. يبدو أن هذا هو أهم ما تعلمته من أحدث أدوات إنشاء الوسائط من Google. بالطبع إنهم يتحسنون! تنفق جوجل المليارات لجعل حلم الذكاء الاصطناعي حقيقة، كل ذلك في محاولة لامتلاك القفزة العظيمة التالية في مجال الحوسبة. هل أي من هذا سيجعل حياتنا أفضل بالفعل؟ هل سيكونون قادرين على إنتاج الفن بروح حقيقية؟ تحقق مرة أخرى من مؤتمر Google I/O كل عام حتى يظهر الذكاء الاصطناعي العام (AGI) فعليًا، أو تنهار حضارتنا.
المصدر: بوابة الوفد
كلمات دلالية: جوجل الذكاء الاصطناعي الذکاء الاصطناعی
إقرأ أيضاً:
استخدام الذكاء الاصطناعي في ميكنة قصر العيني
وجه الدكتور حسام صلاح، عميد كلية طب قصر العيني ورئيس مجلس إدارة المستشفيات، بحوكمة وميكنة العمل داخل الكلية والمستشفيات باستخدام الذكاء الاصطناعي "AI".
جاء ذلك خلال الجلسة الافتتاحية لمؤتمر قسم الفسيولوجيا الثالث بعنوان decoding of brain body crosstalk بحضور الدكتور عبد المجيد قاسم، ووكيل الكلية لشؤون الدراسات العليا والبحوث، والدكتور عمر عزام وكيل الكلية لتنمية البيئة وخدمة المجتمع، والدكتورة حنان مبارك وكيل الكلية لشؤون الطلاب ورئيس قسم الفسيولوجي، والدكتور ثناء تادر الاستاذ المتفرغ بقسم الفسيولوجي.
وأشار عميد طب قصر العيني إلى أن الجامعة أطلقت بالعهد القريب الاستراتيجية الوطنية للذكاء الاصطناعي، وأصبحت حوكمة المستشفى والكلية ضرورة ملحة.
تذليل المعوقات لتوطين الذكاء الاصطناعي في قصر العينيونوه عميد طب قصر العيني بضرورة السعي لتذليل المعوقات وتجييش الجيوش لإصلاح الفجوات لتوطين الذكاء الاصطناعي داخل الكلية طبقا لخطة الدولة لتنميه 2030.
ولفت عميد طب قصر العيني إلى أن العلاقه المتبادلة بين الاقسام أصبحت ضمن العمل الأساسي لكل قسم حيث أنها تساعد على اكتساب الخبرات وسرعه العلاج.
وأوضح عميد طب قصر العيني أن قسم الفسيولوجيا أولى الأقسام التي يجب أن تكون معنية بالعمل الجماعي مع الأقسام الأخرى.
وأضاف عميد طب قصر العيني أن الفسيولوجيا يعد من العلوم الأساسية المرتبطة بتحديد الأمراض وكيفية علاجها لفهم آليات التفاعل بين أعضاء الجسم ومعرفة تأثير العوامل البيئية على الجسم وطرق توصيل الأدوية للمريض.
وأكد عميد طب قصر العيني أن علاج المرضي يعد الهدف الأساسي الذي نضعه نصب أعيننا ليكتمل من خلاله نجاح منظومة الرعاية الطبية واستدامتها نحو تحقيق التكامل التنموي المرجو للدولة المصرية في خططتها المقبلة.
ونوه عميد طب قصر العيني بالدور الجديد لأساتذة كلية الطب الذي فرضته عليهم عجلة التطوير والتنمية المستدامة ليصبح دوره غير مقتصر على عملية التدريس والعلاج للمرضى ليسعي في مواكبة مراحل البحث العلمي الاعتيادي والانتقال إلى البحث المؤثر في المجتمع والمشاركة في البحث العلمي للجامعات.
وشدد عميد كلية طب قصر العيني على استخدام البحث في حوكمة الذكاء الاصطناعي على المنظومة الطبيه إذ يعد البحث العلمي الأمل في تطوير النهج العلاجي والذي يساهم بدوره في تطوير الرعايه الصحيه للمريض.
وأكد عميد طب قصر العيني أهمية البحث العلمي في قطاع الصحة ودوره في صناعة اقتصاد وطني، لافتا إلى أن الدولة لن تتحرك للأمام دون تعزيز البحث العلمي الهادف وليس البحوث التقليدية حيث تشهد مصر اليوم رابطًا وثيقا بين منظومة البحث العلمي في الجامعات وقطاعات الصناعه الطبية.