سورا.. أداة جديدة من أوبن إيه آي لتحويل النصوص إلى فيديوهات
تاريخ النشر: 16th, February 2024 GMT
كشفت شركة "أوبن إيه آي" المتخصصة بتكنولوجيا الذكاء الاصطناعي التوليدي، الخميس، عن أداة جديدة تتيح توليد مقاطع فيديو من النصوص.
يذكر أن "أوبن إيه آي" كانت قد اشتهرت سابقا ببرنامج "تشات جي بي تي" الذي أتاح للمستخدمين العاديين إمكانية توظيف الذكاء الاصطناعي التوليدي.
وأطلقت الشركة اسم "سورا" (أي سماء باليابانية) على النموذج الجديد التي كشفت عنه الخميس، والذي بإمكانه أن يخلق فيديوهات تقارب الواقع تصل مدتها إلى دقيقة واحدة وذلك بالالتزام بتعليمات المستخدم فيما يخص الموضوع الذي يطرحه وأسلوب العرض، وفق ما نقلته صحيفة "ذا غارديان".
وذكرت الشركة في مدونتها أن نموذجها، "سورا"، يستطيع أيضا أن يخلق فيديو مستوحى من صورة ثابتة أو أن يضيف محتوى بصريا على فيديوهات متوفرة أصلا.
وقالت الشركة: "نحن نعلّم الذكاء الاصطناعي ليتمكن من فهم ومحاكاة العالم الواقعي في حركته، بهدف تدريب النماذج التي من شأنها أن تساعد الأشخاص على حل المشاكل التي تتطلب التفاعل مع العالم الواقعي".
وأضافت الشركة في مدونتها عدة أمثلة على تلك الفيديوهات الأولية التي يمكن للنموذج صنعها، منها "تريلر لفيلم يظهر مغامرات عالم فضاء ثلاثيني يرتدي بدلة مصنوعة من الصوف الأحمر وخوذة للدراجات النارية، سماء زرقاء، صحراء ملحية، بأسلوب سينمائي، التقط بفيلم 35 ملم، ألوان ساطعة".
وأعلنت الشركة أنها فتحت المجال لاستخدام "سورا" أمام عدد من الباحثين وصناع الفيديو، وسيتاح للفريق الذي لقبته بـ "red team" اختبار النموذج للتأكد من مواكبته شروط خدمة"أوبن إيه آي" التي تحظر "المحتوى العنيف بشكل مبالغ به والإباحية والصور التي تبث الكراهية وأشباه المشاهير…".
ولا تزال تجربة النموذج مقتصرة على الباحثين وفناني المحتوى المرئي وصناع الأفلام فقط، إلا أن المدير التنفيذي للشركة، سام ألتمان، استجاب لطلبات المستخدمين عبر تويتر بمقاطع فيديو تم توليدها باستخدام "سورا"، وظهرت علامة عليها تؤكد أن المحتوى تم توليده بالذكاء الاصطناعي.
وأطلقت الشركة لأول مرة مولد الصور الثابتة "دال-إي" في عام 2021 وروبوت الدردشة المولد بالذكاء الاصطناعي "تشات جي بي تي" في نوفمبر عام 2022، والذي جمع بسرعة 100 مليون مستخدم.
وقد طرحت شركات الذكاء الاصطناعي الأخرى أدوات إنشاء الفيديو لأول مرة، على الرغم من أن هذه النماذج لم تكن قادرة إلا على إنتاج بضع ثوانٍ فقط من اللقطات التي غالبا لا تشبه المحتوى المطلوب أو الأصلي.
وقالت شركتا "غوغل" و"ميتا" إنهما بصدد تطوير أدوات فيديو بتقنية الذكاء الاصطناعي التوليدي، على الرغم من أنها لا تتوفر أمام العامة.
وأعلنت "أوبن إيه آي" ،الأربعاء، عن تجربة لإضافة ذاكرة أعمق إلى "تشات جي بي تي" حتى يتمكن من تذكر المزيد من محادثات مستخدميه.
ولم تكشف "أوبن إيه آي" عن كمية اللقطات التي استخدمت لتدريب "سورا" أو أصل الفيديوهات التي استخدمت في تدريبه، إلا أن القائمين على النموذج أكدوا لنيويورك تايمز أن المقاطع المستخدمة في تدريب البرمجية متوفرة للعامة وتحظى بترخيص استخدامها وفق حقوق الطبع من مالكيها.
وذكرت "ذا غارديان" أن الشركة واجهت دعاوى قضائية عدة بتهمة تزوير محتوى يحظى بحقوق طبع محفوظة أنتجته أدوات الذكاء الاصطناعي التابعة لها، والتي تعتمد على المحتوى المنشور على الإنترنت لمحاكاة الصور أو النصوص.
المصدر: الحرة
كلمات دلالية: الذکاء الاصطناعی أوبن إیه آی
إقرأ أيضاً:
كيف خسرت آبل عرش الذكاء الاصطناعي لصالح ميتا؟
كشف الصحفي الشهير المتخصص في أخبار أبل، مارك جورمان، عن رؤى جديدة مثيرة في أحدث إصدار من نشرته الإخبارية "Power On"، مشيرًا إلى أن أبل كان يمكن أن تتربع على عرش سوق النظارات الذكية، لكنها أضاعت الفرصة لصالح شركة ميتا بسبب ضعف التنسيق الداخلي.
ميتا تهيمن على المشهد بفضل استثماراتها في الواقع الممتدبعد أكثر من عقد من الاستثمار في تقنيات الواقع الممتد (XR)، أصبحت ميتا واحدة من أبرز الأسماء في مجال الواقع الافتراضي.
وتعد نظارات Meta Quest 3 وQuest 3S وQuest 2 من بين أكثر نظارات الواقع الافتراضي شعبية حول العالم.
ولم تكتفِ ميتا بذلك، بل أطلقت نظارات Ray-Ban الذكية التي حققت نجاحًا فاق كل التوقعات، ما دفع الشركة إلى إعادة هيكلة قسم XR للتركيز على تطوير أجهزة قابلة للارتداء من هذا النوع.
اللافت أن نظارات Ray-Ban الذكية لا تحتوي حتى على شاشة عرض، بل تعتمد على مكبرات صوت وميكروفون وكاميرا فقط ، ورغم ذلك، لاقت إعجابًا واسعًا من المستخدمين.
ومع دمج تقنية Meta AI، أصبحت النظارات أداة تقنية متطورة بحق. وتخطط ميتا الآن لإطلاق نسخة جديدة من النظارات مزودة بشاشة عرض قبل نهاية العام الجاري.
وبحسب جورمان، كان بإمكان أبل أن تحقق هذا النجاح ذاته، لكنها أهدرت الفرصة بسبب تأخرها في التنسيق الداخلي واتخاذ القرار. وأكد أن أبل كانت تدرس منذ فترة إطلاق منتج منافس لنظارات Ray-Ban، إلا أن التردد الطويل جعلها تخسر الصدارة لصالح ميتا.
ورغم إطلاق أبل نظارة Vision Pro للواقع المختلط، والتي تُعد منتجًا فخمًا، إلا أن المبيعات جاءت أقل من التوقعات.
ومع ذلك، أبل لم تتراجع عن طموحاتها في مجال XR، إذ تخطط في النهاية لتقديم نظارات واقع معزز حقيقية مدعومة بالذكاء الاصطناعي منتج شبيه بمشروع Meta Orion المستقبلي ، يمكن أن يكون بديلاً للهاتف الذكي.
مشكلات أبل مع الذكاء الاصطناعي تعرقل التقدمومما يزيد الأمور تعقيدًا أن مبادرة "Apple Intelligence" لا تزال تعاني من مشاكل جوهرية، متأخرة كثيرًا عن منافسين مثل "Gemini" من جوجل و"ChatGPT" من OpenAI.
وبالتالي، لن تتمكن أبل من إطلاق نظارات ذكية مدعومة بالذكاء الاصطناعي قبل إصلاح منظومة الذكاء الاصطناعي الخاصة بها.
وختم جورمان تحليله بجملة لاذعة قائلاً:"أبل أضاعت الفرصة لصالح شركة شبكات اجتماعية"،في إشارة مباشرة إلى ميتا، مضيفًا أن هذا الإخفاق كان يمكن تفاديه لو كانت جهود أبل أكثر تنسيقًا وجرأة.