“سورا”.. الذكاء الاصطناعي يحوّل النصوص إلى فيديوهات
تاريخ النشر: 18th, February 2024 GMT
كشفت شركة “أوبن إيه آي” المتخصصة بتكنولوجيا الذكاء الاصطناعي التوليدي، عن أداة جديدة تتيح توليد مقاطع فيديو من النصوص.
يذكر أن “أوبن إيه آي” كانت قد اشتهرت سابقا ببرنامج “تشات جي بي تي” الذي أتاح للمستخدمين العاديين إمكانية توظيف الذكاء الاصطناعي التوليدي.
وأطلقت الشركة الخميس اسم “سورا” (أي سماء باليابانية) على النموذج الجديد التي كشفت عنه الخميس، والذي بإمكانه أن يخلق فيديوهات تقارب الواقع تصل مدتها إلى دقيقة واحدة وذلك بالالتزام بتعليمات المستخدم فيما يخص الموضوع الذي يطرحه وأسلوب العرض.
وذكرت الشركة في مدونتها أن نموذجها، “سورا”، يستطيع أيضا أن يخلق فيديو مستوحى من صورة ثابتة أو أن يضيف محتوى بصريا على فيديوهات متوفرة أصلا.
وقالت الشركة: “نحن نعلّم الذكاء الاصطناعي ليتمكن من فهم ومحاكاة العالم الواقعي في حركته، بهدف تدريب النماذج التي من شأنها أن تساعد الأشخاص على حل المشاكل التي تتطلب التفاعل مع العالم الواقعي”.
وأضافت الشركة في مدونتها عدة أمثلة على تلك الفيديوهات الأولية التي يمكن للنموذج صنعها، منها “تريلر لفيلم يظهر مغامرات عالم فضاء ثلاثيني يرتدي بدلة مصنوعة من الصوف الأحمر وخوذة للدراجات النارية، سماء زرقاء، صحراء ملحية، بأسلوب سينمائي، التقط بفيلم 35 ملم، ألوان ساطعة”.
وأعلنت الشركة أنها فتحت المجال لاستخدام “سورا” أمام عدد من الباحثين وصناع الفيديو، وسيتاح للفريق الذي لقبته بـ “red team” اختبار النموذج للتأكد من مواكبته شروط خدمة”أوبن إيه آي” التي تحظر “المحتوى العنيف بشكل مبالغ به والإباحية والصور التي تبث الكراهية وأشباه المشاهير…”.
ولا تزال تجربة النموذج مقتصرة على الباحثين وفناني المحتوى المرئي وصناع الأفلام فقط، إلا أن المدير التنفيذي للشركة، سام ألتمان، استجاب لطلبات المستخدمين عبر تويتر بمقاطع فيديو تم توليدها باستخدام “سورا”، وظهرت علامة عليها تؤكد أن المحتوى تم توليده بالذكاء الاصطناعي.
وأطلقت الشركة لأول مرة مولد الصور الثابتة “دال-إي” في عام 2021 وروبوت الدردشة المولد بالذكاء الاصطناعي “تشات جي بي تي” في نوفمبر عام 2022، والذي جمع بسرعة 100 مليون مستخدم.
وقد طرحت شركات الذكاء الاصطناعي الأخرى أدوات إنشاء الفيديو لأول مرة، على الرغم من أن هذه النماذج لم تكن قادرة إلا على إنتاج بضع ثوانٍ فقط من اللقطات التي غالبا لا تشبه المحتوى المطلوب أو الأصلي.
وقالت شركتا “غوغل” و”ميتا” إنهما بصدد تطوير أدوات فيديو بتقنية الذكاء الاصطناعي التوليدي، على الرغم من أنها لا تتوفر أمام العامة.
وأعلنت “أوبن إيه آي” ،الأربعاء، عن تجربة لإضافة ذاكرة أعمق إلى “تشات جي بي تي” حتى يتمكن من تذكر المزيد من محادثات مستخدميه.
ولم تكشف “أوبن إيه آي” عن كمية اللقطات التي استخدمت لتدريب “سورا” أو أصل الفيديوهات التي استخدمت في تدريبه، إلا أن القائمين على النموذج أكدوا لنيويورك تايمز أن المقاطع المستخدمة في تدريب البرمجية متوفرة للعامة وتحظى بترخيص استخدامها وفق حقوق الطبع من مالكيها.
وذكرت “ذا غارديان” أن الشركة واجهت دعاوى قضائية عدة بتهمة تزوير محتوى يحظى بحقوق طبع محفوظة أنتجته أدوات الذكاء الاصطناعي التابعة لها، والتي تعتمد على المحتوى المنشور على الإنترنت لمحاكاة الصور أو النصوص.
View this post on InstagramA post shared by قناة الحرة | Alhurra (@alhurranews)
الحرة
المصدر: موقع النيلين
كلمات دلالية: الذکاء الاصطناعی أوبن إیه آی
إقرأ أيضاً:
قيمة أبل تقارب 4 تريليونات دولار بفضل الذكاء الاصطناعي
الاقتصاد نيوز - متابعة
تقترب شركة أبل من تحقيق قيمة سوقية تاريخية تصل إلى أربعة تريليونات دولار، وذلك بفضل ترحيب المستثمرين بالتحسينات التي أجرتها الشركة في مجال الذكاء الاصطناعي لدعم مبيعات هواتف آيفون التي شهدت تراجعاً.
وقد تفوقت أبل على إنفيديا ومايكروسوفت في السباق نحو هذه القيمة الكبيرة، حيث ارتفع سعر سهمها بنحو 16% منذ بداية نوفمبر، مما أضاف حوالي 500 مليار دولار إلى قيمتها السوقية.
ووفقاً لسعر الإغلاق الأخير، تقدر القيمة السوقية لأبل بحوالي 3.85 تريليون دولار، وهي قيمة تتجاوز إجمالي قيمة سوقي الأسهم الرئيسيين في ألمانيا وسويسرا معاً.