OpenAI يستنسخ الصوت من 15 ثانية فقط
تاريخ النشر: 30th, March 2024 GMT
أعلنت شركة OpenAI للتو أنها أجرت مؤخرًا معاينة على نطاق صغير لأداة جديدة تسمى Voice Engine. هذه تقنية استنساخ صوتي يمكنها تقليد أي مكبر صوت من خلال تحليل عينة صوتية مدتها 15 ثانية. وتقول الشركة إنها تنتج "كلامًا طبيعيًا" بأصوات عاطفية وواقعية.
تعتمد هذه التقنية على واجهة برمجة تطبيقات تحويل النص إلى كلام الموجودة مسبقًا للشركة، وهي قيد العمل منذ عام 2022.
يقول OpenAI إنهم يرون أن هذه التكنولوجيا مفيدة للمساعدة في القراءة وترجمة اللغات ومساعدة أولئك الذين يعانون من حالات النطق المفاجئة أو التنكسية. طرحت الشركة برنامجًا تجريبيًا لجامعة براون ساعد مريضًا يعاني من مشكلات ضعف النطق عن طريق إنشاء محرك صوتي مستنسخ مأخوذ من الصوت المسجل لمشروع مدرسي.
على الرغم من الفوائد المحتملة، فمن المؤكد أن الجهات الفاعلة السيئة ستسيء استخدام هذه التكنولوجيا للانخراط في بعض عمليات التزييف العميق الخطيرة، والتي تمثل مشكلة بالفعل. مع أخذ هذا في الاعتبار، فإن Voice Engine ليس جاهزًا تمامًا للاستخدام في أوقات الذروة، نظرًا لوجود مخاوف خطيرة تتعلق بالخصوصية يجب تلبيتها قبل الإطلاق الكامل.
تعترف شركة OpenAI بأن هذه التقنية تنطوي على "مخاطر جسيمة، والتي تتصدر قائمة أولوياتنا بشكل خاص في عام الانتخابات". وتقول الشركة إنها تدمج التعليقات الواردة من "الشركاء الأمريكيين والدوليين من مختلف أنحاء الحكومة ووسائل الإعلام والترفيه والتعليم والمجتمع المدني وخارجه" لضمان إطلاق المنتج بأقل قدر من المخاطر. وافق جميع مختبري المعاينة على سياسات استخدام OpenAI، التي تحظر انتحال شخصية فرد آخر دون موافقة أو حق قانوني.
بالإضافة إلى ذلك، سيتعين على أي شخص يستخدم التكنولوجيا أن يكشف لجمهوره أن الأصوات يتم إنشاؤها بواسطة الذكاء الاصطناعي. نفذت OpenAI تدابير السلامة، مثل العلامة المائية لتتبع أصل أي صوت و"مراقبة استباقية" لكيفية استخدام النظام. عندما يتم طرح المنتج رسميًا، ستكون هناك "قائمة صوتية محظورة" تكتشف وتمنع مكبرات الصوت التي تم إنشاؤها بواسطة الذكاء الاصطناعي والتي تشبه الشخصيات البارزة.
أما بالنسبة للوقت الذي سيتم فيه هذا الطرح، فإن OpenAI تظل متحفظة. كشفت TechCrunch عن بعض بيانات التسعير المحتملة ويبدو أنها ستؤدي إلى تقويض المنافسين في هذا المجال مثل ElevenLabs. يمكن أن يكلف المحرك الصوتي 15 دولارًا لكل مليون حرف، وهو ما يعادل حوالي 162.500 كلمة. هذا هو طول فيلم The Shining لستيفن كينغ. من المؤكد أنها تبدو طريقة صديقة للميزانية لإنجاز كتاب صوتي. تشير المواد التسويقية أيضًا إلى إصدار “HD” يكلف ضعف السعر، لكن الشركة لم توضح بالتفصيل كيفية عمل ذلك.
قامت OpenAI باتخاذ خطوات كبيرة هذا الأسبوع. لقد أعلنت للتو عن شراكة أخرى مع أفضل صديق لها Microsoft لبناء حاسوب عملاق قائم على الذكاء الاصطناعي يسمى "Stargate". وبحسب ما ورد سيكلف المشروع 100 مليار دولار، وفقًا للمعلومات.
المصدر: بوابة الوفد
إقرأ أيضاً:
OpenAI تكشف عن نموذجها الجديد: قفزة نوعية في معالجة البيانات
مارس 1, 2025آخر تحديث: مارس 1, 2025
المستقلة/- أعلنت شركة OpenAI عن إطلاق نموذجها الجديد للذكاء الاصطناعي، والذي يُتوقع أن يُحدث ثورة في عالم معالجة البيانات. يتميز هذا النموذج بقدرات محسنة في تحليل المعلومات، والتعامل مع البيانات المعقدة، وتقديم استجابات دقيقة وسريعة، مما يجعله أداة قوية للمستخدمين في مختلف المجالات.
ما الجديد في نموذج OpenAI؟يأتي هذا النموذج مع تحسينات كبيرة تشمل:
قدرة متطورة على فهم السياق، مما يجعله أكثر دقة في تحليل البيانات. أداء أسرع في معالجة كميات ضخمة من المعلومات، مما يسهل استخدامه في البيئات التجارية والأكاديمية. تعزيز الفهم اللغوي، حيث يمكنه التعامل مع النصوص بطريقة أكثر طبيعية ودقة. إمكانيات تحليل البيانات لمساعدة الشركات على اتخاذ قرارات أكثر ذكاءً بناءً على أنماط البيانات المتوفرة. تأثيره على المجالات المختلفةمن المتوقع أن يكون لهذا النموذج تأثير كبير على مجموعة واسعة من القطاعات، مثل:
قطاع الأعمال: تحسين عمليات تحليل البيانات واتخاذ القرارات الذكية. التعليم: توفير أدوات متقدمة للمساعدة في البحث والتعلم. الرعاية الصحية: دعم تحليل البيانات الطبية لتشخيص الأمراض بدقة أكبر. هل هو مستقبل الذكاء الاصطناعي؟مع هذه التطورات، يبدو أن OpenAI تقترب أكثر من تحقيق هدفها في تطوير ذكاء اصطناعي قادر على تعزيز الإنتاجية وتحسين جودة الحياة. وبينما تستمر الشركات التكنولوجية في سباقها نحو تقديم نماذج أكثر تطورًا، يبقى السؤال: إلى أي مدى سيغير هذا النموذج طريقة تعاملنا مع البيانات؟