أداة جديدة لاستنساخ الصوت من “OpenAI”.. إليك تفاصيلها
تاريخ النشر: 31st, March 2024 GMT
مع الانتشار اليومي والمتزايد للتزييف العميق، تعمل شركة “OpenAI” على تحسين تقنيتها المستخدمة لاستنساخ الأصوات، إلا أن الشركة تصر في الوقت نفسه على أنها تفعل ذلك بطريقة مسؤولة جدًا.
أطلقت “OpenAI” محرك صوت جديدًا خاصًّا بها، كتوسيع لواجهة برمجة التطبيقات الحالية لتحويل النص إلى كلام. فبعدما كانت التقنية قيد التطوير لمدة عامين تقريبًا، يسمح “Voice Engine” للمستخدمين بتحميل أية عينة صوتية مدتها 15 ثانية لإنشاء نسخة اصطناعية منها.
إلا أنه لا يوجد موعد محدد لإتاحة التقنية للمستخدمين حتى الآن، مما يمنح الشركة الوقت للرد على كيفية استخدام النموذج وإساءة استخدامه.
وفي هذا الإطار، أوضح الفريق المنتج في “OpenAI” أن الشركة تريد التأكد من أن الجميع يشعرون بالرضا تجاه كيفية نشر التقنية الجديدة، مشيرًا إلى أنه على معرفة بمدى بخطورتها.
تدريب النموذج
يدعم نموذج الذكاء الاصطناعي الذي يعمل على تشغيل المحرك الصوتي من “OpenAI” إمكانات الصوت والقراءة بصوت عالٍ، ويحتوي على أصوات معدة مسبقًا لتحويل النص إلى كلام.
كما يتم تدريب نماذج المحرك الصوتي على تشغيل عدد هائل من تسجيلات الكلام، التي يتم الحصول عليها عادةً من المواقع العامة ومجموعات البيانات حول الويب.
وفي السياق عينه، يرى العديد من موردي الذكاء الاصطناعي الإبداعي، أن بيانات التدريب هي ميزة تنافسية، وتشكل أيضًا مصدرًا محتملاً للدعاوى القضائية المتعلقة بالملكية الفكرية.
وبالفعل، تمت مقاضاة “OpenAI” سابقًا؛ بسبب مزاعم بأن الشركة انتهكت قانون الملكية الفكرية من خلال تدريب الذكاء الاصطناعي الخاص بها على المحتوى المحمي بحقوق الطبع والنشر، بما في ذلك الصور والأعمال الفنية والأكواد والمقالات والكتب الإلكترونية، دون تقديم ائتمان أو أجر للمبدعين أو المالكين.
توليف الصوت
يعمل “Voice Engine” على أخذ عينة صوتية صغيرة ونص، ثم إنتاج خطاب واقعي يطابق المتحدث الأصلي. ويقوم النموذج في الوقت نفسه، بتحليل بيانات الكلام والبيانات النصية المراد قراءتها بصوت عالٍ، مما يؤدي إلى إنشاء صوت مطابق، دون الحاجة إلى إنشاء نموذج مخصص لكل مستخدم.
يذكر أن هذه ليست بتقنية جديدة. فقد قام عدد من الشركات الناشئة بتقديم منتجات استنساخ الصوت لسنوات، من “ElevenLabs” إلى “Replica Studios” إلى “Papercup” إلى “Deepdub” إلى “Respeecher”. وكذلك الأمر بالنسبة لشركات التكنولوجيا الكبرى، مثل: أمازون، غوغل، مايكروسوفت.
إساءة الاستخدام
من الممكن أن يتم إساءة استخدام تطبيقات استنساخ الصوت بطرق تتجاوز مجرد تهديد سبل عيش الممثلين والتأثير على الانتخابات من خلال هذه التقنية. إلا أن هناك خطوات ستتخذها “OpenAI” لمنع إساءة استخدام “Voice Engine”.
قالت الشركة، إنه سيتم توفير “Voice Engine” فقط لمجموعة صغيرة جدًا من المطورين كبداية، وستعطي الشركة الأولوية لحالات الاستخدام منخفضة المخاطر والمفيدة اجتماعيًا، مثل تلك المتعلقة بالرعاية الصحية.
كما ستضع الشركة علامة مائية على النسخ التي تم إنشاؤها باستخدام “Voice Engine” باستخدام تقنية طورتها “OpenAI” والتي تتضمن معرفات غير مسموعة بالتسجيلات، في محاولة لمقاومة التلاعب.
وتخطط “OpenAI” أيضًا لتزويد أعضاء شبكة الفريق الأحمر الخاصة بها، وهي مجموعة متعاقدة من الخبراء الذين يساعدون بتقييم المخاطر، بإمكانية الوصول إلى “Voice Engine” لرصد الاستخدامات الضارة، لتتمكن الشركة من إيجاد حلول لها ومكافحتها.
المصدر: عين ليبيا
كلمات دلالية: الذكاء الاصطناعي
إقرأ أيضاً:
3 طرازات عصرية .. ريدمي تطلق سلسلة هواتف جديدة| إليك المواصفات
إذا كنت تبحث عن هاتف بمواصفات عصرية يمكنك التفكير في سلسلة هواتف ريدمي والتي تأتي بالعديد من المواصفات العصرية .
فوفقا لموقع gizmochina يأتي هاتف Redmi K80 بشريحة Snapdragon 8 Elite كما يأتي مزود بوحدة كاميرا مستديرة وثلاث عدسات وتأتي الكاميرا الأساسية بدقة 50 ميجابكسل.
مواصفات جبارة.. هاتف جديد للألعاب يقلب الموازين يكتسح الجميع .. فيفو تكشف عن هاتف عملاق بمواصفات ومزايا جبارة سلسلة هواتف Redmi K80وفقًا للسريبات، ستتضمن سلسلة هواتف Redmi K80 لثلاثة طرازات على الأقل، مثل Redmi K80e و Redmi K80 و Redmi K80 Pro ومن المرجح أن تعمل هذه الطرازات بمعالج Dimensity 8400 ، وشرائح Snapdragon 8 Gen 3 و Snapdragon 8 Elite على التوالي.
هواتف Redmi K80 جوجل تتفوق على آبل.. تكلفة هاتف Pixel 9 Pro أرخص من آيفون 16 برو مواصفات Samsung a15.. هاتف سامسونج المتميز في فئتهكشفت التسريبات أن إعداد الكاميرا الخلفية لهاتف Redmi K80 Pro سيضم كاميرا أساسية OmniVision Light Fusion 900 بدقة 50 ميجابكسل، وعدسة واسعة الزاوية Samsung S5KKD1 بدقة 32 ميجابكسل، وكاميرا تليفوتوغرافي بدقة 50 ميجابكسل مع تقريب بصري 2.6x.
سيضم هاتف K80 Pro أيضًا كاميرا أمامية OmniVision OV20B بدقة 20 ميجابكسل. ومن المتوقع أن يتميز الهاتف ببطارية تبلغ سعتها حوالي 6000 مللي أمبير في الساعة مع دعم الشحن السريع بقوة 120 وات .
قد يتميز هاتف Redmi K80 بشاشة OLED بدقة 1.5K مدمجة مع ماسح ضوئي لبصمات الأصابع من النوع البصري.
على العكس من ذلك، قد يأتي هاتف K80 Pro بشاشة OLED بدقة 2K تتضمن مستشعر بصمات الأصابع بالموجات فوق الصوتية في الشاشة.