استنساخ الأصوات بواسطة الذكاء الاصطناعي في دائرة الضوء بعد حادثة سكارليت جوهانسون
تاريخ النشر: 3rd, June 2024 GMT
تثير تقنية استنساخ الصوت مخاوف كثيرة مع إقدام عدد من الشركات على اعتمادها، كـ"أوبن إيه آي" مُبتكرة برنامج "شات جي بي تي" الشهير، التي اضطرت أخيرا للاعتذار من الممثلة سكارليت جوهانسون بعدما نسخت صوتها في أحدث نسخة من برنامجها للمحادثة الآلية، بحسب ما أوردته وكالة الأنباء الفرنسية.
وقد اعتذر مدير عام "أوبن إيه آي" سام ألتمان من الممثلة وأعلن تعليق صوت أداة المساعدة "سكاي" في "شات جي بي تي".
وكانت الشركة قدّمت عرضا في سبتمبر/أيلول الفائت لسكارليت التي أعارت صوتها قبل نحو 10 سنوات لنظام بالذكاء الاصطناعي في فيلم "هير"، لكنّ الممثلة رفضت أن تكون صوت نظام النسخة الجديدة من "شات جي بي تي".
ونفت "أوبن إيه آي" من جانبها أن تكون قد استنسخت صوت جوهانسون، مشيرة إلى أنها ابتكرت أداتها باستخدام صوت ممثلة أخرى.
وتتصدر أخبار عن حيل صوتية مشابهة جدا للواقع أو عمليات احتيال أو تضليل باستخدام الاستنساخ الصوتي، عناوين الأخبار باستمرار، مسلّطة الضوء على قدرة أنظمة الذكاء الاصطناعي على تقليد الأصوات البشرية.
وفي العام الفائت، حذرت شركة "إيليفن لابز" (Eleven Labs) الناشئة التي تعمل على ابتكار أداة لاستنساخ الصوت باستخدام الذكاء الاصطناعي، من الاستعمال المسيء لبرنامجها.
وكان مستخدمون مجهولون على منتدى "4 تشان" (4Chan) تداولوا رسائل فيها عمليات استنساخ لأصوات مشاهير، وجعلوا هذه الأصوات تتلفظ بأقوال تنطوي على معان جنسية أو عنصرية أو معادية للمثليين.
وفي أحد المقاطع الصوتية، يُسمَع صوت مزيّف للممثلة إيما واتسون وهي تقرأ مقطعا من كتاب "كفاحي" لأدولف هتلر.
سكارليت أعارت صوتها قبل نحو 10 سنوات لنظام بالذكاء الاصطناعي في فيلم "هير" (مواقع التواصل الاجتماعي) "نقلة نوعية"وأوضح مدير شركة "سنتيزيا" الناشئة رجل الأعمال الدانماركي فيكتور ريباربيلي، في حديث إلى وكالة الأنباء الفرنسية، أنّ هذه التكنولوجيا تم ابتكرها إلى حد كبير من خلال برنامج مفتوح المصدر يسمى "تورتس" وأُطلق قبل عامين.
وتقوم شركته بتحويل النص إلى مقطع فيديو باستخدام صورة رمزية (أفاتار) تم إنشاؤها بواسطة الذكاء الاصطناعي. وتوظف ممثلين يخضع صوتهم وشكلهم لعقد مدته عامين، مع احتمال تجديده، على قول ريباربيلي الذي التقت به وكالة الأنباء الفرنسية على هامش معرض "فيفاتك" للتكنولوجيات الجديدة الذي أقيم أخيرا في باريس.
وقد حلّل برنامج التعلم الآلي "تورتس" آلاف الساعات من التسجيلات الصوتية وكان بمثابة قاعدة لتطبيق "إيلفن لابس".
وقال ريباربيلي: "كان ذلك نقلة نوعية مهمة".
وتستخدم "أوبن إيه آي" برامج مماثلة، رغم أنها لا تكشف تفاصيل ذلك.
ومع "شات جي بي تي 4.0″، يمكن للمستخدم التلفّظ ببضع جمل بالفرنسية أمام التطبيق القادر في دقائق معدودة على إعادة إنتاج هذا الصوت واستخدامه لسرد مقطع فيديو قصيرة بـ5 لغات مختلفة، بحسب ما أظهرت "أوبن إيه آي" خلال عرض توضيحي للبرنامج في باريس.
وعلى غرار هذه الشركة الأميركية، باتت مئات الشركات تقدّم خدمة استنساخ الصوت التي أصبحت واقعية ودقيقة بصورة أكبر.
ومن بينها "تالكر. إيه آي" (TALKR.ai)، وهي شركة فرنسية للمساعدين الصوتيين الافتراضيين الذين يتم إنشاؤهم بواسطة الذكاء الاصطناعي.
ويمكن لهذه الخدمة التعامل مع 25% إلى 30% من مكالمات خدمة الزبائن من دون أي تدخل بشري، بحسب رئيستها كاتيا لينيه.
وترى لينيه كما فيكتور ريباربيلي أنّ استخدام أصوات الممثلين من دون موافقتهم هو خط أحمر.
المصدر: الجزيرة
كلمات دلالية: حريات الذکاء الاصطناعی استنساخ الصوت شات جی بی تی أوبن إیه آی
إقرأ أيضاً:
3 اكتشافات تمت بفضل الذكاء الاصطناعي في 2024
وفي السطور التالية نرصد أبرز تلك الاكتشافات: مخطوطات هيركولانيوم تمكن ثلاثة من الباحثين من من الكشف عن محتوى مخطوطات هيركولانيوم المتفحمة والتي لم تكن قابلة للقراءة، بفضل أدوات الذكاء الاصطناعي.
وكانت هذه المخطوطات الهشة عُرضة للتفتت، كما أن لونها الأسود جعل من الصعب قراءة أي كتابات عليها، ولكن بفضل الذكاء الاصطناعي والأشعة السينية عالية الدقة، تم فك شفرة أكثر من 2000 حرف داخل المخطوطات.
وكان هذا الإنجاز كشف عن أول مقاطع كاملة من البرديات التي نجت من ثوران جبل فيزوف في عام 79 بعد الميلاد، ضمن بعض القطع الأثرية المتعلقة بروما القديمة واليونان، التي تم إنقاذها مما يُعتقد أنه منزل والد زوجة يوليوس قيصر.
وعن الطريقة التي تم بها فك رموز الكتابة، قال أستاذ علوم الكمبيوتر في جامعة كنتاكي والذي يعمل على فك شفرة المخطوطات منذ أكثر من عقد من الزمان، برنت سيلز، إن الكتابة تكون موجودة في المخطوطات ولكنها تكون مدفونة ومموهة في الورق.
ومن خلال الذكاء الاصطناعي يتم تكثيف هذه الكتابة وتضخيم قابلية قراءة الحبر، وفق سيلز.
التعرف على لغة الحيتان توصل العلماء من قبل إلى أن الأصوات التي تنتجها حيتان العنبر تختلف في طولها الموجي وإيقاعها، ولكن دلالة هذه اللغة ظلت لغزًا محيرًا بالنسبة للعلماء.
ولكن الذكاء الاصطناعي ساعد على تحليل نحو 9000 تسلسل نقرات مسجلة، تسمى الكودات، والتي تمثل أصوات حوالي 60 حوتًا من حيتان العنبر في البحر الكاريبي.
وسمح هذا التقدم في جعل لغة الحيتان قابلة في يومًا ما للتفسير بجانب بعض الحيوانات الأخرى.
وفي التجربة، قام العلماء برصد نهاية أصوات الحيتان، وخلال تبادل النداء، وكذلك الاستجابات بين الكائنات البحرية العملاقة.
ومن خلال عرض تلك الأصوات على أدوات الذكاء الاصطناعي، نتجت أنماط مقطعية أشبه بالأصوات التي ينتجها البشر.
واكتشفت البرامج 18 نوعًا من الإيقاع (تسلسل الفواصل الزمنية بين النقرات)، وخمسة أنواع من السرعة (مدة الكودا بأكملها)، وثلاثة أنواع من الروباتو (الاختلافات في المدة)، ونوعين من الزخارف “نقرة إضافية” تمت إضافتها في نهاية الكودا في مجموعة من الكودات الأقصر.
ويسعى العلماء في المراحل المقبلة لإجراء اختبارات تفاعلية مع الحيتان مع مراقبة سلوكها، بما يفتح الباب لفهم لغتها بشكل كامل.
كشف المواقع الأثرية على غرار المخطوطات الورقية، يعمل الذكاء الاصطناعي حاليًا على كشف المواقع الأثرية والرموز الغامضة المدفونة تحت الأرض في صحراء نازكا في بيرو.
وقديمًا، قضى العلماء ما يقرب من نصف قرن في الكشف عن تلك الآثار وتوثيقها. وغالبًا ما تكون الصور التوضيحية الممتدة، والتي لا يمكن رؤيتها إلا من الأعلى، تصور تصميمات هندسية وأشكال تشبه البشر وحتى حوت قاتل يحمل سكينًا.
وقام العماء بقيادة ماساتو ساكاي، أستاذ علم الآثار في جامعة ياماغاتا اليابانية، بتدريب نموذج الذكاء الاصطناعي لاكتشاف نحو 430 رمزًا من خلال التقاط صور عالية الدقة لها.
وخلال الفترة بين سبتمبر 2022 وفبراير 2023، بدأ الفريق في التأكد من صحة هذه الرموز عن طريق مسح شامل لصحراء نازكا من خلال الطائرات بدون طيار. ونجح العلماء في إثبات صحة نحو 303 من الرسوم الجيوجليفية التصويرية، مما أدى إلى مضاعفة عدد الرسوم الجيوجليفية المعروفة تقريبًا في غضون أشهر