في 15 ثانية فقط… أداة جديدة لإنتاج الصوت من خلال الذكاء الاصطناعي
تاريخ النشر: 14th, April 2024 GMT
شمسان بوست / متابعات:
عرضت شركة «أوبن إيه آي»، مبتكرة برنامج المحادثة الشهير «تشات جي بي تي» القائم على الذكاء الاصطناعي التوليدي، أداة لاستنساخ الصوت سيكون استخدامها محدوداً لتفادي تسجيل حوادث احتيال أو جرائم.
والأداة التي سُمّيت «فويس إنجين» قادرة على إعادة إنتاج صوت شخص من خلال عينة صوتية مدتها 15 ثانية، على ما ذكر بيان لـ«أوبن إيه آي» تطرّق إلى نتائج اختبار أجري على نطاق صغير.
وأضاف البيان: «ندرك أن القدرة على توليد أصوات تشبه أصوات البشر خطوة تنطوي على مخاطر كبيرة، خصوصاً في عام الانتخابات هذا».
وتابع: «نعمل مع شركاء أميركيين ودوليين من حكومات ووسائل إعلام ومجالات الترفيه والتعليم والمجتمع المدني وقطاعات أخرى، ونأخذ ملاحظاتهم في الاعتبار خلال عملية ابتكار الأداة».
وفي هذا العام الذي يُرتقب أن يشهد انتخابات في دول كثيرة، يخشى الباحثون في مجال التضليل الإعلامي من إساءة استخدام تطبيقات الذكاء الاصطناعي التوليدية، وخصوصاً أدوات استنساخ الصوت التي تُعدّ رخيصة وسهلة الاستخدام ويصعب تتبعها.
وأكدت «أوبن ايه آي» أنها اعتمدت «نهجاً حذراً» قبل نشر الأداة الجديدة على نطاق أوسع «بسبب احتمال إساءة استخدام الأصوات الاصطناعية».
ويأتي عرض الأداة بعدما قام مستشار يعمل في الحملة الرئاسية لمنافس ديمقراطي لجو بايدن، بابتكار برنامج آلي انتحل شخصية الرئيس الأميركي المرشح لولاية جديدة.
ودعا الصوت المشابه لصوت جو بايدن الناخبين إلى الامتناع عن التصويت في الانتخابات التمهيدية في نيو هامبشر.
وحظرت الولايات المتحدة مذّاك الدعوات التي تستخدم فيها الأصوات المستنسخة المولّدة بواسطة الذكاء الاصطناعي، من أجل مكافحة عمليات الاحتيال السياسية أو التجارية.
وأوضحت «أوبن إيه آي» أنّ الشركاء الذين يختبرون «فويس إنجين» وافقوا على قواعد تفرض مثلاً موافقة صريحة من أي شخص قبل استخدام صوته، وضرورة الإشارة بوضوح إلى المستمعين أن الأصوات ابتُكرت بواسطة الذكاء الاصطناعي.
وتابعت الشركة: «اعتمدنا مجموعة من الإجراءات الأمنية، بينها العلامة المائية حتى نتمكن من تتبع أصل كل صوت تبتكره الأداة الجديدة، بالإضافة إلى مراقبة استباقية لاستخدامها».
المصدر: شمسان بوست
كلمات دلالية: الذکاء الاصطناعی
إقرأ أيضاً:
تقنية جديدة تحوّل إشارات الدماغ إلى كلام طبيعي في أقل من ثانية
في إنجاز علمي بارز يجمع بين علوم الأعصاب والذكاء الاصطناعي، تمكَّن باحثون من جامعتَيْ كاليفورنيا في بيركلي وسان فرنسيسكو من تطوير واجهة دماغ-حاسوب «BCI» قادرة على استعادة القدرة على الكلام الطبيعي للأشخاص المصابين بشلل حاد.وقد نُشرت نتائج الدراسة، هذا الأسبوع، في مجلة «نيتشور نيوروساينس «Nature Neuroscience» مُشكّلةً خطوةً كبيرةً نحو التواصل الصوتي الفوري عبر إشارات الدماغ، مما يعيد الأمل والاستقلالية لأولئك الذين فقدوا القدرة على الكلام.
تقنية بلا تأخير
تعتمد هذه التكنولوجيا المتقدمة على نظام مدعوم بالذكاء الاصطناعي قادر على تحويل الإشارات الدماغية إلى كلام مسموع في الوقت شبه الحقيقي، وهو ما يشكل نقلة نوعية في حل مشكلة التأخير الزمني التي طالما عانى منها هذا النوع من التقنيات. يقول الدكتور جوبالا أنومانشيباللي، أستاذ مساعد بقسم الهندسة الكهربائية وعلوم الحاسوب بجامعة كاليفورنيا-بيركلي والمحقق الرئيسي المشارك في الدراسة، إن النهج الذي جرى اعتماده في البث اللحظي يقدم قدرة فك شفرة الكلام بسرعة مشابِهة لتلك التي نراها في أجهزة مثل «أليكسا» و«سيري»، ولكن في خدمة المرضى.
ولطالما شكّل التأخير بين المتحدث والكلام الناتج عن واجهات الدماغ والحاسوب عائقًا كبيرًا أمام التواصل الطبيعي. ففي التجارب السابقة، كان على المستخدم الانتظار نحو 8 ثوانٍ لسماع جملة واحدة. أما النظام الجديد فقد قلّص هذه المدة إلى أقل من ثانية واحدة، ما سمح بتدفق الكلام بشكل طبيعي ومتواصل.
تحسين جودة الحياة
يتوقع الدكتور إدوارد تشانغ، جرّاح الأعصاب في «UCSF» والمحقق الرئيسي الآخر في الدراسة، أن التكنولوجيا الجديدة قد تُحدث فرقًا جذريًّا في حياة المرضى. ويشرح أن هذه التقنية تحمل إمكانات هائلة لتحسين جودة حياة الأشخاص المصابين بشللٍ يؤثر على الكلام. ويرى أنه من المثير أن تُسهم تطورات الذكاء الاصطناعي المتسارعة في جعل هذه الواجهات أقرب إلى الواقع. مِن أبرز نقاط القوة في هذا الابتكار هو مرونته، فقد أثبت الباحثون أن التقنية لا تقتصر على نوع واحد من الأجهزة، بل تعمل بكفاءة مع واجهات دماغية متعددة، مثل الأقطاب الدقيقة المزروعة داخل الدماغ، أو الأجهزة غير التوغلية مثل أجهزة الاستشعار على الوجه التي تقيس النشاط العضلي. يوضح كايلو ليتلجون، طالب الدكتوراه في بيركلي والمؤلف المشارك في الدراسة، أن الخوارزمية نفسها يمكن تطبيقها على تقنيات مختلفة، متى ما توفرت إشارات دماغية واضحة.
ترجمة إشارات الدماغ
تبدأ عملية التحويل من منطقة القشرة الحركية في الدماغ، المسؤولة عن التحكم في عضلات النطق. هناك يجري التقاط الإشارات العصبية وفك تشفيرها باستخدام نماذج ذكية مدرَّبة مسبقًا لفهم أنماط معينة مرتبطة بالكلام. ويشرح شاول جون تشو، المؤلف المشارك في الدراسة، أنه تجري ترجمة الإشارات التي تأتي بعد أن يقرر الشخص ما يريد قوله، وبعد أن يختار الكلمات والحركات اللازمة للنطق.
لتدريب النموذج، تعاوَنَ الباحثون مع مريضة فقدت القدرة على الكلام بعد إصابتها بسكتة دماغية. في جلسات التدريب، كانتِ المريضة تنظر إلى شاشة تعرض جملة مثل: «مرحبًا، كيف حالك؟»، وتحاول قولها بصمت. وعلى الرغم من عدم قدرتها على إصدار أي صوت، تمكَّن النظام من ربط نشاطها العصبي بالجملة المقصودة.
محاكاة الصوت الأصلي
ولأن المريضة لا تملك قدرة على النطق الفعلي، لم يكن لدى الباحثين تسجيلات صوتية حديثة للمقارنة. لذلك، استعانوا بنموذج ذكاء اصطناعي مسبق التدريب لإنشاء صوت اصطناعي يحاكي صوتها قبل الإصابة. ووفق أنومانشيباللي، أدى سماعها صوتها القديم في الزمن الحقيقي إلى جعل التجربة أكثر شعورًا بالتحكم والاندماج. وللتأكد من قدرة النظام على تجاوز حدود البيانات التي تدرَّب عليها، اختبر الباحثون النموذج باستخدام كلمات جديدة مثل أسماء حروف الناتو الصوتية «ألفا، برافو، تشارلي»، فنجح في توليد أصوات مفهومة بدقة، ما يدل على أن النموذج لا يكرر فحسب، بل يتعلم فعليًّا بناء الصوت.
المثير أيضًا أن النظام حافظ على دقته العالية رغم السرعة الكبيرة. يقول ليتلجون: «لقد كان من غير المعروف سابقًا ما إذا كان بالإمكان بث كلام واضح في الزمن الحقيقي مباشرة من الدماغ.. .لكن الآن لدينا هذا الإثبات».
لغة تحمل العاطفة
وفي حين يتطلع الفريق إلى المستقبل، يعمل الباحثون على تحسين الجوانب العاطفية والتعبيرية للكلام، مثل النبرة والحِدّة ومستوى الصوت، بما يعكس المشاعر أو الانفعالات الطبيعية في الحديث.
ففي عالمٍ يزداد فيه اندماج الدماغ مع التكنولوجيا، تمثل هذه الخطوة نقطةَ تحول في استعادة القدرة على التعبير الصوتي، مما يعيد ربط الإنسان بعالمه، من خلال إحدى أكثر أدوات التواصل أساسية، وهي الصوت.
اقرأ أيضًاتحت رعاية وزير الصحة.. انطلاق المؤتمر الدولي الثاني للسكتة الدماغية والقسطرة المخية بالقاهرة
دراسة تكشف تأثير تقليل استخدام الهواتف الذكية على نشاط الدماغ
تمهيداً للتشغيل التجريبي: عميد طب طنطا يتفقد تجهيزات مبنى السكتة الدماغية الجديد بمركز الطب النفسي