جهاز يحوّل حركة عضلات الحنجرة لكلام.. بدعم الذكاء الاصطناعي
تاريخ النشر: 21st, March 2024 GMT
قطع فريق بحثي من مهندسي جامعة كاليفورنيا في لوس أنجلوس خطوة كبيرة على طريق تسهيل تواصل مرضى الحبال الصوتية أو المتعافين من جراحات سرطان الحنجرة مع الآخرين، وذلك بعد أن نجحوا في تجاوز صعوبات الحلول المتاحة حاليا عبر اختراع جهاز مدعوم بالذكاء الاصطناعي لترجمة حركات عضلات الحنجرة إلى كلام مسموع.
وقبل هذا الاختراق الذي أُعلن عن تفاصيله في دراسة نشرتها دورية "نيتشر كوميونيكيشنز"، كانت هناك محاولات لمساعدة الأشخاص الذين يعانون من اضطرابات الصوت، منها "الأجهزة الكهربائية الحنجرية المحمولة"، ولكن الجهاز الجديد يمثل تقدما كبيرا من حيث صغر حجمه وسهولة استخدامه ودقته في ترجمة حركات العضلات إلى كلام مسموع.
وتعمل "الأجهزة الكهربائية الحنجرية المحمولة" بإجراءات معقدة، حيث يضع المستخدم الجهاز على منطقة الرقبة أو الحلق، وعادة ما يكون ذلك فوق عظمة الترقوة مباشرة أو قرب الحنجرة، فيُصدر الجهاز اهتزازات تنتقل بدورها عبر الجلد وأنسجة الرقبة إلى الجهاز الصوتي. وبينما يولّد الجهاز اهتزازات، يقوم المستخدم بالتعبير بفمه لتحويل تلك الاهتزازات إلى أصوات كلام، وتحدد حركات فم المستخدم وتعبيراته الأصوات والكلمات التي يُنتجها.
وتكمن سلبيات هذه الأجهزة في أنها "غير مريحة" في الاستخدام ولا تحقق الدقة الكافية، فضلا عن أن التواصل باستخدامها يكون مرهقا، بسبب التأخير في ترجمة الاهتزازات إلى أصوات، وهي المشاكل التي نجح الجهاز الجديد المدعوم بالذكاء الاصطناعي في تجاوزها.
الأجهزة الحنجرية المحمولة المتاحة حاليا تعمل باجراءات معقدة و"غير مريحة" (ماين ميديكال) كيف يعمل الجهاز الجديد؟والجهاز الجديد ناعم ورفيع وقابل للتمدد، وتبلغ مساحته ما يزيد قليلا عن بوصة مربعة واحدة (1 بوصة = 2.54 سنتيمتر)، ويزن نحو 7 غرامات، ويمكن ربطه بالجلد خارج الحلق، ويتكون من مكونين رئيسيين هما "مكون الاستشعار" و"مكون التشغيل"، فيكتشف الأول الإشارات الناتجة عن حركات العضلات في الحنجرة ويحولها إلى إشارات كهربائية، ويقوم الثاني -القائم على خوارزمية التعليم الآلي- بترجمة هذه الإشارات الكهربائية إلى كلام مسموع.
ويحتوي المكونان على خمس طبقات، اثنتان تعطيان خصائص مرنة وأعدتا من مركب السيليكون المتوافق حيويا (ثنائي ميثيل بولي سيلوكسان)، واثنتان مصنوعتان من طبقة حث مغناطيسية أُعدت من ملفات الحث النحاسية، وتقع بين المكونين الطبقة الخامسة التي تحتوي أيضا على "ثنائي ميثيل بولي سيلوكسان" ممزوجة بمغناطيسات صغيرة تولّد مجالا مغناطيسيا.
ويستخدم الجهاز آلية استشعار مرنة مغناطيسية طورها فريق البحث عام 2021، حيث يكتشف التغيرات في المجال المغناطيسي الناتجة عن حركة عضلات الحنجرة، وتعمل ملفات الحث الموجودة في الطبقات المغناطيسية المرنة على توليد إشارات كهربائية عالية الدقة لأغراض الاستشعار، وتُستخدم خوارزمية التعلم الآلي لتفسير الإشارات الكهربائية الناتجة عن حركات العضلات إلى كلام.
جهاز الحنجرة صُمم ليكون مرنا بما يكفي للتحرك والتقاط نشاط عضلات الحنجرة الموجودة تحت الجلد (جامعة كاليفورنيا) خوارزمية التعلم الآلي.. الميزة الأهموتلعب خوارزمية التعلم الآلي الموجودة في الجهاز دورا حاسما في فهم وترجمة حركات عضلات الحلق إلى كلام مفهوم، وتعد هذه هي نقطة التميز الأهم في الجهاز.
ووفق ما ذكره الباحثون في الدراسة، يمكن تلخيص دورها في الآتي:
مرحلة التدريب: تتعلم خوارزمية التعلم الآلي من الأمثلة المقدمة أثناء مرحلة التدريب، وفي هذه الحالة يرتدي الأفراد الأصحاء الجهاز ويقولون جملا محددة بصوت عال وبصمت. التعرف على الأنماط: بينما يتحدث هؤلاء الأفراد، تقوم الخوارزمية بتحليل أنماط حركات العضلات التي اكتشفها الجهاز، وتتعلم ربط هذه الأنماط بالكلمات أو الجمل المقابلة التي يحاول الأفراد قولها. إنشاء نموذج: بناء على البيانات التي جُمعت أثناء التدريب، تقوم الخوارزمية بإنشاء نموذج يترجم حركات العضلات لكلمات أو عبارات محددة، ويقوم هذا النموذج بشكل أساسي بتعليم الجهاز كيفية التعرف على حركات العضلات المختلفة وتفسيرها على أنها كلام. الترجمة في الوقت الفعلي: عندما يُستخدم الجهاز من قبل شخص يعاني من اضطراب صوتي، تساعد خوارزمية التعلم الآلي على الترجمة في الوقت الفعلي، فهي تفسر حركات العضلات التي اكتشفها الجهاز وتختار الكلمات أو العبارات المناسبة بناء على النموذج الذي تعلمته. تحسين الدقة: بمرور الوقت، ومع جمع المزيد من البيانات واستمرار الخوارزمية في التعلم، تصبح أكثر دقة في التعرف على حركات العضلات وترجمتها إلى كلام، وتساعد عملية التعلم المستمر هذه على التحسين المستمر لأداء الجهاز وفعاليته في التواصل. نجاح بنسبة 95%ويشرح جون تشن الأستاذ المساعد في الهندسة الحيوية في كلية سامويلي للهندسة بجامعة كاليفورنيا والباحث الرئيسي بالدراسة في بيان صحفي أصدرته الجامعة؛ التجارب التي قاموا بإجرائها للتأكد من أن الجهاز يعرف الكلمات التي يجب أن يقولها.
ويقول تشن إن "الباحثين طلبوا من بعض الأشخاص الأصحاء ارتداء الجهاز وقول جمل معينة، ثم استخدموا خوارزمية التعلم الآلي لمعرفة أي حركات عضلات الحلق تتوافق مع الكلمات، فعلى سبيل المثال عندما يحرك الشخص عضلات حلقه بطريقة معينة، فهذا يعني أنه يريد أن يقول "مرحبا راشيل، كيف حالك اليوم؟".
ويضيف أنه "بعد تعليم خوازمية التعلم الآلي أي حركات تتوافق مع الكلمات، قاموا باختبار الجهاز مرة أخرى على هؤلاء الأشخاص الأصحاء، وعندما حاول الأشخاص قول تلك الجمل استمع الجهاز إلى حركة عضلات الحلق، وقال الكلمات الصحيحة بصوت عالٍ، ونجح الأمر بشكل جيد وبدقة تصل إلى 95%".
تركيبة الجهاز تسمح بتحويل حركة العضلات إلى إشارات كهربائية تُحول في النهاية بمساعدة التعلم الآلي إلى تعبير صوتي مسموع ( جامعة كاليفورنيا)ويخطط فريق البحث لمواصلة توسيع مفردات الجهاز من خلال التعلم الآلي واختباره على الأشخاص الذين يعانون من اضطرابات النطق، مما يمنحهم وسيلة للتواصل بسهولة أكبر.
وتحدث اضطرابات الصوت في جميع الأعمار والفئات الديمغرافية، حيث أظهرت الأبحاث أن ما يقرب من 30٪ من الأشخاص يعانون من اضطراب واحد على الأقل في حياتهم، كما يوضح تشن.
ويضيف أن "الحلول الحالية مثل أجهزة الحنجرة الكهربائية المحمولة غير مريحة، ويقدم هذا الجهاز الجديد خيارا مريحا يمكن ارتداؤه لمساعدة المرضى على التواصل خلال الفترة التي تسبق العلاج وأثناء فترة التعافي".
اختراق ينتظره الكثيروبدورها، تُثْني استشارية أمراض السمع والكلام بوزارة الصحة المصرية إيمان مصطفي، على هذا الاختراق الذي وصفته بـ"المهم جدا"، لأنه يحقق عدة مزايا لا توجد في الخيارات المتاحة حاليا، وهي:
سهولة الاستخدام؛ فهو يلتصق على الجلد خارج الحلق، مما يجعله أكثر راحة وملاءمة للمستخدمين. الدقة؛ فقد حقق مستوى من الدقة في ترجمة حركات العضلات إلى كلام مسموع (دقة تقارب 95%) لم تحققه الحلول الأخرى. استخدام خوارزمية التعلم الآلي، فالجهاز يمكنه تعلم المزيد من حركات عضلات المستخدمين، مما يحسّن دقته بمرور الوقت. القدرة على ترجمة حركات العضلات إلى كلام مسموع في الوقت الحقيقي، وهذا يعني أنه يمكن للمستخدم التواصل بشكل طبيعي وعفوي دون تأخير أو عمليات مرهقة.لكن، ومع كل هذه المزايا، فإن خروج الجهاز إلى الواقع العملي ليكون خيارا متاحا للأشخاص الذين يعانون من اضطرابات في النطق، يحتاج إلى عمل إضافي من الباحثين للإجابة على عدة أسئلة، وهي:
أولا: كيف سيعمل الجهاز عند استخدامه مع الأفراد الذين يعانون من أنواع مختلفة من اضطرابات الصوت وشدتها؟ حيث يمكن للتجارب السريرية التي تشمل مشاركين يعانون من مسببات مختلفة لاضطرابات الصوت تقييم فعالية الجهاز وسلامته وتأثيره في نتائج التواصل. ثانيا: هل يمكن للجهاز أن يكمل أساليب العلاج الصوتي وإعادة التأهيل الحالية؟ حيث تتيح للدراسات اللاحقة التحقق من أوجه التعاون المحتملة بين الجهاز والعلاجات التقليدية مثل التمارين الصوتية. ثالثا: كيف يمكن إتاحة الجهاز بكلفة معقولة للأفراد الذين يعانون من اضطرابات الصوت، بما في ذلك الذين ينتمون إلى المستويات الاقتصادية المنخفضة؟ حيث يمكن للأبحاث اللاحقة أن تستكشف إستراتيجيات لخفض التكاليف.المصدر: الجزيرة
كلمات دلالية: رمضان 1445 هـ حريات اضطرابات الصوت الجهاز الجدید
إقرأ أيضاً:
بشأن الذكاء الاصطناعي.. منافسة شرسة بين غوغل و"ChatGPT"
الاقتصاد نيوز _ متابعة
تعمل شركة "غوغل" على تطوير وضع ذكاء اصطناعي جديد (AI Mode) لتعزيز قدرات محرك البحث الخاص بها ومواجهة المنافسة المتزايدة مع "ChatGPT Search" الذي أطلقته شركة "أوبن إيه آي".
التحديات والفرص أمام "غوغل" يمثل إطلاق "ChatGPT Search" نقلة نوعية في عالم محركات البحث، حيث أصبح متاحاً لجميع المستخدمين مؤخراً بعد أن كان مقتصراً على المشتركين المميزين. ورغم أن محرك البحث هذا لا يشكل تهديداً مباشراً لـ"Google Search"، إلا أن دقة نتائجه وتفاعليتها أثارت اهتمام المستخدمين.
في المقابل، تواجه "غوغل" تحديات تتعلق بدمج الذكاء الاصطناعي في منصتها الضخمة التي تعتمد عليها مئات الملايين يومياً. تجربة إطلاق "Bard" السابقة كشفت عن بعض الأخطاء، ما دفع الشركة إلى مراجعة استراتيجياتها التقنية لتقديم تجربة موثوقة ومنافسة.
مزايا "AI Mode" الجديد وفقاً لتقارير إعلامية، يعمل وضع الذكاء الاصطناعي الجديد كخيار إضافي إلى جانب القوائم الحالية مثل الصور والفيديوهات. سيوفر هذا الوضع:
إجابات تفاعلية ومخصصة.
روابط مباشرة لمصادر ذات صلة.
إمكانية طرح أسئلة متابعة بواجهة سهلة الاستخدام.
الميزة الأبرز التي تقدمها "غوغل" هي قدرة المستخدمين على العودة بسهولة إلى نتائج البحث التقليدية، ما يضمن تلبية احتياجات جميع الفئات.
موعد الإطلاق وتوقعات المستقبل رغم عدم إعلان "غوغل" عن موعد رسمي لإطلاق "AI Mode"، تشير التقارير إلى أن العمل على هذه التقنية بدأ منذ فترة طويلة. الصور المسربة من النسخ التجريبية لتطبيق "غوغل" على "أندرويد" تؤكد اقتراب طرح هذه الميزة.
سباق الذكاء الاصطناعي مستمر مع احتدام المنافسة بين "غوغل" و"أوبن إيه آي"، يبقى الابتكار مفتاح التميز. وبينما يركز "ChatGPT Search" على التفاعلية وسهولة الاستخدام، تسعى "غوغل" إلى الجمع بين الذكاء الاصطناعي والموثوقية، ما يعد بتحولات جذرية في طريقة البحث عن المعلومات.