ميزة الصوت التفاعلي الجديدة لـ ChatGPT من OpenAI.. خطوة نحو محادثات طبيعية سلسة
تاريخ النشر: 17th, October 2024 GMT
أعلنت OpenAI عن إطلاق ميزة صوتية جديدة وأكثر تفاعلية لمستخدمي النسخة المدفوعة من ChatGPT، تتيح إجراء محادثات أكثر سلاسة وطبيعية مع الذكاء الاصطناعي.
بحسب “gizchina”، يتم طرحها هذه الميزة المتقدمة تدريجياً، لكنها لم تصل بعد إلى بعض الدول الأوروبية، بما في ذلك المملكة المتحدة.
كشفت OpenAI عن هذه الميزة لأول مرة في مايو 2023، مما أثار اهتماماً واسعاً خاصة عند ظهور صوت مشابه لشخصية سكارليت جوهانسون في فيلم "Her".
بعد ذلك، تم سحب الصوت بناءً على مخاوف قانونية من ممثلي الممثلة، ورغم هذه العقبة، واصلت الشركة تطوير الميزة الصوتية التي تضم الآن تسعة أصوات مختلفة يمكن للمستخدمين الاختيار منها عبر إعدادات التطبيق.
تتميز النسخة المدفوعة بسرعة استجابة أعلى، مع إمكانية مقاطعة الحوار وإجراء تعديلات في الوقت الفعلي. للوصول إلى هذه الإعدادات المتقدمة، يتعين على المستخدمين الاشتراك في إحدى الخطط المدفوعة لـ OpenAI: Plus، أو Team، أو Enterprise.
تأكد من تحديث تطبيق ChatGPT لديك، وبمجرد تفعيل الميزة لجهازك، ستتلقى إشعاراً داخل التطبيق.
اضغط على "متابعة" لبدء المحادثة الصوتية، ثم انقر على أيقونة الموجة الصوتية بجانب رمز الميكروفون لتفعيل وضع الصوت.
استخدامات متنوعة للمحادثات الصوتيةتتميز الميزة الجديدة بالمرونة؛ إذ يمكنك استخدامها لسرد القصص قبل النوم، أو التحضير للمقابلات، أو حتى لتعلم اللغات.
يدعم الذكاء الاصطناعي أيضاً تخصيصات مثل التحدث بسرعة أكبر أو اعتماد لهجة إقليمية معينة.
تواجه OpenAI منافسة متزايدة في مجال الذكاء الاصطناعي الصوتي، حيث قدمت جوجل مؤخراً ميزة الصوت المباشر "Gemini Live" على أجهزة Android، وتخطط ميتا لإطلاق أصوات المشاهير على منصاتها مثل فيسبوك وواتساب.
ومع ذلك، تظل OpenAI متقدمة في مجال الذكاء الاصطناعي التوليدي، حيث بلغ عدد المستخدمين النشطين لـ ChatGPT أكثر من 200 مليون أسبوعياً حتى أغسطس 2023.
فيما تبدأ أسعار الخطط المدفوعة من OpenAI من 20 دولاراً شهرياً، وتشمل الميزات الصوتية المتقدمة، رغم وجود قيود على مدة الاستخدام التي قد تصل إلى 30 دقيقة قبل أن يتلقى المستخدمون إشعارات حول الوقت المتبقي.
المصدر: صدى البلد
كلمات دلالية: الذكاء الاصطناعي فيلم Her تطبيق ChatGPT الذکاء الاصطناعی میزة الصوت
إقرأ أيضاً:
لماذا يعجز الذكاء الاصطناعي عن معرفة الوقت؟
أحدث الذكاء الاصطناعي ثورة كبيرة في العالم الرقمي وغير الطريقة التي ننظر بها إلى التكنولوجيا، ولكن رغم أن هذه التقنية قادرة على توليد الصور وكتابة الروايات وأداء الواجبات المنزلية والتحليل العاطفي، فإنها غالبا ما تفشل في معرفة الوقت أو تحديده.
وفي دراسة نُشرت على موقع "أركايف" (arXiv) – وهو أرشيف مفتوح المصدر للمقالات العلمية –اختبر باحثون في جامعة إدنبرة قدرات 7 أنواع مختلفة من نماذج اللغة الكبيرة "إل إل إم" (LLM) لاختبار قدرتها في معرفة وتحديد الوقت، وشمل اختبارهم أسئلة متنوعة حول صور لساعات وتقويمات مختلفة، وأظهرت الدراسة التي ستصدر بشكل رسمي في شهر أبريل/نيسان القادم أن هذه النماذج تواجه صعوبة في فهم ومعرفة هذه المهام والتي تُعتبر أساسية في حياتنا اليومية.
وكتب الباحثون في الدراسة: "إن القدرة على تفسير واستنتاج الوقت من المدخلات البصرية أمر بالغ الأهمية للعديد من التطبيقات في العالم الحقيقي، بدءا من جدولة الأحداث إلى الأنظمة المستقلة، ورغم التقدم في نماذج اللغة الكبيرة متعددة الوسائط، فإن معظم الأبحاث ركزت على اكتشاف الأشياء وتسمية الصور وفهم المشاهد، ولكنها لم تُركز على الاستنتاج الزمني وهذا ما جعل عامل الوقت مُهملا بالنسبة لهذه الأنظمة."
إعلانواختبر فريق البحث نماذج من مختلف الشركات مثل "شات جي بي تي -4أو" من أوبن إيه آي و"جيميني" من غوغل و"كلود" من أنثروبيك، و"لاما" من ميتا والنموذج الصيني "كوين 2″ من علي بابا و"ميني سي بي إم" من مودل بيست، وقدموا صورا ذات ألوان وأشكال مختلفة لساعات جدارية عادية وساعات بأرقام رومانية وساعات بدون عقرب الثواني، بالإضافة إلى صور لتقويم يُظهر الأيام والأشهر لآخر 10 سنوات.
وفي اختبار الساعات، سأل الباحثون نماذج اللغة الكبيرة: "ما هو الوقت الموضح في الصورة المرفقة؟"، أما بالنسبة لاختبار التقويم فقد طرحوا أسئلة بسيطة مثل "ما هو اليوم الذي يوافق رأس السنة الميلادية؟" وأسئلة صعبة مثل "ما هو اليوم رقم 153 من السنة؟".
وقال الباحثون: "إن قراءة الساعات وفهم التقويم يتطلب خطوات معرفية معقدة، وتحتاج إلى تمييز بصري دقيق – لمعرفة موضع عقارب الساعة وتخطيط التقويم – كما تحتاج إلى تفكير عددي دقيق لحساب عدد الأيام بين تاريخين".
وبشكل عام لم تُحقق نماذج الذكاء الاصطناعي نتائج مرضية، فقد قرأت الوقت على الساعة بشكل صحيح في أقل من 25% من الحالات، وواجهت صعوبة في فهم الساعات التي تحمل أرقاما رومانية أو العقارب التي تملك تصميما مُبتكرا بنفس القدر الذي واجهته مع الساعات التي تفتقر إلى عقرب الثواني، وهنا يشير الباحثون أن المشكلة قد تكمن في اكتشاف العقارب وتفسير الزوايا على ميناء الساعة.
ومن الجدير بالذكر أن نموذج "جيميني" حصل على أعلى درجة في اختبار قراءة الساعات، بينما تفوق نموذج "شات جي بي تي -4أو" في قراءة التقويم وتحديد الوقت بنسبة 80%، وبالمقابل فإن معظم نماذج اللغات الكبيرة الأخرى ارتكبت أخطاء في اختبار التقويم بنسبة 20% تقريبا.
إعلانوقال روهيت ساكسينا أحد مؤلفي الدراسة وطالب دكتوراه في كلية المعلوماتية بجامعة إدنبرة في بيان صادر عن الجامعة: "يستطيع معظم الناس معرفة الوقت واستخدام التقويمات في سن مبكرة، ولكن نتائجنا تُظهر الفجوة الكبيرة في قدرة الذكاء الاصطناعي على تنفيذ ما يُعتبر مهارات أساسية جدا للبشر، ويجب ألا نغفل عن هذه المشاكل في حال أردنا دمج أنظمة الذكاء الاصطناعي في التطبيقات الواقعية الحساسة للوقت مثل الجدولة والأتمتة والتكنولوجيا المساعدة".
وأضاف "رغم أن الذكاء الاصطناعي قادر على إنجاز أغلب واجباتك المنزلية، ولكن لا أنصحك بالاعتماد عليه في الالتزام بأي مواعيد نهائية."