تقنيون لـ"الرؤية": نموذج "جيميني" ثورة تقنية في عالم الذكاء الاصطناعي التوليدي
تاريخ النشر: 17th, February 2024 GMT
◄ إطلاق "جيميني" بثلاث نسخ مطورة وبأكثر من 40 لغة
◄ "جيميني" قادر على التعامل مع البيانات الضخمة والتعليمات البرمجية المتنوعة
◄ الكلباني: النموذج قادر على فهم المحتوى البصري وتحليله
◄ الزكواني: "جيميني" يستطيع محاكاة فهم الإنسان للنصوص والصور
◄ النموذج لديه القدرة على تعليم المهارات واللغات المختلفة حسب مستوى المستخدم
الرؤية - سارة العبرية
تسابق الشركات التكنولوجية العملاقة الزمن للوصول إلى نماذج متطورة من الذكاء الاصطناعي، في ظل ما يشهده العالم من تطورات سريعة وثورة ضخمة في مجال التقنيات، وهو ما أثار قلق البعض بسبب التحديات التي قد تواجه البشر في التعامل مع الآلات الذكية.
ومن أبرز الطفرات التي تحققت في هذا المجال، هو ظهور الذكاء الاصطناعي التوليدي حيث لم يقتصر الأمر على فهم اللغة فحسب؛ بل تطور ليشمل القدرة على التحليل والاستنتاج بطرق تشبه إلى حد كبير التفكير البشري.
ومن الأمثلة على هذا النوع من الذكاء الاصطناعي هو Google Gemini، والذي يعد النموذج الأكثر تقدمًا والأحدث بين النماذج التي طورتها شركة Google والذي أتى بديلاً عن نموذجها Bard.
وتشير بعض المصادر إلى أن قوة هذا النموذج تكمن في التدريب على مجموعة بيانات ضخمة من النصوص والتعليمات البرمجية، والتي يعتقد بأنها تتجاوز 1.56 تريليون معلومة متجاوزًا GPT-4 بنحو 13%، ما يعكس قدرته على الفهم والتعلم مستفيدا من مجموعة واسعة من البيانات تشمل النصوص والصور والفيديوهات من خدمات Google المختلفة، مثل البحث ويوتيوب ما يؤهله لفهم وتحليل المحتوى المتنوع بشكل فعّال.
وأُطلق "جيميني" يوم 7 فبراير بثلاث نسخ: Ultra، Pro، وNano، مصممة للعمل على مختلف الأجهزة ومتاح بأكثر من 40 لغة ومن بينها اللغة العربية، وفي أكثر من 170 دولة حول العالم؛ حيث النسخة Ultra أو Gemini Advanced غير المجانية (19.99 دولار) مخصصة للمهام المعقدة وتفوقت في بعض اختبارات الذكاء الاصطناعي على GPT-4.
أما النسخة pro 1.5 الصادرة كتحديث من إصدارها الأولي Pro 0.1 يوم 15 من الشهر الجاري والتي توازن بين الأداء والقابلية للتوسع أتت بميزات تجعل منها خيار مثالياً للاستخدام بين مختلف النماذج المجانية؛ حيث يمكن من خلالها رفع ملفات PDF وتحليلها وتحليل مقاطع فيديو طويلة ومقاطع صوت تصل مدتها لساعات، علماً بأنَّ هذه النسخة هي بديلاً لنموذج Bard المتاح للجمهور حول العالم، بالإضافة إلى نسخة Nano المتاحة فقط على الهاتف الذكي Google Pixel 8 Pro، المصمم للعمل على الأجهزة المحمولة ويدعم ميزات مثل الردود الذكية وغيرها من الخدمات غير المعقدة.
ويقول سعيد بن محمد الكلباني أخصائي خدمات رقمية: "تستند النماذج التوليدية في الذكاء الاصطناعي إلى تقنيات التعلم الآلي، والتعلم العميق، والشبكات العصبية الذكية في تكوينها وآلية عملها، و Gemini، على سبيل المثال دمج فيه تقنيات متقدمة لمعالجة اللغة الطبيعية، مما يمنحه القدرة على تفسير ومُعالجة اللغة بكفاءة للتعامل مع الاستفسارات والبيانات والنصوص بمختلف أنواعها".
ويضيف: "كما يتميز بقدرته على التعرف وفهم المحتوى البصري، ممكنًا إياه من استيعاب الرسوم البيانية والتصاميم المعقدة دون الحاجة إلى الاعتماد على تقنيات التعرف الضوئي على الحروف".
ويشير الكلباني إلى أن هذه الخصائص تحول Gemini إلى أداة مُتميزة لتحليل النصوص والصور بدقة عالية، مما يفتح المجال لاستخدامه في طيف واسع من الخدمات والتطبيقات التي توفرها Google، مبينا: "على سبيل المثال يمكن للمستخدم أن يتفاعل مع Gemini لأغراض تعلم اللغات من خلال التفاعل معه وتخصيص تجربته حسب ما يناسبه ويمكن للنموذج تقييم التعلم والأداء بشكل عام".
من جهته، يوضح المهندس رائف بن علي الزكواني مدرب معتمد ومختص في الذكاء الاصطناعي، أن اللغات التي يدعمها تطبيق جيميني يأتي على رأسها العربية والإنجليزية واليابانية والكورية، إذ يتميز نموذج الذكاء الاصطناعي بالقدرة الكبيرة والإمكانيات العالية في فهم البيئة ومحاكاة فهم الإنسان للنصوص والصور والفيديوهات والصوتيات وحتى أكواد البرمجة، كما له قدرة في التحليل والاستنتاجات كأوراق بحثية بسرعة ودقة أكثر.
ويضيف: "يمكن للمستخدمين تخصيص تجربتهم في التطبيق جيميني وذلك عبر محاكاة وتجسيد شخصية ونبرة صوت واللغة المرغوبة في التحدث عند إنشاء محتوى إبداعي أو فني أو أدبي أو تقني، وفقًا لتفضيلات المستخدم، كما أن جيميني يستخدم تقنيات الترجمة الآلية لترجمة النصوص من لغة إلى أخرى، ويعتمد على نموذج لغة كبير (LLM-MMLU) تم تدريبه على مجموعة بيانات ضخمة من النصوص والشفرات في مختلف اللغات، مما يتيح لهذا النموذج من جيميني فهم اللغة بشكل عميق وتوليد نصوص جديدة".
ويلفت الزكواني إلى أنه "رغم فوائد جيميني، إلا أنه قد يعرض معلومات غير دقيقة أو غير ملائمة للموضوع المطروح، ويجري تطوير جيميني بشكل مُستمر، ولا يزال غير قادر على أداء جميع المهام بشكل مثالي في الوقت الحالي".
وبالنسبة لتوليد الصور، يبيّن الزكواني: "ينشئ صورًا واقعية أكثر بعكس chatGPT، ولكن ChatGPT يفوز عندما يتعلق الأمر بإنشاء صور تتطابق بشكل وثيق مع ما يطلبه المستخدم باستخدام هندسة الأوامر prompting".
مصدر للتعلم
ويذكر سعيد الكلباني أنه يمكن أن يكون Gemini مصدراً للتعلم والتدريب في مختلف الجوانب الأكاديمية والتربوية والأدبية من خلال التفاعل مع هذا النموذج المتقدم، موضحا: "رغم أن جوجل لم تطلق حتى الآن ميزة بناء الوكلاء المخصصين مثل OpenAI وغيرها، إلا أن المستخدم يمكنه أن يستخدم أو يتعلم من خلال Gemini حسب ما يناسبه".
ويبيّن الكلباني: "يمكن للمستخدم أن يختار اللغة التي تناسبه للاستخدام أو حتى تعلمها، وتحديد مستوى التعلم سواء كان مبتدئا أو متقدما، واختيار نوع الأنشطة والأساليب والطرق، فعلى سبيل المثال، نفترض بأن مستخدما أراد تعلم اللغة اليابانية بواسطة Gemini؛ فالأمر يتطلب منه أن يدخل مطالبة تحدد هدفه ومستواه في اللغة والأسلوب الذي يفضله للتعلم وأنواع الأنشطة ومستواها ومجالاتها، وكل ذلك يكون من خلال نص يكتبه بلغته الأم ويقدمه لنموذج Gemini وسوف يستجيب النموذج لذلك، كما يمكن للمستخدم التفاعل وتوجيه النموذج حسب المتغيرات التي تطرأ أثناء التعلم، باختصار يمكن أن يكون Gemini معلماً ومرشداً وموجهاً ومقيماً لعملية التعلم".
قدرات "جيميني"
ويوضح الكلباني أن المستخدم هو المحرك والموجه الرئيس لقدرات أي نموذج لغوي، فعلى سبيل المثال عند استخدام Gemini لتعلم اللغة اليابانية، فإن المستخدم يمكن أن يوجه النموذج لتوفير خطة وبرنامج يتعلم من خلالهما اللغة حسب مستواه، إذ يركز Gemini على تعلم اللغات حسب المستوى المستهدف من خلال بناء محتوى يهدف إلى مساعدة المستخدم على تعلم كيفية التواصل بفاعلية باللغة التي يتعلمها، وإعداد الأنشطة التي تساعد على استخدام اللغة في العالم الحقيقي، والتعلم بأساليب مُمتعة وفعّالة من خلال الأنشطة التفاعلية.
ويمكن لنموذج Gemini مساعدة المستخدمين على تحسين مهارات النطق بتقديم العديد من التمارين التي تساعد على تعلم كيفية نطق الكلمات بشكل صحيح، وتقديم أمثلة من المتحدثين الأصليين، وملاحظات في الوقت الفعلي مما يضفي على العملية التعليمية التي يخوضها المستخدم الكثير من النشاط والشمول.
ويضيف: "تتطلب أي عملية تعلم وجود أنشطة تقييم تتناسب مع مستوى المحتوى المقدم للتعلم وأيضاً مع مستوى وتقدم المتعلم في العملية، وعليه يمكن للمستخدم أن يعتبر Gemini معلماً له ويطلب منه أن يقيم مستواه في بداية مشوار التعلم، ومن ثم يقدم له المحتوى بناءً على تلك النتيجة ويمكن أن يكون المحتوى بأسلوب قصصي أو حواري أو ضمن لعبة تفاعلية نصية"، مضيفا أنه بعد التفاعل مع المحتوى يمكن للمستخدم أن يطلب أنشطة تقييميه مختلفة ومنوعه كأسئلة قصيرة وأخرى طويلة واختيار من متعددة والإكمال وغيرها.
ويبين الكلباني: "لإثبات فاعلية Gemini في تعليم اللغات للمبتدئين، قمنا بعمل اختبار للنموذج بتوجيهه لإنشاء محتوى باللغة الإنجليزية مناسب لمتعلم مبتدئ بعمر 7 سنوات ويكون المحتوى ضمن قصة مرتبطة برحلة سياحية في سلطنة عُمان، وقمنا بتوجيه النموذج إلى تقديم أسئلة لتقييم فهم المتعلم للقصة ومدى إلمامه بمجموعة من الكلمات الواردة في القصة، فكانت النتيجة كتقييم عام ممتازة من حيث دقة المحتوى وارتباطه بمستوى المتعلم وتعدد الكلمات وعدد الأسئلة وتنوعها التي على المستخدم الإجابة عليها وتكشف مدى فهمه، وعلاوة على ذلك عمل النموذج على تقييم إجابات المتعلم وإصدار تقرير حول أدائه المرتبط بأسئلة التقييم".
ويختم حديثه قائلا: "يبرز Gemini كأداة تعليمية وتحليلية متميزة، وبذلك فهو يُتيح الفرصة للمستخدمين ليس فقط للتعلم بطرق مُبتكرة وفعّالة؛ بل وأيضًا لتقييم التقدم وتخصيص التجربة التعليمية حسب احتياجاتهم الفردية، حيث يمثل Gemini مع النماذج اللغوية الأخرى خطوة واسعة في حاضر أصحبت فيه التكنولوجيا شريكًا أساسيًا في رحلة التعلم والاستكشاف".
المصدر: جريدة الرؤية العمانية
إقرأ أيضاً:
الذكاء الاصطناعي في طريقه إلى ما يفوق الذكاء
ترجمة: أحمد شافعي
قبل وقت غير بعيد أصبح الذكاء الاصطناعي ذكيًا. وقد يرفض البعض هذا الزعم، ولكن عدد من يشكّون في فطنة الذكاء الاصطناعي يتناقص.
وفقًا لاستطلاع رأي أجرته مؤسسة يوفجوت سنة 2024، تقول أغلبية واضحة من الراشدين الأمريكيين إن أجهزة الكمبيوتر بالفعل أشد ذكاء من الناس أو ستكون كذلك عما قريب.
ومع ذلك، لكم أن تتساءلوا عما لو أن الذكاء الاصطناعي فعلا ذكي؟
في عام 1950، ذهب عالم الرياضيات آلن تورينج إلى أن هذا سؤال خاطئ؛ لأنه أشد غموضا من أن يستحق البحث العلمي. وذهب إلى أنه بدلا من محاولة تحديد ما إذا كانت أجهزة الكمبيوتر ذكية، يجب علينا أن نرى ما لو أنها قادرة على الاستجابة للأسئلة بطريقة لا تتميز عن طريقة البشر. ورأى هذا الاختبار، المعروف باختبار تورينج، لا بوصفه معيارًا للذكاء وإنما بوصفه بديلا أكثر برجماتية لهذا المعيار.
وبدلًا من افتراض تعريف للذكاء، ثم التساؤل عما لو أن الذكاء الاصطناعي يستوفي هذا التعريف، فإننا نفعل أمرًا أكثر ديناميكية؛ إذ نتفاعل مع الذكاء الاصطناعي متزايد التطور ونرى كيف يتغير فهمنا لما نحسب أنه الذكاء.
لقد تنبأ تورنج بأنه في نهاية المطاف «سوف يتبدل استعمال الكلمات والرأي العام المستنير تبدلًا كبيرا بحيث يتسنى للمرء الحديث عن آلات تفكر دون أن يتوقع اعتراضًا من أحد».
واليوم وصلنا إلى هذه النقطة. فالذكاء الاصطناعي لا يقل في كونه ذكاء عن كون التصوير الفوتوغرافي الرقمي تصويرًا فوتوغرافيًا.
والذكاء الاصطناعي الآن في سبيله إلى القيام بأمر أشد روعة: وذلك أن يكون ذا وعي. وسوف يحدث هذا بمثل الطريقة التي أصبح بها ذكيا. فمع تفاعلنا مع ذكاء اصطناعي متزايد التطور سوف يتكون لدينا مفهوم للوعي أكثر احتواء.
قد تعترضون على هذا وتعتبرونه لعبًا بالكلمات، وترون أنني أقول إن الذكاء الاصطناعي سوف يصبح واعيًا لأننا سوف نشرع في استعمال كلمة «الوعي» على نحو يشمله. لكن ما من تلاعب بالكلمات؛ فثمة دائما حلقة تغذية ارتجاعية بين نظرياتنا والعالم، فتتكون مفاهيمنا بقوة ما نكتشفه.
وانظروا إلى الذرة. على مدى قرون، كان مفهوم الذرة لدينا يضرب بجذوره في نظرية يونانية قديمة عن وحدات الواقع غير القابلة للانقسام. وحتى أواخر القرن التاسع عشر، كان علماء فيزياء من أمثال جون دالتن لا يزالون يرون أن الذرات كريات صلبة غير قابلة للانقسام. لكن بعد اكتشاف الإلكترون سنة 1897 واكتشاف النواة الذرية عام 1911، روجع مفهوم الذرة، فتحولت من كيان غير قابل للانقسام إلى كيان قابل للتفكك، أشبه بنظام شمسي تدور فيه الإلكترونات حول النواة. ومع تزايد الاكتشافات تزايدت مراجعة المفاهيم، بما أدى إلى ما لدينا الآن من نماذج الذرة المعقدة القائمة على ميكانيكا الكم.
ولم تكن تلك محض تغيرات لفظية؛ فقد تحسن فهمنا للذرة من خلال تفاعلنا مع العالم. ولذلك فإن فهمنا للوعي سوف يتحسن من خلال تفاعلنا مع الذكاء الاصطناعي متزايد التطور.
قد يعترض المشككون على هذا التشبيه. وسوف يذهبون إلى أن اليونانيين كانوا مخطئين في تصور طبيعة الذرة، لكننا لسنا مخطئين في تصور طبيعة الوعي لأننا نعرف مباشرة ما الوعي: وهو التجربة الذاتية الداخلية. وسوف يصر المشككون في برنامج الدردشة الآلي على أنه لا يتكلم عن إحساس بالسعادة أو الحزن إلا لأن هذه العبارات جزء من بياناته التدريبية، لكنه لن يعرف أبدا ما إحساس السعادة أو الحزن.
لكن ما معنى أن نعرف ماذا يكون إحساس الحزن؟ وكيف نعرف أنه شيء لا يمكن أن يجربه الوعي الرقمي؟ قد نظن ـ بل لقد تعلمنا بالفعل أن نفكر ـ أننا معشر البشر لدينا بصيرة مباشرة في عالمنا الداخلي، بصيرة لا تتأثر بالمفاهيم التي تعلمناها؛ غير أننا بعد أن نتعلم من شكسبير كيف يمكن أن يكون حزن الفراق عذبًا، نكتشف أبعادًا جديدة في تجربتنا. فأكثر ما «نشعر» به إنما نتعلمه.
لقد ذهبت الفيلسوفة سوزان شنيدر إلى أنه سوف تكون لدينا أسباب لاعتبار الذكاء الاصطناعي واعيا إذا ما قال نظام كمبيوتري دونما تدريب إن لديه تجارب ذاتية داخلية للعالم. فلعل هذا يشير إلى وعي لدى نظام الذكاء الاصطناعي؛ لكن هذا معيار بعيد، وهو معيار نحن البشر أنفسنا قد لا نستوفيه؛ لأننا أيضا مدرَّبون.
يتخوف البعض من أنه في حال اكتساب الذكاء الاصطناعي الوعي سوف يستحق منا مراعاة معنوية، أي أنه سيصبح ذا حقوق، ولن يتسنى الاستمرار في استعماله كيف نشاء، وأننا قد نضطر إلى حمايته من الاستعباد. لكن في حدود ما أفهم، ما من تبعة مباشرة تترتب على الزعم بأن مخلوقًا واعٍ، ومفادها أنه يصير بذلك مستحقا للاعتبار المعنوي. ولو أن ذلك قائم، فإن أغلبية هائلة من الأمريكيين على الأقل يبدون غير واعين به. فليس النباتيون إلا نسبة ضئيلة من الأمريكيين.
وكما أن الذكاء الاصطناعي دفعنا إلى رؤية سمات معينة في الذكاء البشري باعتبارها أقل قيمة مما كنا نتصور (من قبيل القدرة على الحفظ وسرعة الاسترجاع)، فسوف يدفعنا وعي الذكاء الاصطناعي إلى استنتاج أنه ليست أشكال الوعي كافة تستحق الاعتبار المعنوي. أو أنه بالأحرى سوف يعزز الرأي الذي يبدو أن الكثيرين يتبنونه: وهو أنه ليست كل أشكال الوعي ذات قيمة معنوية مماثلة لقيمتنا.
لقد كنت حتى وقت قريب أجادل في مسألة ما إذا كان الكمبيوتر ذكيا. وقبل أن أنتبه، وجدتني أجادل في ما إذا كان الذكاء الاصطناعي يمكن أن يفوقنا ذكاء. وعندي فضول لأن أعرف إن كنتم تظنون أن الذكاء الاصطناعي قادر على تكوين وعي، أم أنكم ترون أن دون ذلك عوائق لا تحصى. ولو أن الذكاء الاصطناعي قادر على تكوين وعي، فهل يجعلنا هذا ملزمين معنويا بمعاملته على نحو معين؟
باربرا جيل مونتيرو أستاذة الفلسفة في جامعة نوتردام ومؤلفة كتاب «فلسفة العقل: مقدمة موجزة جداً».
الترجمة عن ذي نيويورك تايمز