مشاكل الذكاء الاصطناعي.. عمليات الاحتيال تطال استنساخ الأصوات
تاريخ النشر: 4th, March 2024 GMT
مشاكل الذكاء الاصطناعي.. عمليات الاحتيال تطال استنساخ الأصوات.
المصدر: شفق نيوز
كلمات دلالية: العراق هاكان فيدان تركيا محمد شياع السوداني انتخابات مجالس المحافظات بغداد ديالى نينوى ذي قار ميسان اقليم كوردستان السليمانية اربيل نيجيرفان بارزاني إقليم كوردستان العراق بغداد اربيل تركيا اسعار الدولار روسيا ايران يفغيني بريغوجين اوكرانيا امريكا كرة اليد كرة القدم المنتخب الاولمبي العراقي المنتخب العراقي بطولة الجمهورية الكورد الفيليون الكورد الفيليون خانقين البطاقة الوطنية مطالبات العراق بغداد ذي قار ديالى حادث سير الكورد الفيليون مجلة فيلي عاشوراء شهر تموز مندلي الذكاء الاصطناعي تكنولوجيا استنساخ الاصوات عمليات الاحتيال
إقرأ أيضاً:
أداة الذكاء الاصطناعي الجديدة من Google Whisk تستخدم الصور كمطالبات
لدى Google أداة ذكاء اصطناعي أخرى لإضافتها إلى المجموعة. Whisk هي أداة توليد صور من Google Labs تتيح لك استخدام صورة موجودة كمطالبة. لكن ناتجها لا يلتقط سوى "جوهر" صورتك المبدئية بدلاً من إعادة إنشائها بتفاصيل جديدة. لذا، فهي أفضل للعصف الذهني والتصورات السريعة بدلاً من تحرير الصورة المصدرية.
تصف الشركة أداة Whisk بأنها "نوع جديد من الأدوات الإبداعية". تبدأ شاشة الإدخال بواجهة عارية مع مدخلات للأسلوب والموضوع. تتيح لك هذه الواجهة التمهيدية البسيطة الاختيار من بين ثلاثة أنماط محددة مسبقًا: الملصق ودبوس المينا والدمية المحشوة. أظن أن Google وجدت أن هذه الأنماط الثلاثة تسمح بنوع المخرجات الأولية التي تعد الأداة التجريبية مثالية لها في شكلها الحالي.
كما ترى في الصورة أعلاه، فقد أنتجت صورة صلبة لدمية ويلفورد بريملي المحشوة. (تحظر شروط جوجل صور المشاهير، لكن ويلفورد تسلل عبر البوابات، ومعه شوفان كويكر، دون تنبيه الحراس.)
يتضمن Whisk أيضًا محررًا أكثر تقدمًا (يمكنك العثور عليه بالنقر فوق "ابدأ من الصفر" من الشاشة الرئيسية). في هذا الوضع، يمكنك استخدام نص أو صورة مصدر في ثلاث فئات: الموضوع والمشهد والأسلوب. يوجد أيضًا شريط إدخال لإضافة المزيد من النص للمسات النهائية. ومع ذلك، في شكله الحالي، لم تنتج عناصر التحكم المتقدمة نتائج تشبه استعلاماتي بأي حال من الأحوال.
على سبيل المثال، تحقق من محاولتي لتوليد السيد بريملي الراحل في مشهد صندوق ضوئي بأسلوب صورة حيوان الفظ المحشو التي وجدتها على الإنترنت:
بصق Whisk ما يبدو أنه ممثل يشبه ويلفورد بريملي بشكل غامض وهو يأكل دقيق الشوفان داخل إطار صندوق ضوئي. بقدر ما أستطيع أن أقول، هذا الرجل ليس دمية محشوة. لذا، فمن الواضح لماذا توصي Google باستخدام الأداة أكثر "للاستكشاف البصري السريع" وأقل للمحتوى الجاهز للإنتاج.
تعترف Google بأن Whisk لن يستمد سوى من "عدد قليل من الخصائص الرئيسية" لصورة المصدر الخاصة بك. "على سبيل المثال، قد يكون للموضوع الناتج طول أو وزن أو تسريحة شعر أو لون بشرة مختلف"، تحذر الشركة.
لفهم السبب، لا تبحث أبعد من وصف Google لكيفية عمل Whisk تحت الغطاء. إنه يستخدم نموذج لغة Gemini لكتابة تعليق تفصيلي للصورة المصدر التي تقوم بتحميلها. ثم يقوم بتغذية هذا الوصف في مولد الصور Imagen 3. لذا، فإن النتيجة هي صورة تعتمد على كلمات Gemini حول صورتك - وليس الصورة المصدر نفسها.
Whisk متاح فقط في الولايات المتحدة، على الأقل في الوقت الحالي. يمكنك تجربته على موقع Google Labs الخاص بالمشروع.