يوتيوب يُلغي ضوضاء الذكاء الاصطناعي للقصص على iOS
قد تلاحظ تحسنًا ملحوظًا في جودة الصوت لبعض قصص يوتيوب من الآن فصاعدًا، بفضل ميزة تحسين الكلام الجديدة التي طرحها جوجل.
قبل عامين، أطلقت شركة التكنولوجيا العملاقة تقنية الذكاء الاصطناعي "التطلع للاستماع" التي يمكنها انتقاء الأصوات في حشد من الناس، والآن أصبحت التكنولوجيا متاحة لمنشئي المحتوى الذين يسجلون قصص YouTube على أجهزة iOS.
علمت Google البحث في الاستماع إلى الارتباطات بين الكلام والإشارات المرئية، مثل حركات فم المتحدث وتعبيرات الوجه، من خلال تدريبه على مجموعة كبيرة من مقاطع الفيديو عبر الإنترنت.
للتأكد من أنها ستعمل مع الجميع ولن تظهر تحيزًا، أجرت Google سلسلة من الاختبارات لاستكشاف أدائها بناءً على السمات المرئية والسمعية المختلفة.
تتضمن هذه السمات عمر المتحدث ولون بشرته ولغته المنطوقة ونبرة الصوت وإمكانية رؤية وجهه ووضع الرأس وشعر الوجه ووجود النظارات ومستوى الضوضاء في الخلفية، كانوا قادرين على تحديد، على سبيل المثال، أن قدرة التكنولوجيا على تحسين الكلام لا تزال متسقة إلى حد كبير عبر لغات المتحدثين، لا يبدو أن لشعر الوجه تأثير كبير عليه أيضًا، على الرغم من أنه يعمل بشكل أفضل على الوجوه التي لا تحتوي على شعر في الوجه والأشخاص ذوي الحلاقة الدقيقة.
كما أوضح عملاق التكنولوجيا في إعلانه كيف طور التكنولوجيا على مدى العامين الماضيين، في البداية
قلصت هذه التحسينات حجم الميزة من 120 ميجابايت إلى 6 ميجابايت، مما يسهل نشرها، قالت Google إنها أيضًا خفضت وقت تشغيل "التطلع إلى الاستماع" من 10 مرات في الوقت الفعلي على سطح المكتب باستخدام الصيغة الأصلية إلى 0.5x في الوقت الفعلي باستخدام وحدة المعالجة المركزية لـ iPhone فقط، لن تستغرق التكنولوجيا سوى بضع ثوان لمعالجة قصة مدتها 15 ثانية.
لتنشيط هذه الميزة، يتعين على المنشئين فقط التبديل إلى "تحسين الكلام" في عناصر التحكم في مستوى الصوت على نظام iOS.