عاجل
رئيس حزب الوفد
د.عبد السند يمامة
رئيس مجلس الإدارة
د.أيمن محسب
رئيس التحرير
د. وجدى زين الدين
رئيس حزب الوفد
د.عبد السند يمامة
رئيس مجلس الإدارة
د.أيمن محسب
رئيس التحرير
د. وجدى زين الدين

يوتيوب يُلغي ضوضاء الذكاء الاصطناعي للقصص على iOS

يوتيوب youtube
يوتيوب youtube

 قد تلاحظ تحسنًا ملحوظًا في جودة الصوت لبعض قصص يوتيوب من الآن فصاعدًا، بفضل ميزة تحسين الكلام الجديدة التي طرحها جوجل.

 

قبل عامين، أطلقت شركة التكنولوجيا العملاقة تقنية الذكاء الاصطناعي "التطلع للاستماع" التي يمكنها انتقاء الأصوات في حشد من الناس، والآن أصبحت التكنولوجيا متاحة لمنشئي المحتوى الذين يسجلون قصص YouTube على أجهزة iOS.

علمت Google البحث في الاستماع إلى الارتباطات بين الكلام والإشارات المرئية، مثل حركات فم المتحدث وتعبيرات الوجه، من خلال تدريبه على مجموعة كبيرة من مقاطع الفيديو عبر الإنترنت.

 

للتأكد من أنها ستعمل مع الجميع ولن تظهر تحيزًا، أجرت Google سلسلة من الاختبارات لاستكشاف أدائها بناءً على السمات المرئية والسمعية المختلفة.

تتضمن هذه السمات عمر المتحدث ولون بشرته ولغته المنطوقة ونبرة الصوت وإمكانية رؤية وجهه ووضع الرأس وشعر الوجه ووجود النظارات ومستوى الضوضاء في الخلفية، كانوا قادرين على تحديد، على سبيل المثال، أن قدرة التكنولوجيا على تحسين الكلام لا تزال متسقة إلى حد كبير عبر لغات المتحدثين، لا يبدو أن لشعر الوجه تأثير كبير عليه أيضًا، على الرغم من أنه يعمل بشكل أفضل على الوجوه التي لا تحتوي على شعر في الوجه والأشخاص ذوي الحلاقة الدقيقة.

 

 كما أوضح عملاق التكنولوجيا في إعلانه كيف طور التكنولوجيا على مدى العامين الماضيين، في البداية

تأكد المطورون من أنه يمكنهم إجراء جميع عمليات المعالجة على الجهاز نفسه، لذلك لا يحتاج إلى إرسال أي شيء إلى خادم بعيد، استخدموا أيضًا تقنية تسمح للميزة باستخراج الصور المصغرة ذات الوجوه من مقاطع الفيديو لتحليلها بسرعة كبيرة، يسمح ذلك للتقنية ببدء تحسين الكلام أثناء استمرار تسجيل الفيديو.

 

قلصت هذه التحسينات حجم الميزة من 120 ميجابايت إلى 6 ميجابايت، مما يسهل نشرها، قالت Google إنها أيضًا خفضت وقت تشغيل "التطلع إلى الاستماع" من 10 مرات في الوقت الفعلي على سطح المكتب باستخدام الصيغة الأصلية إلى 0.5x في الوقت الفعلي باستخدام وحدة المعالجة المركزية لـ iPhone فقط، لن تستغرق التكنولوجيا سوى بضع ثوان لمعالجة قصة مدتها 15 ثانية.

 

 لتنشيط هذه الميزة، يتعين على المنشئين فقط التبديل إلى "تحسين الكلام" في عناصر التحكم في مستوى الصوت على نظام iOS.