Microsoft Teams está usando IA para mejorar el eco, las interrupciones y la acústica

Únete a nuestra comunidad en Telegram

Microsoft ha pasado los últimos dos años agregando nuevas y llamativas características de productividad a Teams, y ahora la compañía está revisando cómo funcionan los fundamentos gracias a la IA. Todos hemos estado en una llamada en la que alguien tiene una acústica de habitación deficiente que dificulta escucharlos, o hemos visto a dos personas tratar de hablar al mismo tiempo creando un incómodo momento de «no, sigues adelante». Las nuevas mejoras de calidad de voz impulsadas por IA de Microsoft deberían mejorar o incluso eliminar estas molestias cotidianas.

Microsoft ahora está utilizando modelos de aprendizaje automático para mejorar la acústica de la habitación para que ya no suene como si estuviera escondido en una cueva. «Si bien hemos estado haciendo todo lo posible con el procesamiento de señal digital para hacer un trabajo realmente bueno en Teams, ahora hemos comenzado a usar el aprendizaje automático por primera vez para crear cancelación de eco donde realmente se puede reducir el eco de todos los diferentes dispositivos», explica Robert Aichner, gerente principal de programas para conversación inteligente y nube de comunicaciones en Microsoft. en una entrevista con The Verge.

Microsoft ha estado probando esto durante meses, midiendo sus modelos en el mundo real para garantizar que los usuarios de Teams noten la reducción del eco y las mejoras en la calidad de las llamadas. El fabricante de software utilizó 30,000 horas de voz para ayudar a entrenar a sus modelos, y capturó miles de dispositivos a través de crowdsourcing donde a los usuarios de Teams se les paga para grabar su voz y reproducir audio desde su dispositivo.

«También simulamos unas 100.000 habitaciones diferentes… la acústica de la sala juega un papel importante en la cancelación de eco», dice Aichner. El resultado son grandes mejoras en la calidad de audio de las llamadas y una eliminación del eco que también permite que varias personas hablen al mismo tiempo. Puedes ver todas las mejoras en acción en el video de arriba.

Si Teams detecta que el sonido está rebotando o reverberando en una habitación, lo que resulta en un audio poco profundo, el modelo también convertirá el audio capturado y lo procesará para que suene como si los participantes de Teams estuvieran hablando en un micrófono de corto alcance en lugar de un lío de eco.

La parte más impresionante es la capacidad de las personas para interrumpirse entre sí en las llamadas de Teams ahora, sin la incómoda superposición en la que no puedes escuchar a la otra persona debido al eco. Microsoft ahora está enviando todo este trabajo en Teams, junto con las mejoras que ha realizado con la supresión de ruido basada en IA anteriormente. Todo el procesamiento se realiza localmente en los dispositivos cliente, en lugar de en la nube.

«Dijimos que queremos hacerlo en el cliente, porque la nube sigue siendo cara si quieres hacer cada llamada procesada en la nube… y obviamente tendríamos que pasar ese costo al cliente», explica Aichner. Eso significaría potencialmente restringir estas importantes mejoras de Teams a los clientes que pagan, y la ruta en el dispositivo significa que funciones como la supresión de ruido están disponibles en el 90 por ciento de los dispositivos que usan Teams.

Todas estas nuevas mejoras de Microsoft Teams ya están disponibles, junto con algunas optimizaciones de pantalla en tiempo real para texto en videos y mejoras basadas en IA a las restricciones de ancho de banda durante las llamadas de video o pantalla compartida.

Últimas noticias