NVIDIA anuncia una plataforma de videoconferencia basada en la nube para ayudar a los equipos virtuales
Las funciones habilitadas para IA, como la corrección de la mirada y el ajuste de la cara, brindan una sensación cara a cara más natural para la colaboración virtual, dice la compañía.
Organizaciones de todo el mundo han hecho la transición al trabajo remoto en los últimos meses debido al coronavirus. Al mismo tiempo, muchas escuelas y universidades han adoptado programas de aprendizaje en línea para mitigar la propagación de la COVID-19 en el campus este otoño. Como resultado, las videoconferencias han reemplazado las experiencias presenciales tradicionales desde el trabajo hasta los eventos sociales, aunque estas plataformas virtuales tienen sus propias deficiencias y limitaciones. El lunes, NVIDIA anunció Maxine, una plataforma de videoconferencia basada en la nube para mejorar el trabajo remoto, el aprendizaje en línea y más. Esto incluye capacidades de inteligencia artificial (IA) que brindan una experiencia en persona más natural para las reuniones virtuales.
Mirar: Calendario editorial de Tecnopedia Premium: políticas de TI, listas de verificación, conjuntos de herramientas e investigaciones disponibles para descargar (República Tecnológica Premium)
“Las videoconferencias ahora son parte de la vida cotidiana y ayudan a millones de personas a trabajar, aprender y jugar, e incluso ver a un médico”, dijo Ian Buck, vicepresidente y gerente general de computación acelerada de NVIDIA. «NVIDIA Maxine integra nuestras capacidades más avanzadas de video, audio e inteligencia artificial conversacional para brindar eficiencias revolucionarias y nuevas capacidades a la plataforma que nos mantiene a todos conectados».
Corrección de mirada AI y alineación facial
A diferencia de las reuniones cara a cara, demostrar la comunicación cara a cara en plataformas como Zoom, Teams, etc. es más desafiante. Para hacer contacto visual «directo» durante una videollamada, los asistentes deben mirar directamente a su cámara web durante la reunión. Si bien esto proporcionará interacciones más tradicionales para otros asistentes, al mirar directamente a la cámara en lugar de a la pantalla en sí, las personas pueden perder las señales clave del lenguaje corporal y otra comunicación no verbal.
Mirar: Procesamiento del lenguaje natural: una hoja de trucos (República tecnológica)
Para ayudar, NVIDIA está aprovechando su red antagónica generativa (GAN) Investigar.Maxine proporciona alineación de rostros y corrección de la mirada en videoconferencias. La corrección de la mirada ajusta automáticamente la posición de los ojos para «simular el contacto visual», lo que hace que parezca que están mirando una cámara web, incluso cuando en realidad están mirando la pantalla. Face Alignment va un paso más allá, cambiando la posición del rostro humano para una sensación más realista de «cara a cara» durante las llamadas virtuales.
Haga más con menos ancho de banda
Maxine usa IA para mejorar la calidad de las reuniones virtuales al tiempo que reduce los requisitos de ancho de banda. En lugar de enviar «una pantalla completa de píxeles de una persona», el software de inteligencia artificial de Maxine analiza el «enfoque clave» de los asistentes individuales y luego «reanima la cara en el video del otro lado» para reducir la transferencia de datos y los requisitos de ancho de banda. Según NVIDIA, esta compresión de video habilitada para IA puede reducir el consumo de ancho de banda «a una décima parte de lo que requiere el estándar de compresión de transmisión de video H.264».
Además, los equipos pueden integrar asistentes virtuales utilizando modelos de lenguaje para habilitar el reconocimiento de voz durante las videoconferencias. Esto permite que el asistente virtual tome notas, responda preguntas, etc. durante la llamada. Estos asistentes también pueden proporcionar subtítulos, transcripción de llamadas y traducción para brindar información más clara a otros asistentes.