INTELIGENCIA ARTIFICIAL

Google Cloud Speech API obtiene una actualización empresarial con nuevas herramientas y más de 30 idiomas

Google está agregando soporte para nuevas funciones llamadas marcas de tiempo a nivel de palabra, archivos de hasta tres horas de duración y más idiomas a su API Cloud Speech.

El lunes, Google anunció una nueva actualización de su API Cloud Speech que podría ayudar a convertirla en una herramienta más efectiva para los usuarios comerciales.Según Google entrada en el blogla API está obteniendo una nueva característica llamada marca de tiempo a nivel de palabra, junto con soporte para 30 nuevos idiomas y archivos de tres horas.

Para aquellos que no estén familiarizados, la API de Google Cloud Speech utiliza modelos de redes neuronales para permitir a los desarrolladores convertir audio en texto. Está alimentado por aprendizaje automático y devuelve resultados en tiempo real.

La publicación afirma que las marcas de tiempo a nivel de palabra son la característica más solicitada de la API por parte de los desarrolladores. Esencialmente, esta función agrega una marca de tiempo a cada palabra que reconoce en una transcripción determinada. «Las marcas de tiempo a nivel de palabra permiten a los usuarios saltar al momento en que se habla el texto en la voz, o mostrar texto relacionado mientras se reproduce el audio», decía la publicación.

Ver también: Cómo aprendimos a hablar con las computadoras y cómo aprendieron a responder (descarga en PDF)

Uno de los clientes mencionados en la publicación, Happy Scribe, utiliza marcas de tiempo a nivel de palabra para reducir el tiempo que les lleva revisar las transcripciones proporcionadas a los clientes. Otra empresa, VoxImplant, lo utiliza para analizar mejor las llamadas telefónicas grabadas entre dos partes.

LEER  Walmart implementa robots de escaneo de estantes para liberar personal para ayudar a los clientes

como un anuncio más amplio En torno a las capacidades de entrada de voz de Google, Cloud Speech API ahora brindará soporte para 30 idiomas adicionales, lo que eleva el total a 119. Estos idiomas estarán inicialmente disponibles para los clientes de la API de Cloud Speech, pero finalmente serán compatibles con otros productos de Google, como Gboard.

como se mencionó Stephanie Condón de ZDnetel soporte de idiomas ampliado podría ayudar a Google a ganar algunos clientes en los mercados emergentes.

Se puede encontrar una lista completa de idiomas utilizados con la API de Cloud Speech aquí.

Además, la publicación dice que Cloud Speech API ahora admitirá archivos de más de tres horas de duración, un aumento del límite anterior de 80 minutos. Los documentos de más de tres horas se pueden ampliar «apoyo caso por caso» solicitando una cuota Soporte en la nube. «

3 conclusiones de los lectores de Tecnopedia

  1. La API de Google Cloud Speech ahora admite 119 idiomas y archivos de tres horas de duración, con nuevas capacidades de marca de tiempo a nivel de palabra.
  2. No hay una marca de tiempo a nivel de palabra. 1 La función más solicitada que permite a los desarrolladores saltar al momento en que se pronuncia una palabra en una grabación de audio.
  3. Estas características podrían ayudar a que la API sea más amigable para los negocios, y el soporte de idiomas podría ganarle a Google algunos negocios en los mercados emergentes.

voiceinput

LEER  Cómo acceder rápidamente a Google Bard (guía paso a paso)

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba