Redes

Google Cloud Next ’23: un nuevo servicio generativo impulsado por IA

Google Cloud fuera de la sede.Imagen: Fotografías diversas/Adobe Stock

Google presentó un nuevo conjunto de servicios generativos impulsados ​​por IA en su conferencia Google Cloud Next 2023 en San Francisco el 29 de agosto. En el prelanzamiento, pudimos echar un vistazo temprano a la nueva Cloud TPU de Google, la GPU de máquina virtual A4 con tecnología NVIDIA H100 y más.

Salta a:

Vertex AI aumentó la capacidad y agregó otras mejoras

June Yang, vicepresidenta de IA en la nube y soluciones industriales de Google Cloud, anunció mejoras en Vertex AI, la plataforma de IA generativa de la compañía que ayuda a las empresas a entrenar sus propios modelos de IA y aprendizaje automático.

Las solicitudes de los clientes para poder introducir grandes cantidades de contenido en PaLM, el modelo subyacente de la plataforma Vertex AI, llevaron a Google a aumentar su capacidad de 4.000 tokens a 32.000 tokens, dijo Yang.

Los clientes también solicitan a Vertex AI que admita más idiomas. En la conferencia Next ’23, Yang anunció que PaLM dentro de la plataforma Vertex AI ahora está disponible en árabe, chino, japonés, alemán, español y más. Hay 38 idiomas públicos; 100 opciones de idiomas adicionales ahora están disponibles en vista previa privada.

Ver también: Google abre su Modelo de lenguaje grande PaLM API lanzada en marzo. (República Tecnológica)

Vertex AI Search, ahora disponible, permite a los usuarios crear motores de búsqueda dentro de sus aplicaciones impulsadas por IA. «Piense en esto como buscar en Google los datos de su empresa», dijo Yang.

LEER  Exploit de CPU AMD lanzado por una empresa de seguridad desconocida con 24 horas de anticipación

También se lanza hoy Vertex AI Conversation, una herramienta para crear chatbots. Search and Transform estaba disponible anteriormente con un nombre de producto diferente en Generative AI App Builder de Google.

Mejora del modelo básico de Codey.

Codey, el modelo de texto a código dentro de Vertex AI, se está actualizando. Si bien los detalles sobre la actualización son escasos, Yang dijo que los desarrolladores deberían poder generar código y chatear con códigos de manera más eficiente.

Más cobertura de IA de lectura obligada

«Aprovechando nuestro modelo base Codey, socios como GitLab están ayudando a los desarrolladores a mantener la fluidez al predecir y completar líneas de código, generar casos de prueba, interpretar código y más», señaló Yang.

Haga coincidir la IA de texto con imagen con el estilo artístico de su empresa

El modelo de texto a imagen de Vertex ahora es capaz de realizar ajustes de estilo o coincidir con las pautas creativas y de marca de una empresa. Las organizaciones solo necesitan proporcionar a Vertex 10 imágenes de referencia para comenzar a trabajar con su estilo interno.

Novedades de Vertex AI Model Garden Model Garden

Google Cloud ha agregado Llama 2 de Meta y Claude 2 de Anthropic a la biblioteca de modelos de Vertex AI. Yang dijo que la decisión de agregar Llama 2 y Claude 2 al jardín modelo de IA de Google Cloud «está en línea con nuestro compromiso de fomentar un ecosistema abierto».

«Con estas incorporaciones, Google Cloud ahora ofrece la selección más amplia de modelos en comparación con cualquier otra nube de hiperescala, incluido nuestro modelo propio de Google, modelos de terceros de nuestros socios y modelo de código abierto», dijo Yang. «Con acceso a más de 100 modelos seleccionados en Vertex AI, los clientes ahora pueden elegir un modelo según la modalidad, el tamaño, la latencia de rendimiento y las consideraciones de costo».

Actualizaciones de BigQuery y AlloyDB disponibles para vista previa

BigQuery Studio de Google, una plataforma de trabajo para usuarios que trabajan con datos e inteligencia artificial, y AlloyDB son actualizaciones preliminares.

BigQuery Studio agregado a la vista previa del almacén de datos en la nube

BigQuery Studio estará disponible esta semana como vista previa de BigQuery Cloud Data Warehouse de Google. BigQuery Studio ayuda a analizar y explorar datos y se integra con Vertex AI. BigQuery Studio está diseñado para combinar ingeniería de datos, análisis y análisis predictivo, reduciendo el tiempo que les lleva a los profesionales del análisis de datos cambiar entre herramientas.

A partir de ahora, los usuarios de BigQuery también podrán añadir Duet AI, el asistente de inteligencia artificial de Google.

AlloyDB se mejora con IA generativa

AlloyDB, la base de datos compatible con PostgreSQL de Google para cargas de trabajo empresariales de alto nivel, agrega capacidades de inteligencia artificial generativa, anunció Andy Goodman, vicepresidente y gerente general de Google Database, antes del evento. AlloyDB incluye características adecuadas para organizaciones que crean aplicaciones empresariales de IA, como una función de búsqueda vectorial que es 10 veces más rápida que el PostgreSQL estándar, dijo Goodman. Los desarrolladores pueden generar incrustaciones de vectores en la base de datos para simplificar su trabajo. AlloyDB AI se integra con un ecosistema de herramientas de código abierto como Vertex AI y LangChain.

«Las bases de datos están en el corazón de la innovación en IA de próxima generación, ya que ayudan a cerrar la brecha entre los LLM y las aplicaciones empresariales de IA de próxima generación para ofrecer experiencias precisas, actualizadas y contextualizadas», afirmó Goodman.

AlloyDB AI ahora está disponible en versión preliminar a través de AlloyDB Omni.

Se revela la supercomputación de la máquina virtual NVIDIA A3 para entrenamiento de IA

Mark Lohmeyer, vicepresidente de infraestructura de computación en la nube y aprendizaje automático de Google, anunció en una sesión informativa previa a la conferencia que la máquina virtual A3, una supercomputadora GPU que se ejecuta en una GPU NVIDIA H100, estará disponible de forma general el próximo mes.

La infraestructura de máquina virtual personalizada de 200 Gbps de la supercomputadora A3 presenta transferencias de datos de GPU a GPU, lo que le permite evitar el host de la CPU. La transferencia de datos de GPU a GPU potencia el entrenamiento, el ajuste y el escalado de la IA con 10 veces el ancho de banda del A2 de la generación anterior. El entrenamiento será tres veces más rápido, afirmó Lohmeier.

NVIDIA «nos permite ofrecer la cartera más completa de infraestructura de IA en la nube», dijo Lohmeyer.

Cloud TPU v5e optimizado para inferencia de IA generativa

Google lanzó Cloud TPU v5e, la TPU en la nube de quinta generación optimizada para la inferencia generativa de IA. Las TPU, o Unidades de Procesamiento Tensoriales, son aceleradores de aprendizaje automático alojados en Google Cloud. Las TPU procesan enormes cantidades de datos necesarios para la inferencia, el proceso lógico que ayuda a los sistemas de inteligencia artificial a hacer predicciones.

En comparación con las TPU de la generación anterior, Cloud TPU v5e ofrece dos veces el rendimiento de entrenamiento y 2,5 veces el rendimiento de inferencia, dijo Lohmeyer.

«Con la magia del software y el hardware trabajando juntos con nuevas tecnologías de software como multislice, permitimos a los clientes escalar fácilmente sus [generative] Los modelos de IA van más allá de los límites físicos de un único módulo de TPU o de un único clúster de TPU. «En otras palabras, una sola carga de trabajo de IA de gran tamaño ahora puede abarcar múltiples clústeres físicos de TPU, escalando a decenas de miles de chips, y hacerlo de manera muy rentable». «

El nuevo TPU estará disponible en versión preliminar a partir de esta semana.

Presentamos Google Kubernetes Engine Enterprise Edition

Muchos clientes utilizan Google Kubernetes Engineer para cargas de trabajo de inteligencia artificial y está recibiendo un impulso. GKE Enterprise Edition incluirá escalamiento horizontal de múltiples clústeres, así como servicios de GKE existentes que se ejecutan en GPU y TPU en la nube. Google dice que los primeros informes de los clientes muestran un aumento del 45 por ciento en la productividad y una reducción de más del 70 por ciento en el tiempo de implementación del software.

GKE Enterprise estará disponible en septiembre.

LEER  Cómo agregar un grupo a la solución de almacenamiento conectado a la red TrueNAS SCALE

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba