AA de infraestructura de IA y entrenamiento de modelos de DL

Seminario en línea: Descifra el código de la IA generativa - Tendencias de infraestructura y estrategias para el éxito. 25 de junio a las 10 a.m. (PDT).Regístrate ahora.

Ir a

Infraestructura de IA

Infraestructura escalable, rentable y de alto rendimiento para cada carga de trabajo de IA.

Comunícate con nosotros

Aceleradores de IA para cada caso de uso, desde entrenamiento de alto rendimiento hasta inferencia de bajo costo
Escala más rápido con GPU y TPU en Google Kubernetes Engine o Google Compute Engine
Soluciones implementables para Vertex AI, Google Kubernetes Engine y el kit de herramientas de HPC de Cloud
Implementa la arquitectura de la hipercomputadora de IA para aprovechar al máximo nuestra infraestructura de IA

Se nombró a Google líder en el informe The Forrester Wave sobre infraestructura de IA

Más información

Beneficios

Optimiza el rendimiento y el costo a gran escala

Con Google Cloud, puedes elegir entre GPU, TPU o CPU para una variedad de casos de uso que incluyen entrenamiento de alto rendimiento, inferencia de bajo costo y procesamiento de datos a gran escala.

Obtén resultados más rápido con una infraestructura administrada

Escala de forma más rápida y eficiente con la infraestructura administrada que proporciona Vertex AI. Configura entornos de AA con rapidez, automatiza la organización, administra clústeres grandes y configura aplicaciones de baja latencia.

Desarrolla con software diseñado para la IA

Mejora la productividad del desarrollo de la IA aprovechando GKE para administrar cargas de trabajo a gran escala. Entrena y entrega modelos de base compatibles con el ajuste de escala automático, la organización de cargas de trabajo y las actualizaciones automáticas.

Características clave

Hardware flexible y escalable para cualquier caso práctico

No hay un enfoque único cuando se trata de las cargas de trabajo de IA. Es por eso que, junto con nuestros socios de hardware de la industria, como NVIDIA, Intel, AMD, Arm y más, proporcionamos a los clientes la más amplia gama de opciones de procesamiento optimizadas con IA en TPU, GPU y CPU para entrenar y entregar los modelos que consumen más datos.

Fácil de usar, administrar y escalar

Históricamente, la organización de cargas de trabajo de IA a gran escala con las TPU y GPU de Cloud requería un esfuerzo manual para manejar fallas, registros, supervisión y otras operaciones fundamentales. Google Kubernetes Engine (GKE), el servicio de Kubernetes más escalable y completamente administrado, simplifica considerablemente el trabajo necesario para operar las TPU y GPU. Aprovechar GKE para administrar la organización de cargas de trabajo de IA a gran escala en la TPU y GPU de Cloud mejora la productividad en el desarrollo de la IA.

Y para las organizaciones que prefieren la simplicidad de abstraer la infraestructura a través de servicios administrados, Vertex AI ahora admite el entrenamiento con varios frameworks y bibliotecas con la TPU y GPU de Cloud.

Escala tus modelos de IA de manera exponencial

Nuestra infraestructura optimizada con IA se diseñó para entregar el rendimiento y la escala global que exigen los productos de Google, como YouTube, Gmail, Google Maps, Google Play y Android, que prestan servicios a miles de millones de usuarios. Nuestras soluciones de infraestructura de IA se basan en la red de centros de datos de Jupiter de Google Cloud, que admite la mejor capacidad de escalamiento horizontal de la industria para servicios básicos y cargas de trabajo de IA de alta intensidad.

Plataforma abierta y muy flexible

Durante décadas, hemos contribuido a proyectos de IA fundamentales, como TensorFlow y JAX. Somos cofundadores de la Fundación PyTorch y, recientemente, anunciamos un nuevo consorcio de la industria: el proyecto OpenXLA. Además, Google es el principal colaborador de CNCF de código abierto y tiene más de 20 años de historia de contribuciones de OSS, como TFX, MLIR, OpenXLA, KubeFlow y Kubernetes, además de patrocinio de proyectos de OSS fundamentales para la comunidad de ciencia de datos, como Project Jupyter y NumFOCverteUS.

Además, nuestros servicios de infraestructura de IA están incorporados en los frameworks de IA más populares, como TensorFlow, PyTorch y MXNet, lo que permite a los clientes seguir usando el framework que prefieran y no estar limitados a un framework o una arquitectura de hardware específicos.

Logotipo de asociación mejorada de Google Cloud y NVIDIA

BLOG

Anuncio de TPU v5p y la hipercomputadora de IA

Clientes

Clientes que aprovechan la infraestructura de IA de Google Cloud

A medida que la IA abre las puertas a la innovación en todos los sectores, las empresas eligen Google Cloud para aprovechar nuestra infraestructura abierta, flexible y eficiente.

News

Anthropic forja una sociedad con Google Cloud para ofrecer una IA confiable y responsable

Lectura de 5 min

Blog post

Cómo Cohere acelera el entrenamiento de modelos de lenguaje con las TPU de Google Cloud

Lectura de 10 min

News

Midjourney elige Google Cloud para potenciar su plataforma de creatividades generadas por IA

Lectura de 5 min

Blog post

Cómo Osmo digitaliza los aromas con la tecnología de IA de Google Cloud

Lectura de 5 min

Blog post

AI21 aprovecha la infraestructura de Google Cloud, incluidas las GPU y TPU, para el entrenamiento y la inferencia

Lectura de 5 min

Ver todos los clientes

Novedades

Sesión separada de Cloud TPU v5e de Google Next '24

Video

Lleva la IA a gran escala de la investigación a la producción con la hipercomputadora de IA de Google CloudVer el video

Blog post

Anunciamos las supercomputadoras A3 con GPU NVIDIA H100, diseñadas específicamente para la IALeer el blog

Blog post

Comienza a usar Ray en Google Kubernetes EngineLeer el blog

Arquitectura de entrega de AA en el perímetro

Blog post

Cómo compilar y ejecutar casos de uso de IA en el perímetroLeer el blog

Blog post

TensorFlow en Autopilot de GKE con aceleración de GPULeer el blog

Blog post

Ejecuta la inferencia por lotes de AlphaFold con Vertex AI PipelinesLeer el blog

Documentación

Google Cloud Basics

Herramientas de Infraestructura de IA en GKE

Ejecuta cargas de trabajo de IA/AA optimizadas con las funciones de organización de la plataforma Google Kubernetes Engine (GKE).

Más información

Google Cloud Basics

Deep Learning VM Images

Las imágenes de Deep Learning VM Image están optimizadas para las tareas de ciencia de datos y aprendizaje automático. Vienen con frameworks de AA clave y herramientas ya instaladas, y funcionan con las GPU.

Más información

Google Cloud Basics

Contenedores de aprendizaje profundo

Los contenedores de aprendizaje profundo son entornos coherentes y optimizados para el rendimiento que te ayudan a crear prototipos y a implementar flujos de trabajo con rapidez en CPU o GPU.

Más información

Tutorial

¿Cómo se optimizan las unidades de procesamiento tensorial para la IA o el AA?

Obtén información sobre los requisitos de procesamiento del aprendizaje automático y cómo las TPU se diseñaron para encargarse de la tarea.

Más información

Google Cloud Basics

Arquitectura del sistema de TPU

Las TPU son ASIC de Google desarrollados de manera personalizada que se usan para acelerar las cargas de trabajo de aprendizaje automático. Obtén información sobre la arquitectura de sistema subyacente de las TPU desde cero.

Más información

¿No encuentras lo que buscas?

Ver toda la documentación del producto

Casos de uso

Arquitectura de la hipercomputadora de IA

Caso de uso

Acelera el entrenamiento de IA a gran escala

El entrenamiento de Cloud TPU Multislice es una tecnología de pila completa que permite entrenar modelos de IA a gran escala de manera rápida, fácil y confiable en decenas de miles de chips TPU.

Google Cloud basics

Cómo escalar el entrenamiento de IA con Cloud TPU Multislice

Cloud TPU Multislice es una tecnología de entrenamiento de pila completa y a gran escala que permite escalar de forma fácil, rentable y casi lineal hasta decenas de miles de chips.

Más información

Quickstart

Entrena a gran escala con el framework Nemo de NVIDIA

Aprende a implementar el kit de herramientas de HPC de Google Cloud junto con el framework NEMO de NVIDIA para el entrenamiento distribuido.

Más información

Caso de uso

Entrega aplicaciones potenciadas por IA

El ecosistema de software abierto de Google Cloud te permite compilar aplicaciones con las herramientas y los frameworks que más te convengan y, al mismo tiempo, aprovechar los beneficios de la relación precio-rendimiento de la arquitectura de la hipercomputadora de IA.

Google Cloud basics

Ejecuta la IA en GKE completamente administrado

Google Kubernetes Engine en modo piloto automático es una forma popular de ejecutar cargas de trabajo de IA, como el entrenamiento y la entrega de modelos de lenguaje grandes (LLM).

Más información

Google Cloud basics

Comienza a usar Ray en Google Kubernetes Engine

Ray.io es un framework de código abierto para escalar con facilidad aplicaciones de Python en varios nodos de un clúster.

Más información

Caso de uso

Maximiza el precio y el rendimiento para entregar IA a gran escala

Las GPU de Cloud TPU v5e y NVIDIA L4 permiten una inferencia rentable y de alto rendimiento para una amplia gama de cargas de trabajo de IA, incluidos los modelos de IA generativa y LLM más recientes. Ambas opciones ofrecen mejoras significativas en cuanto al precio en comparación con los modelos anteriores, y la arquitectura de hipercomputadora de IA de Google Cloud permite a los clientes escalar sus implementaciones a niveles líderes en la industria.

Google Cloud basics

Cloud TPU v5e acelera la inferencia de IA a gran escala

Google Cloud TPU permite que las empresas ejecuten inferencias en modelos de IA de vanguardia con más rapidez, a mayor escala y a un menor costo.

Más información

Quickstart

Entrega un modelo con GKE en una sola GPU

Aprende a entregar modelos abiertos con GKE aprovechando una sola GPU.

Más información

Google Cloud basics

Escala la entrega de modelos a varias GPU

Aprende a escalar la entrega de modelos comunes de código abierto en varias GPU en GKE.

Más información

Ver todas las guías técnicas

Precios

Los precios de la Infraestructura de IA se determinan en función del producto seleccionado. Puedes comenzar a usar la Infraestructura de IA de Google sin costo con Colab o el nivel gratuito de Google Cloud.

Cloud TPU	GPU de Cloud
Si quieres más información sobre los precios de TPU para los tipos de TPU de dispositivo único y pod de TPU, consulta los precios de TPU.	Para obtener información sobre los precios de los diferentes tipos de GPU y las regiones disponibles, consulta los precios de GPU.

Los productos de IA de Cloud satisfacen las políticas de nuestros ANS. Es posible que ofrezcan garantías de latencia o disponibilidad distintas de otros servicios de Google Cloud.

Da el siguiente paso

Comienza a desarrollar en Google Cloud con el crédito gratis de $300 y los más de 20 productos del nivel Siempre gratuito.

Probar Google Cloud gratis

¿Necesitas ayuda para comenzar?
Comunicarse con Ventas
Trabaja con un socio confiable
Buscar un socio
Sigue explorando
Ver todos los productos

Infraestructura de IA

Optimiza el rendimiento y el costo a gran escala

Obtén resultados más rápido con una infraestructura administrada

Desarrolla con software diseñado para la IA

Características clave

Hardware flexible y escalable para cualquier caso práctico

Fácil de usar, administrar y escalar

Escala tus modelos de IA de manera exponencial

Plataforma abierta y muy flexible

Clientes que aprovechan la infraestructura de IA de Google Cloud

Novedades

Documentación

Herramientas de Infraestructura de IA en GKE

Deep Learning VM Images

Contenedores de aprendizaje profundo

¿Cómo se optimizan las unidades de procesamiento tensorial para la IA o el AA?

Arquitectura del sistema de TPU

¿No encuentras lo que buscas?

Arquitectura de la hipercomputadora de IA

Acelera el entrenamiento de IA a gran escala

Entrega aplicaciones potenciadas por IA

Maximiza el precio y el rendimiento para entregar IA a gran escala

Precios

Da el siguiente paso

¿Necesitas ayuda para comenzar?

Trabaja con un socio confiable

Sigue explorando