Entrenamiento de modelos de aprendizaje automático y profundo de AI Infrastructure

Webinar: Descifrando el código de la IA generativa: tendencias de infraestructura y estrategias para el éxito. 25 de junio, a las 10:00 (PDT). Inscribirme ahora.

Ir a

AI Infrastructure

Infraestructura escalable, de alto rendimiento y rentable para todas las cargas de trabajo de IA.

Contacta con nosotros

Aceleradores de IA para cada caso práctico, desde entrenamiento de alto rendimiento hasta inferencias de bajo coste
Escala más rápidamente con GPUs y TPUs en Google Kubernetes Engine o en Google Compute Engine
Soluciones desplegables para Vertex AI, Google Kubernetes Engine y el kit de herramientas de HPC de Cloud
Saca el máximo partido a nuestra infraestructura de IA desplegando la arquitectura hiperordenador de IA

Google recibe la designación de líder en el informe The Forrester Wave sobre infraestructura de IA

Más información

Ventajas

Optimiza el rendimiento y el coste a escala

Con Google Cloud, puedes elegir GPUs, TPUs o CPUs para cubrir distintos casos prácticos, como entrenamiento de alto rendimiento, inferencias de bajo coste y procesamiento de datos a gran escala.

Obtén resultados más rápido con una infraestructura gestionada

Escala de forma más rápida y eficiente con la infraestructura gestionada proporcionada por Vertex AI. Permite configurar rápidamente entornos de aprendizaje automático, automatizar la orquestación, gestionar clústeres grandes y configurar aplicaciones de baja latencia.

Desarrolla con software diseñado específicamente para la IA

Mejora la productividad del desarrollo de IA usando GKE para gestionar cargas de trabajo a gran escala. Entrena y sirve los modelos básicos con compatibilidad para el autoescalado, la orquestación de cargas de trabajo y las actualizaciones automáticas.

Características principales

Hardware flexible y escalable para cualquier caso práctico

No hay una solución universal en lo que respecta a las cargas de trabajo de IA. Por eso, junto con nuestros partners de hardware del sector, como NVIDIA, Intel, AMD, Arm y otros, ofrecemos a los clientes la mayor variedad de opciones de computación optimizadas para IA de TPUs,GPUs y CPUs para entrenar y servir los modelos que más datos consumen.

Fácil de usar, gestionar y escalable

Orquestar cargas de trabajo de IA a gran escala con TPUs y GPUs de Cloud siempre ha requerido un esfuerzo manual para gestionar los fallos, el almacenamiento de registros, la monitorización y otras operaciones básicas. Google Kubernetes Engine (GKE), el servicio de Kubernetes más escalable y totalmente gestionado, simplifica considerablemente el trabajo necesario para operar con TPUs y GPUs. Usar GKE para gestionar la orquestación de cargas de trabajo de IA a gran escala en las TPU de Cloud y la GPU de Cloud mejora la productividad del desarrollo de IA.

Además, para las empresas que prefieran la sencillez de abstraerse de la infraestructura mediante servicios gestionados, ahora Vertex AI permite el entrenamiento con diversos frameworks y bibliotecas que usan las TPUs y las GPUs de Cloud.

Escala tus modelos de IA de forma exponencial

Nuestra infraestructura optimizada con inteligencia artificial está diseñada para ofrecer el rendimiento y la escala mundial que exigen productos de Google como YouTube, Gmail, Google Maps, Google Play y Android, que dan servicio a miles de millones de usuarios. Todas nuestras soluciones de infraestructura de IA se basan en la red de centros de datos de Jupiter de Google Cloud, que admite la mejor capacidad del sector de escalado horizontal para los servicios básicos y las cargas de trabajo de IA de alta intensidad.

Plataforma muy flexible y abierta

Durante décadas, hemos colaborado en proyectos de IA tan importantes como TensorFlow y JAX. Durante décadas, hemos colaborado en proyectos de IA tan importantes como TensorFlow y JAX. Además, Google es el principal colaborador de software libre de CNCF y lleva más de 20 años aportando contribuciones a software libre, como TFX, MLIR, OpenXLA, KubeFlow y Kubernetes, además de patrocinio de proyectos de software libre de gran importancia para la comunidad de la ciencia de los datos, como Project Jupyter y NumFOCverteUS.

Además, nuestros servicios de infraestructura de IA están integrados con los frameworks de IA más populares, como TensorFlow, PyTorch y MXNet, lo que permite a los clientes seguir usando el framework que prefieran y no verse limitados a un framework ni una arquitectura de hardware específicos.

Logotipo de la asociación reforzada entre Google Cloud y NVIDIA

BLOG

Presentamos la versión 5p de TPU y el hiperordenador de IA

Clientes

Los clientes aprovechan la infraestructura de IA de Google Cloud

Ahora que la IA abre la puerta a la innovación en todos los sectores, las empresas eligen Google Cloud para sacar partido de nuestra infraestructura abierta, flexible y con un buen rendimiento.

News

Anthropic colabora con Google Cloud para ayudar a ofrecer una IA fiable y responsable

Lectura de 5 minutos

Blog post

Cómo está agilizando Cohere el entrenamiento de modelos de lenguaje con las TPUs de Google Cloud

Lectura de 10 minutos

News

Midjourney elige Google Cloud para impulsar su plataforma creativa generada por IA

Lectura de 5 minutos

Blog post

Osmo digitaliza los olores con la tecnología de IA de Google Cloud

Lectura de 5 minutos

Blog post

AI21 aprovecha la infraestructura de Google Cloud, incluidas las GPUs y las TPUs, para el entrenamiento y la inferencia

Lectura de 5 minutos

Ver todos los clientes

Novedades

Sesión en grupo sobre la TPU v5e de Cloud en Google Next '24

Video

Lleva la IA a gran escala de la investigación a la producción con el hiperordenador con IA de Google CloudVer vídeo

Blog post

Presentamos los superordenadores A3 con GPUs NVIDIA H100 diseñadas específicamente para la IALeer el blog

Blog post

Primeros pasos con Ray en Google Kubernetes EngineLeer el blog

Blog post

Cómo crear y ejecutar casos prácticos de IA en el perímetroLeer el blog

Blog post

TensorFlow en Autopilot de GKE con aceleración de GPULeer el blog

Blog post

Ejecutar la inferencia por lotes de AlphaFold con Vertex AI PipelinesLeer el blog

Documentación

Google Cloud Basics

Herramientas de AI Infrastructure en GKE

Ejecuta cargas de trabajo de IA y aprendizaje automático optimizadas con las funciones de orquestación de la plataforma Google Kubernetes Engine (GKE).

Más información

Google Cloud Basics

Imágenes de máquinas virtuales de aprendizaje profundo

Las imágenes de máquina virtual de aprendizaje profundo están optimizadas para las tareas de ciencia de datos y aprendizaje automático. Las imágenes de máquina virtual de aprendizaje profundo están optimizadas para las tareas de ciencia de datos y aprendizaje automático.

Más información

Google Cloud Basics

Contenedores de aprendizaje profundo

Los contenedores de aprendizaje profundo son entornos coherentes y con rendimiento optimizado que permiten crear prototipos e implementar flujos de trabajo rápidamente en CPUs o GPUs.

Más información

Tutorial

¿Cómo se optimizan las unidades de procesamiento de tensor para la IA y el aprendizaje automático?

Descubre los requisitos de computación del aprendizaje automático y cómo se han diseñado las TPUs para gestionar esta tarea.

Más información

Google Cloud Basics

Arquitectura del sistema de TPU

Las TPUs son circuitos integrados de aprendizaje automático (ASIC) desarrollados a medida por Google que agilizan las cargas de trabajo de aprendizaje automático. Conoce la arquitectura del sistema subyacente de las TPUs desde el principio.

Más información

¿No encuentras lo que buscas?

Ver toda la documentación de producto

Casos prácticos

Arquitectura de hiperordenador de IA

Caso práctico

Acelera la formación sobre IA a gran escala

El entrenamiento Multislice de la TPU de Cloud es una tecnología full stack que permite entrenar modelos de IA a gran escala de forma rápida, sencilla y fiable en decenas de miles de chips de TPUs.

Google Cloud basics

Cómo escalar el entrenamiento de IA con Multislice de TPU de Cloud

Multislice de TPU de Cloud es una tecnología de entrenamiento a gran escala y de pila completa que permite escalar hasta decenas de miles de chips de forma sencilla, rentable y casi lineal.

Más información

Quickstart

Entrena a escala con NVIDIA Nemo Framework

Aprende a desplegar el kit de herramientas de HPC de Google Cloud junto con el framework NVIDIA NEMO para la formación distribuida.

Más información

Caso práctico

Proporciona aplicaciones basadas en IA

El ecosistema de software libre de Google Cloud te permite desarrollar aplicaciones con las herramientas y los frameworks que más te gustan, al tiempo que aprovechas las ventajas de la relación precio-rendimiento que ofrece la arquitectura hiperordenador de IA.

Google Cloud basics

Ejecutar IA en GKE totalmente gestionado

El modo piloto automático de Google Kubernetes Engine es una forma popular de ejecutar cargas de trabajo de IA, como el entrenamiento y el servicio de modelos de lenguaje de gran tamaño (LLMs).

Más información

Google Cloud basics

Primeros pasos con Ray en Google Kubernetes Engine

Ray.io es un framework de código abierto para escalar fácilmente aplicaciones Python en varios nodos de un clúster.

Más información

Caso práctico

Maximiza la relación precio-rendimiento para servir IA a gran escala

Las GPUs v5e de Cloud TPU y NVIDIA L4 permiten obtener inferencias de alto rendimiento y rentables en una amplia gama de cargas de trabajo de IA, incluidos los modelos de LLMs y los modelos de IA generativa más recientes. Ambos ofrecen importantes mejoras en el rendimiento de los precios con respecto a modelos anteriores, y la arquitectura hiperordenador de IA de Google Cloud permite a los clientes escalar sus despliegues a niveles líderes del sector.

Google Cloud basics

TPU de Cloud v5e agiliza la inferencia de IA a gran escala

Gracias a las TPU de Google Cloud, las empresas pueden ejecutar inferencias en modelos de IA de última generación de forma más rápida, a mayor escala y a un coste menor.

Más información

Quickstart

Servir un modelo con GKE en una sola GPU

Aprende a servir modelos abiertos con GKE a través de una sola GPU.

Más información

Google Cloud basics

Servicio de modelos a escala en varias GPUs

Descubre cómo escalar modelos de código abierto habituales que sirven en varias GPUs en GKE.

Más información

Ver todas las guías técnicas

Precios

Los precios de AI Infrastructure dependen del producto que selecciones. Puedes empezar a utilizar AI Infrastructure de Google de forma gratuita con Colab o con el nivel gratuito de Google Cloud.

TPU de Cloud	GPU de Cloud
Para saber cuánto cuestan los tipos de TPUs de dispositivo único y los tipos de pods de TPUs, consulta los precios de las TPU.	Para saber cuánto cuestan los distintos tipos de GPUs que están disponibles en las diversas regiones, consulta los precios de las GPUs.

Los productos de inteligencia artificial de Cloud cumplen las políticas del acuerdo de nivel de servicio. Pueden ofrecer garantías de latencia o disponibilidad diferentes respecto a otros servicios de Google Cloud.

Ve un paso más allá

Empieza a crear en Google Cloud con 300 USD en crédito gratis y más de 20 productos Always Free.

Probar Google Cloud gratis

¿Necesitas ayuda para empezar?
Contactar con Ventas
Trabaja con un partner de confianza
Buscar un partner
Sigue explorando
Ver todos los productos

AI Infrastructure

Optimiza el rendimiento y el coste a escala

Obtén resultados más rápido con una infraestructura gestionada

Desarrolla con software diseñado específicamente para la IA

Características principales

Hardware flexible y escalable para cualquier caso práctico

Fácil de usar, gestionar y escalable

Escala tus modelos de IA de forma exponencial

Plataforma muy flexible y abierta

Los clientes aprovechan la infraestructura de IA de Google Cloud

Novedades

Documentación

Herramientas de AI Infrastructure en GKE

Imágenes de máquinas virtuales de aprendizaje profundo

Contenedores de aprendizaje profundo

¿Cómo se optimizan las unidades de procesamiento de tensor para la IA y el aprendizaje automático?

Arquitectura del sistema de TPU

¿No encuentras lo que buscas?

Arquitectura de hiperordenador de IA

Acelera la formación sobre IA a gran escala

Proporciona aplicaciones basadas en IA

Maximiza la relación precio-rendimiento para servir IA a gran escala

Precios

Ve un paso más allá

¿Necesitas ayuda para empezar?

Trabaja con un partner de confianza

Sigue explorando