Arquitectura de supercomputación integrada

Hipercomputadora de IA

Hardware, software y consumo optimizados con IA, combinados para mejorar la productividad y la eficiencia.

Descripción general

Hardware con rendimiento optimizado

Nuestra infraestructura optimizada para el rendimiento, que incluye Google Cloud TPU, GPU de Google Cloud, Google Cloud Storage y la red de Jupiter subyacente, proporciona de manera constante el tiempo más rápido para entrenar modelos de vanguardia a gran escala gracias a las sólidas características de escalamiento de la arquitectura, lo que genera la mejor relación precio-rendimiento para la entrega de modelos grandes.

Software abierto

Nuestra arquitectura está optimizada para admitir las herramientas y bibliotecas más comunes, como Tensorflow, Pytorch y JAX. Además, permite que los clientes aprovechen tecnologías como los parámetros de configuración de Cloud TPU Multislice y Multihost, y los servicios administrados como Google Kubernetes Engine. Esto permite que los clientes entreguen implementaciones listas para usar en cargas de trabajo comunes, como el framework de NVIDIA NeMO organizado por SLURM.

Consumo flexible

Nuestros modelos de consumo flexible permiten a los clientes elegir costos fijos con descuentos por compromiso de uso o modelos dinámicos según demanda para satisfacer sus necesidades empresariales. El programador dinámico de cargas de trabajo ayuda a los clientes a obtener la capacidad que necesitan sin sobreasignar recursos, de modo que solo pagan por lo que necesitan. Además, las herramientas de optimización de costos de Google Cloud ayudan a automatizar el uso de recursos para reducir las tareas manuales de los ingenieros.

Cómo funciona

Google es líder en inteligencia artificial gracias a la invención de tecnologías como TensorFlow. ¿Sabías que puedes aprovechar la tecnología de Google en tus propios proyectos? Conoce la historia de innovación en infraestructura de IA de Google y cómo puedes aprovecharla en tus cargas de trabajo.

Usos comunes

Ejecuta entrenamiento de IA a gran escala

Entrenamiento de IA potente, escalable y eficiente

El entrenamiento de Cloud TPU Multislice es una tecnología de pila completa que permite entrenar modelos de IA a gran escala de manera rápida, fácil y confiable en decenas de miles de chips TPU.

Cómo escalar el entrenamiento de IA hasta decenas de miles de chips de Cloud TPU con Multislice
Velocidad de entrenamiento de TPUv4(bf16) frente a TPUv5(int8)

Entrenamiento de IA potente, escalable y eficiente

El entrenamiento de Cloud TPU Multislice es una tecnología de pila completa que permite entrenar modelos de IA a gran escala de manera rápida, fácil y confiable en decenas de miles de chips TPU.

Cómo escalar el entrenamiento de IA hasta decenas de miles de chips de Cloud TPU con Multislice
Velocidad de entrenamiento de TPUv4(bf16) frente a TPUv5(int8)

Character.AI aprovecha Google Cloud para escalar verticalmente

“Necesitamos GPU para generar respuestas a los mensajes de los usuarios. Y a medida que tenemos más usuarios en nuestra plataforma, necesitamos más GPU para prestarles servicios. En Google Cloud, podemos experimentar para descubrir cuál es la plataforma adecuada para una carga de trabajo en particular. Es estupendo tener esa flexibilidad para elegir las soluciones más valiosas”. Myle Ott, ingeniero fundador, Character.AI

Mirar ahora

Entrega aplicaciones potenciadas por IA

Aprovecha frameworks abiertos para ofrecer experiencias potenciadas por IA

El ecosistema de software abierto de Google Cloud te permite compilar aplicaciones con las herramientas y los frameworks que más te convengan y, al mismo tiempo, aprovechar los beneficios de la relación precio-rendimiento de la arquitectura de la hipercomputadora de IA.

Herramientas y frameworks de IA de Google Cloud

Aprovecha frameworks abiertos para ofrecer experiencias potenciadas por IA

El ecosistema de software abierto de Google Cloud te permite compilar aplicaciones con las herramientas y los frameworks que más te convengan y, al mismo tiempo, aprovechar los beneficios de la relación precio-rendimiento de la arquitectura de la hipercomputadora de IA.

Herramientas y frameworks de IA de Google Cloud

Priceline: Ayuda a los viajeros a seleccionar experiencias únicas

“Trabajar con Google Cloud para incorporar la IA generativa nos permite crear un asistente de viajes personalizado dentro de nuestro chatbot. Queremos ayudar a nuestros clientes no solo a planificar un viaje, sino también a crear una experiencia de viaje única para ellos”. Martin Brodbeck, director de Tecnología, Priceline

Más información
Logotipo de Priceline

Entrega modelos rentables a gran escala

Maximiza el precio y el rendimiento para entregar IA a gran escala

Cloud TPU v5e y las instancias de VM G2 que entregan GPU NVIDIA L4 permiten una inferencia rentable y de alto rendimiento para una amplia gama de cargas de trabajo de IA, incluidos los últimos LLM y modelos de IA generativa. Ambas opciones ofrecen mejoras significativas en cuanto al precio en comparación con los modelos anteriores, y la arquitectura de hipercomputadora de IA de Google Cloud permite a los clientes escalar sus implementaciones a niveles líderes en la industria.

Rendimiento relativo por dólar: Cloud TPU v4 y v5e

Maximiza el precio y el rendimiento para entregar IA a gran escala

Cloud TPU v5e y las instancias de VM G2 que entregan GPU NVIDIA L4 permiten una inferencia rentable y de alto rendimiento para una amplia gama de cargas de trabajo de IA, incluidos los últimos LLM y modelos de IA generativa. Ambas opciones ofrecen mejoras significativas en cuanto al precio en comparación con los modelos anteriores, y la arquitectura de hipercomputadora de IA de Google Cloud permite a los clientes escalar sus implementaciones a niveles líderes en la industria.

Rendimiento relativo por dólar: Cloud TPU v4 y v5e

AssemblyAI usa Google Cloud para la rentabilidad

“Los resultados experimentales muestran que Cloud TPU v5e es el acelerador más rentable para ejecutar inferencias a gran escala para nuestro modelo. Ofrece un rendimiento 2.7 veces mayor por dólar que G2 y un rendimiento 4.2 veces mayor por dólar que las instancias de A2”. Domenic Donato,

vicepresidente de Tecnología, AssemblyAI


Más información
Logotipo de AssemblyAI

Modelos de código abierto en Google Cloud

Entrega un modelo con GKE en una sola GPU

Entrena modelos comunes con GPU

Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
Consola
  • Ahorra dinero con nuestro enfoque transparente de precios
  • Los precios de prepago de Google Cloud ofrecen ahorros automáticos en función del uso mensual y las tarifas con descuento para recursos prepagados. Comunícate con nosotros hoy para obtener una cotización.
Google Cloud