Entrega modelos de IA optimizados de forma eficiente con NVIDIA NIMs en GKE. Obtener más información.
NVIDIA y Google Cloud proporcionan soluciones con optimización de aceleradores que abordan las cargas de trabajo más exigentes, como el aprendizaje automático, la computación de alto rendimiento, el análisis de datos, los gráficos y las cargas de trabajo de videojuegos.
Beneficios
Mayor rendimiento para cargas de trabajo diversas
Con las GPU de NVIDIA más recientes en Google Cloud, puedes aprovisionar con facilidad instancias de Compute Engine con NVIDIA H100, A100, L4, T4, P100, P4 y V100 para acelerar un amplio conjunto de cargas de trabajo exigentes.
Reduce los costos con la facturación por segundo
Con los precios por segundo de Google Cloud, pagas solo por lo que necesitas, con hasta un 30% de descuento mensual que se aplica de forma automática. Ahorra en los costos iniciales y disfruta del mismo tiempo de actividad y el mismo rendimiento escalable.
Optimiza las cargas de trabajo con las configuraciones de máquinas personalizadas
Optimiza las cargas de trabajo mediante la configuración precisa de una instancia con la proporción exacta de procesadores, memoria y GPU de NVIDIA que necesitas en lugar de tener que modificar la carga de trabajo para que se adapte a los parámetros de configuración limitados de un sistema.
Características clave
Las VMs A3, con la tecnología de las GPU NVIDIA H100 Tensor Core, están diseñadas para entrenar y entregar cargas de trabajo de IA generativa y LLM exigentes. La combinación de las GPU de NVIDIA con las tecnologías de infraestructura líderes de Google Cloud proporciona escalamiento y rendimiento masivos, además, es un gran avance en las capacidades de supercomputación.
Las VMs A2 con optimización de acelerador se basan en la GPU NVIDIA Ampere A100 Tensor Core. Cada GPU A100 ofrece un rendimiento de procesamiento hasta 20 veces mayor que el de la generación anterior. Estas VMs están diseñadas con el propósito de acelerar el proceso para la IA, el análisis de datos y la computación de alto rendimiento a fin de abordar los desafíos de procesamiento más difíciles.
G2 fue la primera VM en la nube de la industria con la tecnología de la GPU NVIDIA L4 Tensor Core anunciada en este tiempo y está diseñada para grandes cargas de trabajo de IA de inferencia, como la IA generativa. G2 ofrece rendimiento por dólar de vanguardia para cargas de trabajo de inferencia de IA. Como GPU universal, G2 ofrece mejoras de rendimiento significativas en cargas de trabajo de transcodificación de video, gráficos y HPC.
Si usas Google Kubernetes Engine (GKE), puedes crear clústeres con GPU de NVIDIA a pedido, balancear las cargas y minimizar los costos operativos sin problemas mediante el ajuste de escala automático de los recursos de GPU. Con la compatibilidad con GPU de múltiples instancias (MIG) en las GPU NVIDIA A100, GKE ahora puede aprovisionar la aceleración de GPU de tamaño adecuado con un nivel de detalle mayor para las cargas de trabajo de inferencia de IA multiusuario y de varios modelos.
NVIDIA CloudXR, una innovación de vanguardia creada con la tecnología NVIDIA RTX™, permite que XR de alta calidad sea accesible a través de Google Cloud Marketplace con la estación de trabajo virtual de NVIDIA RTX como imagen de máquina virtual (VMI). Los usuarios pueden configurar, escalar y consumir fácilmente una experiencia envolvente de alta calidad y transmitir flujos de trabajo XR desde la nube.
¿Todo listo para comenzar? Comunícate con nosotros
Obtén más información sobre cómo Google Cloud y NVIDIA pueden ayudarte a transformar tu empresa.
Clientes
Documentación
Acelera el proceso de entrenamiento para muchos modelos de aprendizaje profundo, como los de clasificación de imágenes, análisis de videos y procesamiento de lenguaje natural.
Novedades
Dinos en qué estás trabajando. Un experto de Google Cloud te ayudará a encontrar la mejor solución.