Consulta más información sobre la IA generativa de escala mundial con GPUs NVIDIA en Google Cloud. Consulta contenido seleccionado de Google Cloud por NVIDIA GTC 2024.
NVIDIA y Google Cloud ofrecen soluciones optimizadas para aceleradores que satisfacen tus cargas de trabajo más exigentes, como el aprendizaje automático, la computación de alto rendimiento, las analíticas de datos, los gráficos y las cargas de trabajo de videojuegos.
Ventajas
Mayor rendimiento para distintas cargas de trabajo
Gracias a las últimas GPUs NVIDIA en Google Cloud, puedes ofrecer fácilmente instancias de Compute Engine con NVIDIA H100, A100, L4, T4, P100, P4 y V100 para agilizar una amplia variedad de cargas de trabajo exigentes.
Reduce los costes con la facturación por segundo
Con la facturación por segundo de Google Cloud, solo pagas por lo que necesitas y obtienes un descuento automático de hasta el 30 % todos los meses. Ahorra costes por adelantado y disfruta del mismo tiempo de funcionamiento y rendimiento escalable.
Optimiza las cargas de trabajo con configuraciones de máquinas personalizadas
A la hora de optimizar tus cargas de trabajo, configura una instancia de forma precisa con la proporción exacta de procesadores, memoria y GPUs NVIDIA que necesites, en lugar de adaptarlas a los límites de la configuración del sistema.
Características principales
Las máquinas virtuales A3, que cuentan con GPUs NVIDIA H100 Tensor Core, se han diseñado específicamente para entrenar y servir cargas de trabajo de IA generativa y LLMs especialmente exigentes. Combinar las GPUs NVIDIA con las tecnologías de infraestructura punteras de Google Cloud ofrece una escalabilidad y un rendimiento enormes. Además, supone un gran avance en el ámbito de las funciones de supercomputación.
Las máquinas virtuales A2 optimizadas para aceleradores se basan en la GPU NVIDIA A100 Tensor Core con la arquitectura Ampere. Cada GPU A100 ofrece un rendimiento de computación hasta 20 veces superior al de la generación anterior. Estas máquinas virtuales están diseñadas para acelerar los procesos a escala en la IA, las analíticas de datos y la computación de alto rendimiento para superar los retos de computación más complejos.
G2 fue la primera máquina virtual en la nube del sector basada en la recién anunciada GPU NVIDIA L4 Tensor Core. Está especialmente diseñada para grandes cargas de trabajo de IA de inferencia, como la IA generativa. G2 ofrece un rendimiento por dólar excepcional para las cargas de trabajo de inferencia de IA. Como GPU universal, G2 ofrece mejoras significativas en el rendimiento de las cargas de trabajo de transcodificación de HPC, gráficos y vídeo.
Con Google Kubernetes Engine (GKE), puedes crear clústeres sin complicaciones con las GPUs de NVIDIA bajo demanda, balancear la carga y disminuir los costes operativos escalando automáticamente los recursos de GPU hacia arriba o hacia abajo. Debido a que GKE admite las GPUs con varias instancias (MIG) en las GPUs de NVIDIA A100, puede proporcionar la aceleración de GPU del tamaño adecuado con mayor nivel de detalle para las cargas de trabajo de inferencia de IA multiusuario y multimodelo.
NVIDIA CloudXR es una revolucionaria innovación basada en la tecnología NVIDIA RTX™ que permite acceder a XR de alta calidad a través de Google Cloud Marketplace con la estación de trabajo virtual NVIDIA RTX como imagen de la máquina virtual (VMI). Los usuarios pueden configurar, escalar y consumir fácilmente la experiencia inmersiva de alta calidad y emitir flujos de trabajo XR desde la nube.
¿Empezamos? Contactar
Consulta más información sobre cómo pueden ayudarte Google Cloud y NVIDIA a transformar tu negocio.
Clientes
Documentación
Agiliza el proceso de entrenamiento de numerosos modelos de aprendizaje profundo, como la clasificación de imágenes, el análisis de vídeos y el procesamiento del lenguaje natural.
Novedades
Cuéntanos lo que buscas. Un experto de Google Cloud te ayudará a encontrar la mejor solución.