Empieza a usar la inferencia de modelos de IA con las funciones de IA generativa de GKE.

Esta página se ha traducido con Cloud Translation API.

Documentación sobre la orquestación de IA y aprendizaje automático en GKE

Google Kubernetes Engine (GKE) proporciona una plataforma única y unificada para orquestar todo el ciclo de vida de la IA y el aprendizaje automático. Te ofrece la potencia y la flexibilidad necesarias para optimizar tus cargas de trabajo de entrenamiento, inferencia y agentes, de modo que puedas simplificar tu infraestructura y empezar a obtener resultados. Las funciones de orquestación de vanguardia de GKE ofrecen lo siguiente:

Aceleradores de hardware: accede y gestiona las GPUs y TPUs de alto rendimiento que necesites para el entrenamiento y la inferencia a gran escala.
Flexibilidad de la pila: intégrala con los frameworks de computación distribuida, procesamiento de datos y servicio de modelos que ya conoces y en los que confías.
Simplicidad de Kubernetes gestionado: disfruta de todas las ventajas de una plataforma gestionada para automatizar, escalar y mejorar la seguridad de todo tu ciclo de vida de IA y aprendizaje automático, sin perder flexibilidad.

Consulta nuestros blogs, tutoriales y prácticas recomendadas para ver cómo puede optimizar GKE tus cargas de trabajo de IA y aprendizaje automático. Para obtener más información sobre las ventajas y las funciones disponibles, consulta la introducción a las cargas de trabajo de IA y aprendizaje automático en GKE.

Empieza gratis

Empieza tu prueba de concepto con 300 USD en crédito gratis

Acceder a Gemini 2.0 Flash Thinking
Uso mensual gratuito de productos populares, como las APIs de IA y BigQuery
Sin cargos automáticos ni permanencia

Ver ofertas de productos gratuitas

Sigue explorando con más de 20 productos Always Free

Accede a más de 20 productos gratuitos para casos prácticos habituales, como APIs de IA, máquinas virtuales, almacenes de datos y más.

Recursos de documentación

Consulta guías de inicio rápido, revisa referencias clave y obtén ayuda con problemas habituales.

Empieza a usar la inferencia de modelos de IA con las funciones de IA generativa de GKE.

Documentación sobre la orquestación de IA y aprendizaje automático en GKE

Empieza tu prueba de concepto con 300 USD en crédito gratis

Sigue explorando con más de 20 productos Always Free

Gestionar la infraestructura y los aceleradores de IA

Entrenar modelos de IA a gran escala

Servir modelos de IA para la inferencia

Desplegar una aplicación de IA basada en agentes en GKE con Agent Development Kit (ADK) y un LLM autohospedado

Desplegar una aplicación de IA basada en agentes en GKE con Agent Development Kit (ADK) y Vertex AI

Servir modelos de código abierto mediante TPUs en GKE con Optimum TPU

Crear y usar un volumen respaldado por una instancia de Parallelstore en GKE

Servir LLMs en GKE con una estrategia de aprovisionamiento de GPUs optimizada para los costes y de alta disponibilidad

Servir modelos de lenguaje grandes con KubeRay en TPUs

Acelerar la carga de datos de IA y aprendizaje automático con Hyperdisk ML

Servir un LLM mediante TPUs en GKE con JetStream y PyTorch

Prácticas recomendadas para optimizar la inferencia de LLMs con GPUs en GKE

Gestionar la pila de GPU con el operador de GPU NVIDIA en GKE

Configurar el autoescalado de cargas de trabajo de LLM en TPUs

Ajustar modelos abiertos de Gemma con varias GPUs en GKE

Desplegar una aplicación de Ray Serve con un modelo de Stable Diffusion en GKE con TPUs

Configurar el autoescalado de cargas de trabajo de LLMs en GPUs con GKE

Entrenar Llama 2 con Megatron-LM en máquinas virtuales A3 Mega

Desplegar cargas de trabajo de GPU en Autopilot

Servir un LLM con varias GPUs en GKE

Empezar a usar Ray en GKE

Servir un LLM en GPUs L4 con Ray

Orquesta cargas de trabajo de varios sectores de TPUs con JobSet y Kueue

Monitorizar cargas de trabajo de GPU en GKE con NVIDIA Data Center GPU Manager (DCGM)

Guía de inicio rápido: entrena un modelo con GPUs en clústeres de GKE Standard

Ejecutar aprendizaje automático a gran escala en GKE

TensorFlow en Autopilot de GKE con aceleración de GPU

Implementar un sistema de colas de tareas con cuotas compartidas entre espacios de nombres en GKE

Crear un chatbot RAG con GKE y Cloud Storage

Analizar datos en GKE con BigQuery, Cloud Run y Gemma

Preprocesamiento de datos distribuido con GKE y Ray: escalado para empresas

Prácticas recomendadas para cargar datos en la inferencia de IA y aprendizaje automático en GKE

Ahorra en GPUs: autoescalado más inteligente para tus cargas de trabajo de inferencia de GKE

Sirve modelos de IA optimizados de forma eficiente con los microservicios de NVIDIA NIM en GKE

Acelera Ray en producción con el nuevo operador de Ray en GKE

Maximizar el rendimiento de servicio de LLMs para GPUs en GKE: guía práctica

Prácticas recomendadas para ejecutar cargas de trabajo por lotes en GKE

Almacenamiento de IA y aprendizaje automático de alto rendimiento mediante la compatibilidad con SSD local en GKE

Aprendizaje automático con JAX en Kubernetes con GPUs NVIDIA

Buscadores sencillos: un enfoque de poco código con GKE y Vertex AI Agent Builder

LiveX AI reduce los costes de asistencia al cliente con agentes de IA entrenados y ofrecidos en GKE y la IA de NVIDIA

Infraestructura para una aplicación de IA generativa compatible con RAG que use GKE y Cloud SQL

Arquitectura de referencia de una plataforma de procesamiento por lotes en GKE

Innovación en la búsqueda de patentes: cómo IPRally aprovecha la IA con GKE y Ray

Análisis detallado del rendimiento de Gemma en Google Cloud

Información detallada sobre Gemma en GKE: innovaciones para servir modelos abiertos de IA generativa

Programación avanzada para IA y aprendizaje automático con Ray y Kueue

Cómo proteger Ray en Google Kubernetes Engine

Diseñar el almacenamiento para cargas de trabajo de IA y aprendizaje automático en Google Cloud

La instalación automática de controladores simplifica el uso de GPUs NVIDIA en GKE

Acelera tu transición a la IA generativa con el framework NVIDIA NeMo en GKEE

¿Por qué elegir GKE para tus cargas de trabajo de IA de Ray?

Simplificar MLOps usando Weights & Biases con Google Kubernetes Engine

Ejecutar IA en GKE totalmente gestionado, ahora con nuevas opciones de computación, precios y reservas de recursos

Cómo multiplicó SEEN por 89 su producción y redujo los costes de GPU en un 66% con GKE

Cómo está impulsando Spotify la innovación en aprendizaje automático con Ray y GKE

Cómo aprovecha Ordaōs Bio la IA generativa en GKE

GKE de una startup en crecimiento basada en aprendizaje automático

Mejorar el tiempo de lanzamiento de Stable Diffusion en GKE en 4 veces

Ejemplos de Google Kubernetes Engine (GKE)

Ejemplos de GKE AI Labs

Plataformas aceleradas de GKE

Vídeos relacionados