Esegui carichi di lavoro ottimizzati di AI/ML con le funzionalità di orchestrazione della piattaforma Google Kubernetes Engine (GKE). Con Google Kubernetes Engine (GKE), puoi implementare una piattaforma AI/ML solida e pronta per la produzione con tutti i vantaggi di Kubernetes gestito e le seguenti funzionalità:

  • Orchestrazione dell'infrastruttura che supporta GPU e TPU per l'addestramento e la gestione dei carichi di lavoro su larga scala.
  • Integrazione flessibile con framework di elaborazione distribuiti e elaborazione dei dati.
  • Supporto di più team sulla stessa infrastruttura per massimizzare l'utilizzo delle risorse
Questa pagina fornisce una panoramica delle funzionalità di IA/ML di GKE e su come iniziare a eseguire carichi di lavoro di IA/ML ottimizzati su GKE con GPU, TPU e framework come Hugging Face TGI, vLLM e JetStream.

Risorse di documentazione

Trova le guide rapide e le guide, esamina i riferimenti chiave e ricevi assistenza per i problemi comuni.
Esplora la formazione autogestita di Google Cloud Skills Boost, i casi d'uso, le architetture di riferimento e gli esempi di codice con esempi di come utilizzare e connettere i servizi Google Cloud.

Video correlati