Utilizzare i modelli Hugging Face

HuggingFace fornisce modelli preaddestrati, script di ottimizzazione e API di sviluppo che semplificano il processo di creazione e scoperta degli LLM. Model Garden può pubblicare i modelli supportati in HuggingFace di Inferenza di incorporamento di testo, Inferenza di PyTorch standard e Inferenza di generazione di testo.

Opzioni di deployment per i modelli Hugging Face

Puoi eseguire il deployment dei modelli Hugging Face supportati in Vertex AI oppure Google Kubernetes Engine (GKE). L'opzione di deployment che scegli può dipendere dal modello in uso e dal livello di controllo che vuoi avere sui carichi di lavoro.

Esegui il deployment in Vertex AI

Vertex AI offre una piattaforma gestita per la creazione e la scalabilità dei progetti di machine learning senza competenze MLOps interne. Puoi utilizzare la modalità Vertex AI come applicazione downstream che gestisce Modelli di Hugging Face. Ti consigliamo di utilizzare Vertex AI se vuoi funzionalità MLOps end-to-end, ML a valore aggiunto e un'esperienza serverless per uno sviluppo semplificato.

  1. Per eseguire il deployment di un modello Hugging Face supportato in Vertex AI, vai a Model Garden.

    Vai a Model Garden

  2. Vai alla sezione Modelli open source su Hugging Face e fai clic su Mostra altro.

  3. Trova e seleziona un modello da implementare.

  4. (Facoltativo) Per Ambiente di deployment, seleziona Vertex AI.

  5. (Facoltativo) Specifica i dettagli del deployment.

  6. Fai clic su Esegui il deployment.

Per iniziare, consulta i seguenti esempi:

Esegui il deployment in GKE

Google Kubernetes Engine (GKE) è la soluzione Google Cloud per Kubernetes gestito che offre scalabilità, sicurezza, resilienza e costi efficace. Ti consigliamo questa opzione se hai già investimenti in Kubernetes, la tua organizzazione dispone di competenze MLOps interne o se hai bisogno di un controllo granulare su carichi di lavoro di IA/ML complessi con requisiti unici di sicurezza, pipeline di dati e gestione delle risorse.

  1. Per eseguire il deployment di un modello Hugging Face supportato in GKE, vai a Model Garden.

    Vai a Model Garden

  2. Vai alla sezione Modelli open source su Hugging Face e fai clic su Mostra altro.

  3. Trova e seleziona un modello di cui eseguire il deployment.

  4. Per Ambiente di deployment, seleziona GKE.

  5. Segui le istruzioni di implementazione.

Per iniziare, consulta i seguenti esempi: