Vertex AI è una piattaforma di machine learning (ML) che consente di addestrare, ottimizzare e implementare modelli ML e applicazioni IA. Per aggiungere funzionalità di IA generativa a un servizio Cloud Run esistente, puoi utilizzare Vertex AI per accedere a modelli di IA generativa come Gemini, PaLM, Imagen, Codey e altri ancora.
Questa guida illustra come utilizzare le integrazioni di Cloud Run per configurare rapidamente l'accesso a Vertex AI per il tuo servizio Cloud Run.
Prima di iniziare
- Assicurati che sia già stato eseguito il deployment del servizio Cloud Run con cui esegui l'integrazione.
- Consulta la pagina dei prezzi di Vertex AI. Ti viene addebitato il costo per le singole risorse utilizzate nell'integrazione.
Ruoli obbligatori
Per utilizzare le integrazioni di Cloud Run, tu o il tuo amministratore dovete concedere i ruoli IAM su due entità diverse.
Fai clic per visualizzare i ruoli richiesti per il tuo Account Google
Per ottenere le autorizzazioni necessarie per utilizzare le integrazioni di Cloud Run, chiedi all'amministratore di concedere al tuo Account Google i seguenti ruoli IAM sul tuo progetto:
- Sviluppatore Cloud Run (
roles/run.developer
) - Visualizzatore Compute (
roles/compute.viewer
) - Sviluppatore integrazioni serverless (
roles/runapps.developer
) - Operatore di integrazioni serverless (
roles/runapps.operator
) - Utente account di servizio (
roles/iam.serviceAccountUser
)
Fai clic per visualizzare i ruoli richiesti per l'account di servizio
Per eseguire il deployment del servizio Cloud Run, puoi utilizzare l'account di servizio predefinito di Compute Engine creato automaticamente o specificare un account di servizio gestito dall'utente. L'account di servizio deve avere i seguenti ruoli:
- Sviluppatore Cloud Run (
roles/run.developer
) - Writer bucket di log (
roles/logging.bucketWriter
) - Utente account di servizio (
roles/iam.serviceAccountUser
) - Amministratore Storage (
roles/storage.admin
) - Amministratore IAM progetto (
roles/project.iamAdmin
)
Collega un servizio a Vertex AI
Quando utilizzi le integrazioni di Cloud Run per la connessione a Vertex AI, l'integrazione svolge le seguenti operazioni:
- Abilita l'API Vertex AI per il servizio Cloud Run per accedere ai modelli di IA generativa di Vertex AI.
- Concede all'identità di servizio i ruoli richiesti.
Puoi creare l'integrazione utilizzando la console o la riga di comando.
Console
Nella console Google Cloud, vai alla pagina Cloud Run.
Fai clic sul servizio che vuoi utilizzare nell'elenco dei servizi che vuoi utilizzare in questa integrazione.
Fai clic sulla scheda Integrations (Integrazioni).
Fai clic su Add integration (Aggiungi integrazione).
Fai clic su Vertex AI.
Utilizza il nome predefinito o cambia il nome specificando il valore che vuoi utilizzare.
Se ti viene richiesto di abilitare un elenco di API, fai clic su Abilita e attendi che le API siano abilitate.
Fai clic su Invia e attendi il completamento dell'integrazione. L'operazione potrebbe richiedere fino a un minuto.
Riga di comando
Aggiorna l'interfaccia a Google Cloud CLI più recente:
gcloud components update
Crea l'integrazione:
gcloud beta run integrations create \ --type=vertex-genai \ --service=SERVICE \
Sostituisci:
- SERVICE con il nome del tuo servizio Cloud Run.
Se vuoi, includi il flag
--service-account=SERVICE_ACCOUNT_EMAIL
.Sostituisci SERVICE_ACCOUNT_EMAIL con l'indirizzo email dell'account di servizio gestito dall'utente (
PROJECT_NUMBER-compute@developer.gserviceaccount.com
) utilizzato per eseguire il deployment del servizio. Ometti questo flag se vuoi utilizzare l'account di servizio Compute predefinito (SERVICE_ACCOUNT_ID@PROJECT_ID.iam.gserviceaccount.com
).Per continuare a utilizzare l'account di servizio specificato durante il deployment delle integrazioni di Cloud Run, esegui:
gcloud config set runapps/deployment-service-account
Attendi fino a un minuto, durante il quale al servizio Cloud Run vengono concesse le autorizzazioni per chiamare l'API Vertex AI.
[vertex-genai] integration [vertex-genai-xxx] has been created successfully.
Puoi controllare lo stato utilizzando
gcloud beta run integrations describe
.
Visualizza le integrazioni di Vertex AI
Per visualizzare lo stato attuale delle integrazioni di Vertex AI per il tuo servizio Cloud Run:
Console
Nella console Google Cloud, vai alla pagina Cloud Run.
Fai clic sul servizio che vuoi utilizzare nell'elenco dei servizi che vuoi utilizzare in questa integrazione.
Fai clic sulla scheda Integrations (Integrazioni).
Individua l'integrazione di Vertex AI che ti interessa e fai clic su Visualizza dettagli.
Riga di comando
Utilizza il comando seguente per visualizzare un elenco delle integrazioni disponibili:
gcloud beta run integrations list
Utilizzando un nome dall'elenco restituito, visualizza i relativi dettagli:
gcloud beta run integrations describe INTEGRATION_NAME
Sostituisci INTEGRATION_NAME con il nome dell'integrazione di Vertex AI.
Elimina le integrazioni di Vertex AI
L'eliminazione di un'integrazione comporta anche l'eliminazione di tutte le risorse Google Cloud associate all'integrazione, ma non elimina il servizio Cloud Run.
Per eliminare un'integrazione di Vertex AI dal servizio Cloud Run:
Console
Nella console Google Cloud, vai alla pagina Cloud Run.
Fai clic sul servizio da cui vuoi eliminare un'integrazione.
Fai clic sulla scheda Integrations (Integrazioni).
Individua l'integrazione di Vertex AI che ti interessa, fai clic sull'icona con i puntini di sospensione a destra dell'integrazione e poi fai clic su Elimina.
Riga di comando
Utilizza il comando seguente per visualizzare un elenco delle integrazioni disponibili:
gcloud beta run integrations list
Utilizzando un nome dall'elenco restituito, elimina l'integrazione:
gcloud beta run integrations delete INTEGRATION_NAME
Sostituisci:
- INTEGRATION_NAME con il nome della tua integrazione Vertex AI.
Facoltativamente, puoi utilizzare le seguenti opzioni di segnalazione:
Opzione Descrizione --service-account
L'indirizzo email dell'account di servizio gestito dall'utente per eseguire l'operazione di eliminazione.
Accedi ai modelli di IA generativa di Vertex AI nel tuo codice
Dopo aver completato l'integrazione, puoi inviare richieste alle API dei modelli Vertex AI e utilizzare Vertex AI Studio per testare e personalizzare rapidamente i modelli di IA generativa nella tua applicazione.
Limitazioni
Le integrazioni di Cloud Run sono supportate solo in determinate regioni. Se devi utilizzare una regione non supportata dalle integrazioni di Cloud Run, consulta Località di Vertex AI.