Connettiti ai modelli di IA generativa di Vertex AI

Vertex AI è una piattaforma di machine learning (ML) che consente di addestrare, ottimizzare e implementare modelli ML e applicazioni IA. Per aggiungere funzionalità di IA generativa a un servizio Cloud Run esistente, puoi utilizzare Vertex AI per accedere a modelli di IA generativa come Gemini, PaLM, Imagen, Codey e altri ancora.

Questa guida illustra come utilizzare le integrazioni di Cloud Run per configurare rapidamente l'accesso a Vertex AI per il tuo servizio Cloud Run.

Prima di iniziare

  • Assicurati che sia già stato eseguito il deployment del servizio Cloud Run con cui esegui l'integrazione.
  • Consulta la pagina dei prezzi di Vertex AI. Ti viene addebitato il costo per le singole risorse utilizzate nell'integrazione.

Ruoli obbligatori

Per utilizzare le integrazioni di Cloud Run, tu o il tuo amministratore dovete concedere i ruoli IAM su due entità diverse.

Fai clic per visualizzare i ruoli richiesti per il tuo Account Google

Per ottenere le autorizzazioni necessarie per utilizzare le integrazioni di Cloud Run, chiedi all'amministratore di concedere al tuo Account Google i seguenti ruoli IAM sul tuo progetto:

Fai clic per visualizzare i ruoli richiesti per l'account di servizio

Per eseguire il deployment del servizio Cloud Run, puoi utilizzare l'account di servizio predefinito di Compute Engine creato automaticamente o specificare un account di servizio gestito dall'utente. L'account di servizio deve avere i seguenti ruoli:

Collega un servizio a Vertex AI

Quando utilizzi le integrazioni di Cloud Run per la connessione a Vertex AI, l'integrazione svolge le seguenti operazioni:

  • Abilita l'API Vertex AI per il servizio Cloud Run per accedere ai modelli di IA generativa di Vertex AI.
  • Concede all'identità di servizio i ruoli richiesti.

Puoi creare l'integrazione utilizzando la console o la riga di comando.

Console

  1. Nella console Google Cloud, vai alla pagina Cloud Run.

    Vai a Cloud Run

  2. Fai clic sul servizio che vuoi utilizzare nell'elenco dei servizi che vuoi utilizzare in questa integrazione.

  3. Fai clic sulla scheda Integrations (Integrazioni).

  4. Fai clic su Add integration (Aggiungi integrazione).

  5. Fai clic su Vertex AI.

  6. Utilizza il nome predefinito o cambia il nome specificando il valore che vuoi utilizzare.

  7. Se ti viene richiesto di abilitare un elenco di API, fai clic su Abilita e attendi che le API siano abilitate.

  8. Fai clic su Invia e attendi il completamento dell'integrazione. L'operazione potrebbe richiedere fino a un minuto.

Riga di comando

  1. Aggiorna l'interfaccia a Google Cloud CLI più recente:

    gcloud components update
    
  2. Crea l'integrazione:

    gcloud beta run integrations create \
    --type=vertex-genai \
    --service=SERVICE \
    

    Sostituisci:

    • SERVICE con il nome del tuo servizio Cloud Run.

    Se vuoi, includi il flag --service-account=SERVICE_ACCOUNT_EMAIL.

    • Sostituisci SERVICE_ACCOUNT_EMAIL con l'indirizzo email dell'account di servizio gestito dall'utente (PROJECT_NUMBER-compute@developer.gserviceaccount.com) utilizzato per eseguire il deployment del servizio. Ometti questo flag se vuoi utilizzare l'account di servizio Compute predefinito (SERVICE_ACCOUNT_ID@PROJECT_ID.iam.gserviceaccount.com).

      Per continuare a utilizzare l'account di servizio specificato durante il deployment delle integrazioni di Cloud Run, esegui:

      gcloud config set runapps/deployment-service-account
      
  3. Attendi fino a un minuto, durante il quale al servizio Cloud Run vengono concesse le autorizzazioni per chiamare l'API Vertex AI.

    [vertex-genai] integration [vertex-genai-xxx] has been created successfully.
    

    Puoi controllare lo stato utilizzando gcloud beta run integrations describe.

Visualizza le integrazioni di Vertex AI

Per visualizzare lo stato attuale delle integrazioni di Vertex AI per il tuo servizio Cloud Run:

Console

  1. Nella console Google Cloud, vai alla pagina Cloud Run.

    Vai a Cloud Run

  2. Fai clic sul servizio che vuoi utilizzare nell'elenco dei servizi che vuoi utilizzare in questa integrazione.

  3. Fai clic sulla scheda Integrations (Integrazioni).

  4. Individua l'integrazione di Vertex AI che ti interessa e fai clic su Visualizza dettagli.

Riga di comando

  1. Utilizza il comando seguente per visualizzare un elenco delle integrazioni disponibili:

    gcloud beta run integrations list
  2. Utilizzando un nome dall'elenco restituito, visualizza i relativi dettagli:

    gcloud beta run integrations describe INTEGRATION_NAME

    Sostituisci INTEGRATION_NAME con il nome dell'integrazione di Vertex AI.

Elimina le integrazioni di Vertex AI

L'eliminazione di un'integrazione comporta anche l'eliminazione di tutte le risorse Google Cloud associate all'integrazione, ma non elimina il servizio Cloud Run.

Per eliminare un'integrazione di Vertex AI dal servizio Cloud Run:

Console

  1. Nella console Google Cloud, vai alla pagina Cloud Run.

    Vai a Cloud Run

  2. Fai clic sul servizio da cui vuoi eliminare un'integrazione.

  3. Fai clic sulla scheda Integrations (Integrazioni).

  4. Individua l'integrazione di Vertex AI che ti interessa, fai clic sull'icona con i puntini di sospensione a destra dell'integrazione e poi fai clic su Elimina.

Riga di comando

  1. Utilizza il comando seguente per visualizzare un elenco delle integrazioni disponibili:

    gcloud beta run integrations list
  2. Utilizzando un nome dall'elenco restituito, elimina l'integrazione:

    gcloud beta run integrations delete INTEGRATION_NAME
    

    Sostituisci:

    • INTEGRATION_NAME con il nome della tua integrazione Vertex AI.

    Facoltativamente, puoi utilizzare le seguenti opzioni di segnalazione:

    Opzione Descrizione
    --service-account L'indirizzo email dell'account di servizio gestito dall'utente per eseguire l'operazione di eliminazione.

Accedi ai modelli di IA generativa di Vertex AI nel tuo codice

Dopo aver completato l'integrazione, puoi inviare richieste alle API dei modelli Vertex AI e utilizzare Vertex AI Studio per testare e personalizzare rapidamente i modelli di IA generativa nella tua applicazione.

Limitazioni

Le integrazioni di Cloud Run sono supportate solo in determinate regioni. Se devi utilizzare una regione non supportata dalle integrazioni di Cloud Run, consulta Località di Vertex AI.