Connettiti ai modelli di IA generativa di Vertex AI

Vertex AI è una piattaforma di machine learning (ML) che consente di addestrare, ottimizzare ed eseguire il deployment di modelli ML e applicazioni IA. Per aggiungere funzionalità di IA generativa a un servizio Cloud Run esistente, puoi utilizzare Vertex AI per accedere a modelli di IA generativa come Gemini, PaLM, Imagen, Codey e altri.

Questa guida spiega come utilizzare le integrazioni di Cloud Run per configurare rapidamente l'accesso a Vertex AI per il tuo servizio Cloud Run.

Prima di iniziare

  • Assicurati che sia già stato eseguito il deployment del servizio Cloud Run con cui stai eseguendo l'integrazione.
  • Consulta la pagina dei prezzi di Vertex AI. Ti vengono addebitati i costi per le singole risorse utilizzate nell'integrazione.

Ruoli obbligatori

Per utilizzare le integrazioni di Cloud Run, tu o l'amministratore dovete concedere ruoli IAM su due entità diverse.

Fai clic per visualizzare i ruoli richiesti per il tuo Account Google

Per ottenere le autorizzazioni necessarie per utilizzare le integrazioni di Cloud Run, chiedi all'amministratore di concedere al tuo Account Google i seguenti ruoli IAM sul progetto:

Fai clic per visualizzare i ruoli richiesti per l'account di servizio

Per eseguire il deployment del servizio Cloud Run, puoi utilizzare l'account di servizio predefinito di Compute Engine creato automaticamente o specificare un account di servizio gestito dall'utente. L'account di servizio deve avere i ruoli seguenti:

Connetti un servizio a Vertex AI

Quando utilizzi le integrazioni di Cloud Run per connetterti a Vertex AI, l'integrazione fa quanto segue:

  • Abilita l'API Vertex AI per il servizio Cloud Run per accedere ai modelli di IA generativa di Vertex AI.
  • Concede all'identità di servizio i ruoli richiesti.

Puoi creare l'integrazione utilizzando la console o la riga di comando.

Console

  1. Nella console Google Cloud, vai alla pagina Cloud Run.

    Vai a Cloud Run

  2. Nell'elenco dei servizi, fai clic sul servizio che vuoi utilizzare in questa integrazione.

  3. Fai clic sulla scheda Integrations (Integrazioni).

  4. Fai clic su Aggiungi integrazione.

  5. Fai clic su Vertex AI.

  6. Utilizza il nome predefinito o cambia il nome in base al valore che vuoi utilizzare.

  7. Se ti viene richiesto di abilitare un elenco di API, fai clic su Abilita e attendi che le API vengano abilitate.

  8. Fai clic su Invia e attendi il completamento dell'integrazione. L'operazione può richiedere fino a un minuto.

gcloud

  1. Esegui l'aggiornamento all'ultima versione di Google Cloud CLI:

    gcloud components update
    
  2. Crea l'integrazione:

    gcloud beta run integrations create \
    --type=vertex-genai \
    --service=SERVICE \
    

    Sostituisci:

    • SERVICE con il nome del tuo servizio Cloud Run.

    Se vuoi, includi il flag --service-account=SERVICE_ACCOUNT_EMAIL.

    • Sostituisci SERVICE_ACCOUNT_EMAIL con l'indirizzo email dell'account di servizio gestito dall'utente (PROJECT_NUMBER-compute@developer.gserviceaccount.com) utilizzato per eseguire il deployment del servizio. Ometti questo flag se vuoi utilizzare l'account di servizio Compute predefinito (SERVICE_ACCOUNT_ID@PROJECT_ID.iam.gserviceaccount.com).

      Per continuare a utilizzare l'account di servizio specificato durante il deployment delle integrazioni di Cloud Run, esegui:

      gcloud config set runapps/deployment-service-account
      
  3. Attendi fino a un minuto, durante il quale al servizio Cloud Run vengono concesse le autorizzazioni per chiamare l'API Vertex AI.

    [vertex-genai] integration [vertex-genai-xxx] has been created successfully.
    

    Puoi controllare lo stato utilizzando gcloud beta run integrations describe.

Visualizza le integrazioni di Vertex AI

Per visualizzare lo stato attuale delle integrazioni di Vertex AI per il tuo servizio Cloud Run:

Console

  1. Nella console Google Cloud, vai alla pagina Cloud Run.

    Vai a Cloud Run

  2. Nell'elenco dei servizi, fai clic sul servizio che vuoi utilizzare in questa integrazione.

  3. Fai clic sulla scheda Integrations (Integrazioni).

  4. Individua l'integrazione di Vertex AI che ti interessa e fai clic su Visualizza dettagli.

gcloud

  1. Utilizza il seguente comando per visualizzare un elenco delle integrazioni disponibili:

    gcloud beta run integrations list
  2. Utilizzando un nome dall'elenco restituito, visualizza i relativi dettagli:

    gcloud beta run integrations describe INTEGRATION_NAME

    Sostituisci INTEGRATION_NAME con il nome dell'integrazione di Vertex AI.

Elimina integrazioni Vertex AI

L'eliminazione di un'integrazione comporta anche l'eliminazione di tutte le risorse Google Cloud associate all'integrazione, ma non l'eliminazione del servizio Cloud Run.

Per eliminare un'integrazione Vertex AI dal servizio Cloud Run:

Console

  1. Nella console Google Cloud, vai alla pagina Cloud Run.

    Vai a Cloud Run

  2. Fai clic sul servizio da cui vuoi eliminare un'integrazione.

  3. Fai clic sulla scheda Integrations (Integrazioni).

  4. Individua l'integrazione di Vertex AI che ti interessa e fai clic sui puntini di sospensione a destra dell'integrazione, quindi fai clic su Elimina.

gcloud

  1. Utilizza il seguente comando per visualizzare un elenco delle integrazioni disponibili:

    gcloud beta run integrations list
  2. Utilizzando un nome dall'elenco restituito, elimina l'integrazione:

    gcloud beta run integrations delete INTEGRATION_NAME
    

    Sostituisci:

    • INTEGRATION_NAME con il nome dell'integrazione di Vertex AI.

    Facoltativamente, puoi utilizzare le seguenti opzioni di flag:

    Opzione Descrizione
    --service-account L'indirizzo email dell'account di servizio gestito dall'utente per eseguire l'operazione di eliminazione.

Accedi ai modelli di IA generativa di Vertex AI nel tuo codice

Dopo aver completato l'integrazione, puoi inviare richieste alle API del modello Vertex AI e utilizzare Vertex AI Studio per testare e personalizzare rapidamente modelli di IA generativa nella tua applicazione.

Limitazioni

Le integrazioni di Cloud Run sono supportate solo in determinate regioni. Se devi utilizzare una regione non supportata dalle integrazioni di Cloud Run, consulta le località Vertex AI.