Connettiti ai modelli di IA generativa di Vertex AI

Vertex AI è una piattaforma di machine learning (ML) che consente di addestrare, ottimizzare ed eseguire il deployment di modelli ML e applicazioni AI. Per aggiungere di AI generativa a un servizio Cloud Run esistente, puoi utilizzare Vertex AI per accedere a modelli di IA generativa come Gemini, PaLM, Imagen, Codey e altri ancora.

Questa guida spiega come utilizzare le integrazioni di Cloud Run per velocizzare configurare l'accesso a Vertex AI per il tuo servizio Cloud Run.

Prima di iniziare

  • Assicurati che il servizio Cloud Run con cui stai eseguendo l'integrazione sia è già stato eseguito il deployment.
  • Consulta la pagina dei prezzi di Vertex AI. Ti viene addebitata una fattura per singole di risorse utilizzate nell'integrazione.

Ruoli obbligatori

Per utilizzare le integrazioni di Cloud Run, tu o l'amministratore dovete concedere ruoli IAM su due entità diverse.

Fai clic per visualizzare i ruoli richiesti per il tuo Account Google

Per ottenere le autorizzazioni necessarie per utilizzare Cloud Run integrazioni, chiedi all'amministratore di concederti Account Google: i seguenti ruoli IAM sul tuo progetto:

Fai clic per visualizzare i ruoli richiesti per l'account di servizio

Per eseguire il deployment del servizio Cloud Run, puoi utilizzare il cluster creato automaticamente l'account di servizio predefinito di Compute Engine o specifica account di servizio gestito dall'utente. L'account di servizio deve avere i ruoli seguenti:

Connetti un servizio a Vertex AI

Quando utilizzi le integrazioni di Cloud Run per la connessione Vertex AI, l'integrazione fa quanto segue:

  • Abilita l'API Vertex AI per il servizio Cloud Run per accedere ai modelli di IA generativa di Vertex AI.
  • Concede all'identità di servizio i ruoli richiesti.

Puoi creare l'integrazione utilizzando la console o la riga di comando.

Console

  1. Nella console Google Cloud, vai alla pagina Cloud Run.

    Vai a Cloud Run

  2. Nell'elenco dei servizi, fai clic sul servizio che vuoi utilizzare e integrazione.

  3. Fai clic sulla scheda Integrations (Integrazioni).

  4. Fai clic su Aggiungi integrazione.

  5. Fai clic su Vertex AI.

  6. Utilizza il nome predefinito o cambia il nome in base al valore che vuoi utilizzare.

  7. Se ti viene richiesto di abilitare un elenco di API, fai clic su Abilita e attendi che API da abilitare.

  8. Fai clic su Invia e attendi il completamento dell'integrazione. L'operazione può richiedere fino a un minuto.

gcloud

  1. Esegui l'aggiornamento all'ultima versione di Google Cloud CLI:

    gcloud components update
    
  2. Crea l'integrazione:

    gcloud beta run integrations create \
    --type=vertex-genai \
    --service=SERVICE \
    

    Sostituisci:

    • SERVICE con il nome del tuo servizio Cloud Run.

    Se vuoi, includi il --service-account=SERVICE_ACCOUNT_EMAIL flag.

    • Sostituisci SERVICE_ACCOUNT_EMAIL con il servizio gestito dall'utente indirizzo email dell'account (PROJECT_NUMBER-compute@developer.gserviceaccount.com) usato per il deployment del servizio. Ometti questo flag se vuoi utilizzare account di servizio Compute predefinito (SERVICE_ACCOUNT_ID@PROJECT_ID.iam.gserviceaccount.com).

      Per continuare a utilizzare l'account di servizio specificato durante il deployment le integrazioni di Cloud Run, esegui:

      gcloud config set runapps/deployment-service-account
      
  3. Attendi fino a un minuto, durante questo periodo Cloud Run al servizio vengono concesse le autorizzazioni per chiamare l'API Vertex AI.

    [vertex-genai] integration [vertex-genai-xxx] has been created successfully.
    

    Puoi controllare lo stato utilizzando gcloud beta run integrations describe.

Visualizza le integrazioni di Vertex AI

Per visualizzare lo stato attuale delle integrazioni di Vertex AI per per il tuo servizio Cloud Run:

Console

  1. Nella console Google Cloud, vai alla pagina Cloud Run.

    Vai a Cloud Run

  2. Nell'elenco dei servizi, fai clic sul servizio che vuoi utilizzare e integrazione.

  3. Fai clic sulla scheda Integrations (Integrazioni).

  4. Individua l'integrazione di Vertex AI che ti interessa e fai clic su Visualizza dettagli.

gcloud

  1. Utilizza il seguente comando per visualizzare un elenco delle integrazioni disponibili:

    gcloud beta run integrations list
  2. Utilizzando un nome dall'elenco restituito, visualizza i relativi dettagli:

    gcloud beta run integrations describe INTEGRATION_NAME

    Sostituisci INTEGRATION_NAME con il nome del tuo Integrazione di Vertex AI.

Elimina integrazioni Vertex AI

L'eliminazione di un'integrazione comporta anche l'eliminazione di tutte le risorse Google Cloud associati all'integrazione, ma non eliminerà i tuoi dal servizio Cloud Run.

Per eliminare un'integrazione di Vertex AI dal tuo Servizio Cloud Run:

Console

  1. Nella console Google Cloud, vai alla pagina Cloud Run.

    Vai a Cloud Run

  2. Fai clic sul servizio da cui vuoi eliminare un'integrazione.

  3. Fai clic sulla scheda Integrations (Integrazioni).

  4. Individua l'integrazione di Vertex AI che ti interessa e fai clic sull'icona dei puntini di sospensione a destra dell'integrazione, quindi fai clic su Elimina.

gcloud

  1. Utilizza il seguente comando per visualizzare un elenco delle integrazioni disponibili:

    gcloud beta run integrations list
  2. Utilizzando un nome dall'elenco restituito, elimina l'integrazione:

    gcloud beta run integrations delete INTEGRATION_NAME
    

    Sostituisci:

    • INTEGRATION_NAME con il nome del tuo Integrazione di Vertex AI.

    Facoltativamente, puoi utilizzare le seguenti opzioni di flag:

    Opzione Descrizione
    --service-account L'indirizzo email dell'account di servizio gestito dall'utente per eseguire l'operazione di eliminazione.

Accedi ai modelli di IA generativa di Vertex AI nel tuo codice

Dopo aver completato l'integrazione, puoi inviare richieste al API per i modelli Vertex AI, e usare Vertex AI Studio per testare e personalizzare rapidamente modelli di AI generativa nella tua applicazione.

Limitazioni

Le integrazioni di Cloud Run supportato solo in determinate regioni. Se utilizza una regione non supportata da Cloud Run per le integrazioni, consulta le località di Vertex AI.