Consulta i connettori supportati per Application Integration.

Vertex AI - Attività di previsione

L'attività Vertex AI - Previsione consente di eseguire una previsione online. Le previsioni online sono richieste sincrone effettuate a un endpoint del modello. Puoi utilizzare le previsioni online quando effettui richieste in risposta agli input dell'applicazione o quando hai bisogno di inferenze tempestive.

Vertex AI è un servizio Google Cloud che ti consente di addestrare ed eseguire il deployment di modelli ML e applicazioni AI e personalizzare modelli linguistici di grandi dimensioni (LLM) da utilizzare nelle tue applicazioni basate sull'IA.

Prima di iniziare

Prima di configurare l'attività Vertex AI - Predict, assicurati di eseguire le seguenti attività nel tuo progetto Google Cloud:

  1. Abilita l'API Vertex AI (aiplatform.googleapis.com).

    Abilita l'API Vertex AI

  2. Esegui il deployment della risorsa model nell'endpoint.
  3. Crea un profilo di autenticazione. Application Integration utilizza un profilo di autenticazione per connettersi a un endpoint di autenticazione per l'attività Vertex AI - Predict.
  4. Assicurati che i Controlli di servizio VPC NON siano configurati per Application Integration nel tuo progetto Google Cloud.

Configura l'attività Vertex AI - Prevedi

  1. Nella console Google Cloud, vai alla pagina Application Integration.

    Vai ad Application Integration

  2. Nel menu di navigazione, fai clic su Integrations (Integrazioni).

    Viene visualizzata la pagina Integrazioni, che elenca tutte le integrazioni disponibili nel progetto Google Cloud.

  3. Seleziona un'integrazione esistente o fai clic su Crea integrazione per crearne una nuova.

    Se stai creando una nuova integrazione:

    1. Inserisci un nome e una descrizione nel riquadro Crea integrazione.
    2. Seleziona una regione per l'integrazione.
    3. Seleziona un account di servizio per l'integrazione. Puoi modificare o aggiornare i dettagli dell'account di servizio di un'integrazione in qualsiasi momento dal riquadro Riepilogo dell'integrazione nella barra degli strumenti di integrazione.
    4. Fai clic su Crea.

    Viene visualizzata l'integrazione nell'editor di integrazione.

  4. Nella barra di navigazione dell'editor di integrazione, fai clic su Attività per visualizzare l'elenco di attività e connettori disponibili.
  5. Fai clic e posiziona l'elemento Vertex AI - Predict nell'editor di integrazione.
  6. Fai clic sull'elemento Vertex AI - Predict nel designer per visualizzare il riquadro di configurazione dell'attività Vertex AI - Predict.
  7. Vai ad Autenticazione e seleziona un profilo di autenticazione esistente che vuoi utilizzare.

    Facoltativo. Se non hai creato un profilo di autenticazione prima di configurare l'attività, fai clic su + Nuovo profilo di autenticazione e segui i passaggi descritti in Creare un nuovo profilo di autenticazione.

  8. Vai a Input attività e configura i campi di input visualizzati utilizzando la seguente tabella dei parametri di input attività.

    Le modifiche ai campi di immissione vengono salvate automaticamente.

Parametri di input dell'attività

La tabella seguente descrive i parametri di input dell'attività Vertex AI - Predict:

Proprietà Tipo di dati Descrizione
Regione Stringa Posizione endpoint del modello. Ad esempio: us - Stati Uniti.
ProjectsId Stringa L'ID del tuo progetto Google Cloud.
EndpointStringa Il nome dell'endpoint richiesto per pubblicare la previsione.
Richiesta JSON Consulta la struttura JSON della richiesta.

Output dell'attività

L'attività Vertex AI - Predict restituisce una risposta contenente la previsione.

Strategia di gestione degli errori

Una strategia di gestione degli errori per un'attività specifica l'azione da intraprendere se l'attività non va a buon fine a causa di un errore temporaneo. Per informazioni su come utilizzare una strategia di gestione degli errori e per conoscere i diversi tipi di strategie di gestione degli errori, consulta l'articolo Strategie di gestione degli errori.

Quote e limiti

Per informazioni su quote e limiti, consulta Quote e limiti.

Passaggi successivi