Richiama le previsioni online dalle istanze Cloud SQL

Questa pagina mostra come richiamare le previsioni online da un'istanza Cloud SQL.

Cloud SQL ti consente di ottenere previsioni online nel tuo codice SQL chiamando la funzione ml_predict_row(). Per saperne di più, consulta Crea applicazioni di AI generativa utilizzando Cloud SQL.

Prima di iniziare

Prima di poter richiamare le previsioni online da un'istanza Cloud SQL, devi preparare il database e selezionare un modello ML appropriato.

Preparare il database

  1. Per preparare il database, configura l'integrazione tra Cloud SQL e Vertex AI.

  2. Concedi le autorizzazioni agli utenti del database per utilizzare la funzione ml_predict_row() per eseguire le previsioni:

    1. Connetti un client psql all'istanza primaria, come descritto in Connessione tramite un client psql.

    2. Al prompt dei comandi psql, connettiti al database e concedi le autorizzazioni:

      \c DB_NAME
      
      GRANT EXECUTE ON FUNCTION ml_predict_row TO USER_NAME;
      

      Sostituisci quanto segue:

      • DB_NAME: il nome del database per cui stai concedendo le autorizzazioni

      • USER_NAME: il nome dell'utente a cui stai concedendo le autorizzazioni

Seleziona un modello ML

Quando chiami la funzione ml_predict_row(), devi specificare la posizione di un modello ML. Il modello che specifichi può essere uno di questi:

  • Un modello in esecuzione in Vertex AI Model Garden.

    La funzione ml_predict_row() supporta l'invocazione di previsioni solo su modelli tabellari o personalizzati.

  • Un modello Vertex AI con un endpoint attivo a cui hai l'autorizzazione Identity and Access Management (IAM) per accedere.

    Cloud SQL non supporta gli endpoint privati per ottenere previsioni online.

Richiamare le previsioni online

Puoi utilizzare la funzione SQL ml_predict_row() per richiamare le previsioni online sui tuoi dati.

Il formato dell'argomento iniziale della funzione dipende dal fatto che il modello ML che vuoi utilizzare si trovi in Model Garden su Vertex AI o sia un endpoint in esecuzione in un progetto Google Cloud .

Utilizzare un modello in Vertex AI Model Garden

Per richiamare una previsione online utilizzando un modello ML in esecuzione in Vertex AI Model Garden, utilizza la seguente sintassi per la funzione SQL ml_predict_row():

sql SELECT ML_PREDICT_ROW('publishers/google/models/MODEL_ID', '{ "instances": [ INSTANCES ], "parameters": PARAMETERS }');

Effettua le seguenti sostituzioni:

  • MODEL_ID: l'ID del modello ML da utilizzare (ad esempio, gemini-2.0)

  • INSTANCES: gli input della chiamata di previsione, in formato JSON

  • PARAMETERS: i parametri della chiamata di previsione, in formato JSON

SELECT ML_PREDICT_ROW('publishers/google/models/MODEL_ID', '{ "instances": [ INSTANCES ], "parameters":
PARAMETERS }');
Per informazioni sui messaggi di risposta JSON del modello, consulta Riferimento al modello di base di AI generativa. Per alcuni esempi, consulta Esempi di invocazioni.

Utilizzare un endpoint del modello Vertex AI

Per richiamare una previsione online utilizzando un endpoint del modello Vertex AI, utilizza la seguente sintassi per la funzione SQL ml_predict_row():

sql SELECT ML_PREDICT_ROW('endpoints/ENDPOINT_ID', '{ "instances": [ INSTANCES ], "parameters": PARAMETERS }');

Effettua le seguenti sostituzioni:

  • ENDPOINT_ID: l'ID dell'endpoint del modello

  • INSTANCES: gli input della chiamata di previsione, in formato JSON

  • PARAMETERS: i parametri della chiamata di previsione, in formato JSON

Per informazioni sui messaggi di risposta JSON del modello, consulta PredictResponse.

Esempi di invocazioni

L'esempio seguente utilizza PaLM 2 per il testo, disponibile in Model Garden, per generare testo in base a un breve prompt fornito come argomento letterale a ml_predict_row() :

select ML_PREDICT_ROW('projects/PROJECT_ID/locations/us-central1/publishers/google/models/text-bison', '{"instances":[{"prompt": "What are three advantages of using Cloud SQL as my SQL database server?"}], "parameters":{"maxOutputTokens":1024, "topK": 40, "topP":0.8, "temperature":0.2}}');

La risposta è un oggetto JSON. Per maggiori informazioni sul formato dell'oggetto, consulta Corpo della risposta.

L'esempio successivo modifica quello precedente nei seguenti modi:

  • L'esempio utilizza i contenuti della colonna messages.message del database corrente come input.

  • L'esempio mostra l'utilizzo della funzione json_build_object() come aiuto per formattare i parametri della funzione.

select ML_PREDICT_ROW('projects/PROJECT_ID/locations/us-central1/publishers/google/models/text-bison', json_build_object('instances', json_build_object('prompt', message), 'parameters', json_build_object('maxOutputTokens', 1024,'topK', 40,'topP', 0.8,'temperature', 0.2))) from messages;

Per ogni riga della tabella messages, l'oggetto JSON restituito ora contiene una voce nella matrice predictions.

Poiché la risposta è un oggetto JSON, puoi estrarre campi specifici:

Per altri argomenti di esempio per ml_predict_row(), vedi Prova l'API Vertex AI Gemini.

Passaggi successivi