Questa pagina descrive come registrare un endpoint del modello di AI e richiamare le previsioni con la gestione degli endpoint del modello in Cloud SQL. Per utilizzare i modelli di AI negli ambienti di produzione, consulta Generare e gestire i vector embedding.
Panoramica
La gestione degli endpoint dei modelli consente di registrare un endpoint del modello, gestire i metadati dell'endpoint del modello nell'istanza Cloud SQL e quindi interagire con i modelli utilizzando query SQL. Puoi utilizzare questi modelli per generare vector embedding o richiamare previsioni.
Puoi registrare i seguenti tipi di modelli utilizzando la gestione degli endpoint dei modelli:
- Modelli di text embedding Vertex AI.
- Modelli di incorporamento di testo ospitati personalizzati ospitati in reti all'interno di Google Cloud.
Modelli generici con un'API basata su JSON. Ecco alcuni esempi di questi modelli:
- Il modello
gemini-flash
di Vertex AI Model Garden - Il modello
open_ai
per i modelli OpenAI - Modelli ospitati in reti all'interno di Google Cloud
- Il modello
Come funziona
Puoi utilizzare la gestione degli endpoint del modello per registrare un endpoint del modello conforme a quanto segue:
- L'input e l'output del modello supportano il formato JSON.
- Puoi utilizzare il protocollo REST per chiamare il modello.
Quando registri un endpoint del modello con la gestione degli endpoint dei modelli, la gestione degli endpoint dei modelli registra ogni endpoint con un ID modello univoco come riferimento al modello. Puoi utilizzare questo ID modello per eseguire query sui modelli, come segue:
Genera incorporamenti per tradurre i prompt di testo in vettori numerici. Puoi memorizzare gli incorporamenti generati come dati vettoriali quando attivi il supporto degli incorporamenti vettoriali nella tua istanza. Per saperne di più, consulta Attivare e disattivare gli incorporamenti vettoriali nell'istanza.
Richiama le previsioni per chiamare un modello utilizzando SQL all'interno di una transazione.
Per registrare e chiamare modelli di AI remoti con la tua istanza Cloud SQL, devi installare l'istanza con la versione di manutenzione MYSQL_VERSION.R20250531.01_14
o successive.
Se la tua istanza esegue una versione di manutenzione precedente a
MYSQL_VERSION.R20250531.01_14
, puoi utilizzare solo le seguenti funzioni come documentato con l'integrazione di Cloud SQL e Vertex AI.
Per eseguire l'upgrade dell'istanza alla versione di manutenzione MYSQL_VERSION.R20250531.01_14
o successive, consulta Manutenzione self-service.
Dopo aver eseguito l'upgrade dell'istanza, puoi utilizzare le seguenti
funzioni:
mysql.ml_create_model_registration()
: registra l'endpoint del modello utilizzato nella funzione di previsione o incorporamentomysql.ml_create_sm_secret_registration()
: utilizza i secret in Google Cloud Secret Manager, dove sono archiviate le chiavi API
Inoltre, puoi utilizzare le seguenti funzioni con il tuo fornitore di modelli registrato:
mysql.ml_embedding()
: genera incorporamenti di testomysql.ml_predict_row()
: genera previsioni quando chiami modelli generici che supportano i formati di input e output JSON
Privilegi utente del database obbligatori
Per registrare e chiamare modelli di AI remoti, devi aver eseguito l'accesso come utente del database MySQL a cui sono stati concessi i privilegi SELECT
e EXECUTE
su mysql.*
.
Per impostazione predefinita, qualsiasi utente con il ruolo cloudsqlsuperuser
dispone di questi privilegi o può creare un utente e concedere i privilegi richiesti.
Per ulteriori informazioni sul ruolo cloudsqlsuperuser
in Cloud SQL, consulta Privilegi utente MySQL 8.0 e Privilegi utente MySQL 8.4.
Concetti fondamentali
Prima di iniziare a utilizzare la gestione degli endpoint del modello, comprendi i concetti necessari per connetterti ai modelli e utilizzarli.
Fornitore del modello
Model provider è il provider host dei modelli supportato. La tabella seguente mostra il valore del fornitore del modello che devi impostare in base al fornitore del modello che utilizzi:
Fornitore del modello | Imposta in funzione come… |
---|---|
Vertex AI (incluso Gemini) | google |
Anthropic | anthropic |
Hugging Face | hugging_face |
OpenAI | open_ai |
Altri modelli ospitati al di fuori di Vertex AI, Anthropic, Hugging Face e OpenAI |
custom |
Il fornitore di modelli predefinito è custom
.
Tipi di modello
I tipi di modelli sono i tipi di modello di AI. Quando registri un endpoint del modello, puoi impostare
i tipi di modello text_embedding
o generic
per l'endpoint.
Se utilizzi Vertex AI come fornitore di modelli,
non devi registrare un endpoint del modello perché gli
endpoint sono supportati automaticamente.
Per impostazione predefinita, con Vertex AI utilizzi il modello text-embedding-005
.
text_embedding
.mysql.ml_predict_row()
.
Puoi impostare i metadati dell'endpoint del modello,
come un endpoint di richiesta e intestazioni HTTP specifiche per il tuo modello.generic
. Poiché generic
è il tipo di modello predefinito, se registri endpoint del modello per questo tipo, l'impostazione del tipo di modello è facoltativa.gemini-2.5-flash
.Metodi di autenticazione
Puoi attivare il supporto per i vector embedding nella tua istanza Cloud SQL per MySQL e poi specificare diversi metodi di autenticazione per accedere al modello. L'impostazione di questi metodi è facoltativa ed è necessaria solo se devi autenticarti per accedere al modello.Per i modelli Vertex AI, viene utilizzato il account di servizio Cloud SQL per l'autenticazione. Per altri modelli, la
chiave API o il token di autenticazione memorizzato come secret in
Secret Manager può essere utilizzato con la
funzione SQL mysql.ml_create_sm_secret_registration()
.
La tabella seguente mostra i metodi di autenticazione che puoi impostare:
Metodo di autenticazione | Imposta in funzione come… | Fornitore del modello |
---|---|---|
Agente di servizio Cloud SQL | auth_type_cloudsql_service_agent_iam |
Fornitore di Vertex AI |
Secret Manager | auth_type_secret_manager |
Modelli ospitati al di fuori di Vertex AI |
Funzioni di previsione
mysql.ml_embedding()
- Chiama un endpoint del modello di incorporamento di testo registrato per generare incorporamenti. Include il supporto integrato per tutti i modelli di embedding di Vertex AI.
- Per i modelli di incorporamento di testo senza supporto integrato, i parametri di input e output sono univoci per un modello e devono essere trasformati affinché la funzione chiami il modello. Crea una funzione di input di trasformazione per trasformare l'input della funzione di previsione nell'input specifico del modello e una funzione di output di trasformazione per trasformare l'output specifico del modello nell'output della funzione di previsione.
mysql.ml_predict_row()
- Chiama un endpoint del modello generico registrato, se l'endpoint supporta API basate su JSON per richiamare le previsioni.
Funzioni di trasformazione
Le funzioni di trasformazione modificano l'input in un formato comprensibile al modello e
convertono la risposta del modello nel formato previsto dalla funzione di previsione. Le
funzioni di trasformazione vengono utilizzate durante la registrazione dell'endpoint del modello text-embedding
senza
supporto integrato. La firma delle funzioni di trasformazione dipende dalla
funzione di previsione per il tipo di modello.
Non puoi utilizzare le funzioni di trasformazione quando registri un endpoint del modello generic
.
Di seguito sono riportate le firme per la funzione di previsione per i modelli di incorporamento di testo:
// define custom model specific input/output transform functions.
CREATE FUNCTION IF NOT EXISTS input_transform_function(model_id VARCHAR(100), input_text TEXT) RETURNS JSON DETERMINISTIC;
// the returned BLOB should be of type VECTOR
CREATE FUNCTION IF NOT EXISTS output_transform_function(model_id VARCHAR(100), response_json JSON) RETURNS BLOB DETERMINISTIC;
Per saperne di più su come creare funzioni di trasformazione, consulta Esempio di funzioni di trasformazione.
Funzione di generazione dell'intestazione HTTP
La funzione di generazione dell'intestazione HTTP genera l'output in coppie chiave-valore JSON che vengono utilizzate come intestazioni HTTP. La firma della funzione di previsione definisce le firme della funzione di generazione dell'intestazione.
L'esempio seguente mostra la firma della funzione di previsione mysql.ml_embedding()
:
CREATE FUNCTION IF NOT EXISTS generate_headers(model_id VARCHAR(100), input TEXT) RETURNS JSON DETERMINISTIC;
Per la funzione di previsione mysql.ml_predict_row()
, la firma è la seguente:
CREATE FUNCTION IF NOT EXISTS generate_headers(model_id VARCHAR(100), input JSON) RETURNS JSON DETERMINISTIC;
Per saperne di più su come creare una funzione di generazione dell'intestazione, consulta Esempio di funzione di generazione dell'intestazione.
Limitazioni
Quando esegui una delle funzioni di registrazione del modello o di gestione dei secret, esegui implicitamente il commit di tutte le transazioni aperte nella sessione. Le funzioni di previsione non eseguono il commit implicito delle transazioni.
Se esporti o importi il database con
mysqldump
, il catalogo degli endpoint del modello non viene esportato.Un database utente che contiene funzioni di trasformazione non può avere un carattere punto (
'.'
) nel nome. Ad esempio, un database chiamatomy.sql
non è supportato.La gestione degli endpoint del modello è disponibile solo per Cloud SQL per MySQL versione 8.0.36 e successive.
Passaggi successivi
- Configura l'autenticazione per i fornitori di modelli.
- Registra un endpoint del modello con la gestione degli endpoint del modello.
- Scopri di più sul riferimento alla gestione degli endpoint del modello.