Questa pagina è stata tradotta dall'API Cloud Translation.

Registra e chiama i modelli di IA remota utilizzando la gestione degli endpoint dei modelli

MySQL | PostgreSQL | SQL Server

Questa pagina descrive come richiamare le previsioni o generare embedding utilizzando un modello, quindi registrare l'endpoint del modello con la gestione degli endpoint del modello.

Per saperne di più sulla funzione mysql.ml_create_model_registration(), consulta la documentazione di riferimento sulla gestione degli endpoint del modello.

Prima di iniziare

In base al provider del modello, configura l'autenticazione.

Connettiti all'istanza primaria utilizzando un client mysql o Cloud SQL Studio.
Assicurati di connetterti al database come utente del database MySQL con i privilegi di database descritti in Privilegi utente del database richiesti.

Configura l'autenticazione

Le sezioni seguenti mostrano come configurare l'autenticazione prima di aggiungere un endpoint del modello Vertex AI o endpoint del modello ospitati in Google Cloud.

Configura l'autenticazione per Vertex AI

Per utilizzare gli endpoint del modello Google Vertex AI, devi aggiungere le autorizzazioni Vertex AI al account di servizio Cloud SQL basato su IAM che utilizzi per connetterti al database. Per ulteriori informazioni sull'integrazione con Vertex AI, consulta Integrare Cloud SQL con Vertex AI.

Configura l'autenticazione per i modelli ospitati personalizzati

Questa sezione spiega come configurare l'autenticazione se utilizzi Secret Manager. Per tutti i modelli, ad eccezione degli endpoint dei modelli Vertex AI, puoi archiviare le chiavi API o i token di connessione in Secret Manager.

Se l'endpoint del modello non gestisce l'autenticazione tramite Secret Manager, questa sezione è facoltativa. Ad esempio, se l'endpoint del modello utilizza intestazioni HTTP per trasmettere informazioni di autenticazione o non utilizza affatto l'autenticazione, non completare i passaggi di questa sezione.

Per creare e utilizzare una chiave API o un token di autenticazione, completa i seguenti passaggi:

Crea un secret in Secret Manager. Per saperne di più, vedi Creare un secret e accedere a una versione del secret.

Il nome e il percorso del secret vengono utilizzati nella funzione SQL mysql.ml_create_sm_secret_registration().
Concedi le autorizzazioni all'istanza Cloud SQL per accedere al secret.
```
  gcloud secrets add-iam-policy-binding SECRET_ID \
      --member="serviceAccount:SERVICE_ACCOUNT_EMAIL" \
      --role="roles/secretmanager.secretAccessor"
```
Sostituisci quanto segue:
- SECRET_ID: l'ID del secret in Secret Manager.
- SERVICE_ACCOUNT_EMAIL: l'indirizzo email del account di servizio Cloud SQL basato su IAM. Per trovare questo indirizzo email, utilizza il comando gcloud sql instances describe INSTANCE_NAME e sostituisci INSTANCE_NAME con il nome dell'istanza. Il valore visualizzato accanto al parametro serviceAccountEmailAddress è l'indirizzo email.

Modelli di text embedding con supporto integrato

Questa sezione mostra come registrare gli endpoint del modello per la gestione degli endpoint del modello.

Modelli di embedding Vertex AI

La gestione degli endpoint dei modelli fornisce supporto integrato per tutte le versioni dei modelli text-embedding-gecko, text-embedding e gemini-embedding di Vertex AI. Utilizza il nome qualificato per impostare la versione del modello su textembedding-gecko@001 o textembedding-gecko@002.

Poiché gli ID endpoint del modello di incorporamento di Vertex AI sono supportati per impostazione predefinita con la gestione degli endpoint del modello, puoi utilizzarne uno qualsiasi direttamente come ID modello. Per questi modelli, la funzione di embedding esegue automaticamente la trasformazione di input e output.

Assicurati che sia l'istanza Cloud SQL sia il modello Vertex AI che stai interrogando si trovino nella stessa regione.

Per registrare l'endpoint del modello gemini-embedding-001, chiama la funzione ml_create_model_registration:

  CALL
    mysql.ml_create_model_registration(
      'gemini-embedding-001',
      'publishers/google/models/gemini-embedding-001',
      'google','text_embedding', 'gemini-embedding-001',
      'AUTH_TYPE_CLOUDSQL_SERVICE_AGENT_IAM',
       NULL,
      'mysql.cloudsql_ml_text_embedding_input_transform',
      'mysql.cloudsql_ml_text_embedding_output_transform', NULL);

Modelli di text embedding ospitati dal cliente

Questa sezione mostra come registrare endpoint del modello personalizzati ospitati in reti all'interno di Google Cloud.

L'aggiunta di endpoint del modello di text embedding ospitati dal cliente comporta la creazione di funzioni di trasformazione e, facoltativamente, di intestazioni HTTP personalizzate. D'altra parte, l'aggiunta di endpoint di modelli generici ospitati personalizzati prevede la generazione facoltativa di intestazioni HTTP personalizzate e l'impostazione dell'URL di richiesta del modello.

L'esempio seguente aggiunge l'endpoint del modello di text embedding custom-embedding-model ospitato da Cymbal, che è ospitato all'interno di Google Cloud. Le funzioni di trasformazione cymbal_text_input_transform e cymbal_text_output_transform vengono utilizzate per trasformare il formato di input e output del modello nel formato di input e output della funzione di previsione.

Per registrare gli endpoint del modello di text embedding ospitato dal cliente, completa i seguenti passaggi:

Chiama il secret archiviato in Secret Manager:
```
CALL
  mysql.ml_create_sm_secret_registration(
    'SECRET_ID',
    'projects/project-id/secrets/SECRET_MANAGER_SECRET_ID/versions/VERSION_NUMBER');
```
Sostituisci quanto segue:
- SECRET_ID: l'ID secret impostato e utilizzato successivamente durante la registrazione di un endpoint del modello, ad esempio key1.
- SECRET_MANAGER_SECRET_ID: l'ID secret impostato in Secret Manager quando hai creato il secret.
- PROJECT_ID: l'ID del tuo Google Cloud progetto.
- VERSION_NUMBER: il numero di versione dell'ID secret.
Nota:Secret Manager genera un'intestazione Authorization: Bearer SECRET_VALUE_FROM_SECRET_MANAGER per l'autenticazione per impostazione predefinita. Se questo formato corrisponde al formato del token di autorizzazione bearer dell'endpoint del modello, non devi generare intestazioni di autorizzazione utilizzando la funzione di generazione delle intestazioni.

Crea le funzioni di trasformazione di input e output in base alla seguente firma per la funzione di previsione per gli endpoint del modello di text embedding. Per saperne di più su come creare funzioni di trasformazione, consulta Esempio di funzioni di trasformazione.

Di seguito sono riportate funzioni di trasformazione di esempio specifiche per l'endpoint del modello di text embedding custom-embedding-model:

-- Input Transform Function corresponding to the custom model endpoint
DELIMITER $$
CREATE FUNCTION IF NOT EXISTS cymbal_text_input_transform(model_id VARCHAR(100), input_text TEXT)
RETURNS JSON
DETERMINISTIC

BEGIN
  RETURN JSON_OBJECT('prompt', JSON_ARRAY(input_text));
END $$

-- Output Transform Function corresponding to the custom model endpoint
CREATE FUNCTION IF NOT EXISTS cymbal_text_output_transform(model_id VARCHAR(100), response_json JSON)
RETURNS BLOB
DETERMINISTIC

BEGIN
  RETURN STRING_TO_VECTOR(
         JSON_EXTRACT(
              content,
              '$.predictions[0].embeddings.values'
            )
     );

END $$
DELIMITER ;

Chiama la funzione di creazione del modello per registrare l'endpoint del modello di embedding personalizzato:

   CALL
      mysql.ml_create_model_registration(
        'MODEL_ID',
        'REQUEST_URL',
        'custom',
        'text_embedding',
        'MODEL_QUALIFIED_NAME',
        'auth_type_secret_manager',
        'SECRET_ID'
        'database_name.cymbal_text_input_transform',
        'database_name.cymbal_text_output_transform', NULL);

Sostituisci quanto segue:

MODEL_ID: obbligatorio. Un ID univoco per l'endpoint del modello che definisci (ad esempio, custom-embedding-model). Questo ID modello viene utilizzato come riferimento per i metadati necessari all'endpoint del modello per generare embedding o richiamare previsioni.
REQUEST_URL: obbligatorio. L'endpoint specifico del modello quando aggiungi endpoint di modelli generici e di text embedding personalizzati, ad esempio https://cymbal.com/models/text/embeddings/v1. Assicurati che l'endpoint del modello sia accessibile tramite un indirizzo IP interno. La gestione degli endpoint del modello non supporta gli indirizzi IP esterni.
MODEL_QUALIFIED_NAME: obbligatorio se l'endpoint del modello utilizza un nome qualificato. Il nome completo nel caso in cui l'endpoint del modello abbia più versioni.
SECRET_ID: l'ID segreto che hai utilizzato in precedenza nella procedura mysql.ml_create_sm_secret_registration().

Modelli generici

Questa sezione mostra come registrare un endpoint del modello gemini-flash generico da Vertex AI Model Garden, che è preregistrato nel catalogo per impostazione predefinita. Puoi registrare qualsiasi endpoint del modello generico ospitato in Google Cloud.

Cloud SQL supporta solo gli endpoint dei modelli disponibili tramite Model Garden di Vertex AI e gli endpoint dei modelli ospitati nelle reti all'interno di Google Cloud.

Modello di Gemini

L'esempio seguente utilizza l'endpoint del modello gemini-2.5-flash di Vertex AI Model Garden.

Per registrare l'endpoint del modello gemini-2.5-flash, chiama la funzione mysql.ml_create_model_registration:

    CALL
      mysql.ml_create_model_registration(
        'MODEL_ID',
        'https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/gemini-2.5-flash:streamGenerateContent',
        'google',
        'auth_type_cloudsql_service_agent_iam',
        NULL, NULL, NULL, NULL);

Sostituisci quanto segue:

MODEL_ID: un ID univoco per l'endpoint del modello che definisci (ad esempio,
gemini-1). Questo ID modello viene utilizzato come riferimento per i metadati necessari all'endpoint del modello per generare incorporamenti o richiamare previsioni.
PROJECT_ID: l'ID del tuo Google Cloud progetto.

Per saperne di più, scopri come richiamare le previsioni per gli endpoint del modello generico.

Passaggi successivi

Scopri di più sul riferimento alla gestione degli endpoint del modello.