Questa pagina documenta la versione 15.7.0 di AlloyDB Omni utilizzando l'opzione di deployment Kubernetes. Scegli un'altra opzione di implementazione.

Questa pagina è stata tradotta dall'API Cloud Translation.

Registra e chiama i modelli di IA remoti nella panoramica di AlloyDB Omni

Seleziona una versione della documentazione:

Questa pagina fornisce una comprensione dei concetti chiave che devi conoscere prima di registrare un endpoint del modello di AI e richiamare le previsioni con la gestione degli endpoint del modello.

Per registrare gli endpoint dei modelli remoti con AlloyDB per PostgreSQL, consulta Registrare e chiamare modelli di AI remoti in AlloyDB.

Panoramica

La gestione degli endpoint dei modelli ti consente di registrare un endpoint del modello, gestire i metadati dell'endpoint del modello nel tuo cluster di database ed effettuare chiamate agli endpoint del modello remoto utilizzando query SQL. Fornisce l'estensione google_ml_integration che include funzioni che consentono di registrare i metadati relativi ai modelli di AI con AlloyDB. Questi metadati registrati vengono utilizzati per generare vector embedding o richiamare le previsioni.

Di seguito sono riportati alcuni tipi di modelli di esempio che puoi registrare utilizzando la gestione degli endpoint dei modelli:

Modelli generici e di incorporamento di testo Vertex AI
Modelli di incorporamento forniti da provider di terze parti, come Hugging Face o OpenAI
Modelli di text embedding ospitati in modo personalizzato, inclusi modelli self-hosted o modelli disponibili tramite endpoint privati
Modelli generici con un'API basata su JSON, ad esempio il modello facebook/bart-large-mnli ospitato su Hugging Face, il modello gemini-pro di Vertex AI Model Garden o i modelli claude di Anthropic

Come funziona

Puoi utilizzare la gestione degli endpoint del modello per registrare un endpoint del modello conforme a quanto segue:

L'input e l'output del modello supportano il formato JSON.
Il modello può essere chiamato utilizzando il protocollo REST.

Quando registri un endpoint modello con la gestione degli endpoint modello, ogni endpoint viene registrato con un ID modello univoco che hai fornito come riferimento al modello.

Puoi utilizzare l'ID endpoint del modello per eseguire query sui modelli per:

Genera incorporamenti per tradurre i prompt di testo in vettori numerici. Puoi memorizzare gli incorporamenti generati come dati vettoriali quando l'estensione vector è abilitata nel database. Per ulteriori informazioni, consulta Memorizzare gli embedding vettoriali.
Richiama le previsioni utilizzando SQL.

Le tue applicazioni possono accedere alla gestione degli endpoint del modello utilizzando l'estensione google_ml_integration. Questa estensione fornisce le seguenti funzioni:

La funzione SQL google_ml.create_model(), utilizzata per registrare l'endpoint del modello utilizzato nella funzione di previsione o incorporamento.
La funzione SQL google_ml.create_sm_secret(), che utilizza i secret in Secret Manager, dove sono archiviate le chiavi API. Google Cloud
La funzione SQL google_ml.embedding(), che è una funzione di previsione che genera incorporamenti di testo. Il tipo restituito della funzione di incorporamento è REAL[].
La funzione SQL google_ml.predict_row() che genera previsioni quando chiami modelli generici che supportano il formato di input e output JSON.
Altre funzioni di assistenza che gestiscono la generazione di URL personalizzati, la generazione di intestazioni HTTP o il passaggio di funzioni di trasformazione.
Funzioni per gestire gli endpoint e i secret del modello registrato.

Concetti fondamentali

Prima di iniziare a utilizzare la gestione degli endpoint del modello, comprendi i concetti necessari per connetterti ai modelli e utilizzarli.

Fornitore del modello

Fornitore del modello indica i provider di hosting dei modelli supportati. L'impostazione del fornitore del modello è facoltativa, ma aiuta la gestione degli endpoint del modello a identificare il fornitore e a formattare automaticamente le intestazioni per i modelli supportati. La tabella seguente mostra il valore del fornitore del modello che puoi impostare in base al fornitore del modello che utilizzi:

Fornitore del modello	Imposta in funzione come…
Vertex AI	`google`
Modelli Hugging Face	`hugging_face`
Modelli Anthropic	`anthropic`
OpenAI	`open_ai`
Altri modelli	`custom`

Il fornitore di modelli predefinito è custom.

A seconda del tipo di provider, il metodo di autenticazione supportato varia. I modelli Vertex AI utilizzano l'account di servizio utilizzato per installare AlloyDB Omni per l'autenticazione, mentre altri provider possono utilizzare Secret Manager o trasmettere i dettagli di autenticazione tramite le intestazioni. Per ulteriori informazioni, vedi Configurare l'autenticazione.

Tipo di modello

Model type indica il tipo di modello di AI. L'estensione supporta l'incorporamento di testo e qualsiasi tipo di modello generico. I tipi di modello supportati che puoi impostare durante la registrazione di un endpoint del modello sono text-embedding e generic.

L'impostazione del tipo di modello è facoltativa quando registri endpoint di modelli generici, poiché generic è il tipo di modello predefinito.

Modelli Vertex AI preregistrati

La gestione degli endpoint dei modelli supporta alcuni modelli di incorporamento di testo e generici di Vertex AI come ID modello preregistrati. Puoi utilizzare direttamente l'ID modello per generare incorporamenti o richiamare previsioni, in base al tipo di modello.
Per ulteriori informazioni sui modelli pre-registrati supportati, consulta Modelli Vertex AI pre-registrati.

Ad esempio, per chiamare il modello textembedding-gecko pre-registrato, puoi chiamarlo direttamente utilizzando la funzione di incorporamento:

SELECT
      google_ml.embedding(
        model_id => 'textembedding-gecko',
        content => 'AlloyDB is a managed, cloud-hosted SQL database service');

Modelli con supporto integrato

La gestione degli endpoint del modello fornisce il supporto integrato per alcuni modelli di Vertex AI, Anthropic e OpenAI. Per i modelli di text embedding con supporto integrato, AlloyDB configura automaticamente le funzioni di trasformazione predefinite.

Quando registri questi endpoint del modello, imposta il nome qualificato in modo esplicito. Per ulteriori informazioni su un elenco di modelli con supporto integrato, vedi Modelli con supporto integrato.

Il tipo di modello per questi modelli può essere text-embedding o generic.

Altri modelli di text embedding

Per registrare un endpoint del modello di incorporamento di testo senza supporto integrato, ti consigliamo di creare funzioni di trasformazione per gestire i formati di input e output supportati dal modello. A seconda dei requisiti del modello, potresti anche dover creare una funzione di intestazione personalizzata per specificare l'intestazione.

Il tipo di modello per questi modelli è text-embedding.

Modelli generici

La gestione degli endpoint del modello supporta anche la registrazione di tutti gli altri tipi di modelli, ad eccezione dei modelli di incorporamento di testo. Per richiamare le previsioni per i modelli generici, utilizza la funzione google_ml.predict_row(). Puoi impostare i metadati dell'endpoint del modello, come un endpoint di richiesta e intestazioni HTTP specifiche per il tuo modello.

Non puoi trasferire le funzioni di trasformazione quando registri un endpoint del modello generico. Assicurati che quando richiami le previsioni, l'input della funzione sia in formato JSON e di analizzare l'output JSON per derivare l'output finale.

Il tipo di modello per questi modelli è generic.

Autenticazione

I tipi di autenticazione indicano il tipo di autenticazione che puoi utilizzare per connetterti alla gestione degli endpoint del modello utilizzando l'estensione google_ml_integration. L'impostazione dell'autenticazione è facoltativa ed è necessaria solo se devi autenticarti per accedere al modello.

Per i modelli Vertex AI, l'account di servizio AlloyDB viene utilizzato per l'autenticazione. Per altri modelli, è possibile utilizzare la chiave API o il token bearer archiviato come secret in Secret Manager con la funzione SQL google_ml.create_sm_secret(). Se trasmetti l'autenticazione tramite le intestazioni, puoi saltare l'impostazione del metodo di autenticazione.

La tabella seguente mostra i tipi di autenticazione che puoi impostare:

Metodo di autenticazione	Imposta in funzione come…	Fornitore del modello
Agente di servizio AlloyDB	`alloydb_service_agent_iam`	Fornitore di Vertex AI
Secret Manager	`secret_manager`	fornitori di terze parti, come Anthropic, Hugging Face o OpenAI

Funzioni di previsione

L'estensione google_ml_integration include le seguenti funzioni di previsione:

google_ml.embedding(): Utilizzato per chiamare un endpoint del modello di incorporamento di testo registrato per generare incorporamenti.; Per i modelli di incorporamento di testo senza supporto integrato, i parametri di input e output sono univoci per un modello e devono essere trasformati affinché la funzione chiami il modello. Devi creare una funzione di input di trasformazione per trasformare l'input della funzione di previsione nell'input specifico del modello e una funzione di output di trasformazione per trasformare l'output specifico del modello nell'output della funzione di previsione.
google_ml.predict_row(): Utilizzato per chiamare un endpoint del modello generico registrato, a condizione che il modello supporti un'API basata su JSON, per richiamare le previsioni.

Funzioni di trasformazione

Le funzioni di trasformazione modificano l'input in un formato comprensibile per il modello e converte la risposta del modello nel formato previsto dalla funzione di previsione. Le funzioni di trasformazione vengono utilizzate durante la registrazione dell'endpoint del modello text-embedding senza supporto integrato. La firma delle funzioni di trasformazione dipende dall'input previsto dal modello.

Non puoi utilizzare le funzioni di trasformazione quando registri un endpoint del modello generic.

Di seguito sono riportate le firme per la funzione di previsione per i modelli di incorporamento di testo:

// define custom model specific input/output transform functions.
CREATE OR REPLACE FUNCTION input_transform_function(model_id VARCHAR(100), input_text TEXT) RETURNS JSON;

CREATE OR REPLACE FUNCTION output_transform_function(model_id VARCHAR(100), response_json JSON) RETURNS real[];

Per saperne di più su come creare funzioni di trasformazione, consulta Esempio di funzioni di trasformazione.

Funzione di generazione dell'intestazione HTTP

La funzione di generazione delle intestazioni HTTP genera l'output in coppie chiave-valore JSON che vengono utilizzate come intestazioni HTTP. La firma della funzione di previsione definisce le firme della funzione di generazione dell'intestazione.

Il seguente esempio mostra la firma della funzione di previsione google_ml.embedding().

CREATE OR REPLACE FUNCTION generate_headers(model_id VARCHAR(100), input TEXT) RETURNS JSON;

Per la funzione di previsione google_ml.predict_row(), la firma è la seguente:

CREATE OR REPLACE FUNCTION generate_headers(model_id VARCHAR(100), input JSON) RETURNS JSON;

Per maggiori informazioni su come creare una funzione di generazione dell'intestazione, consulta Esempio di funzione di generazione dell'intestazione.

Passaggi successivi

Configura l'autenticazione per i fornitori di modelli.
Registra un endpoint del modello con la gestione degli endpoint del modello.
Scopri di più sul riferimento per la gestione degli endpoint del modello.

Registra e chiama i modelli di IA remoti nella panoramica di AlloyDB Omni Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.