Questa pagina è stata tradotta dall'API Cloud Translation.

Panoramica dell'integrazione di Spanner Vertex AI

Questa pagina fornisce una panoramica dell'integrazione di Spanner Vertex AI. L'integrazione di Spanner Vertex AI funziona con i database GoogleSQL e PostgreSQL.

L'integrazione di Spanner Vertex AI consente di accedere ai modelli ML di regressione e classificazione ospitati su Vertex AI tramite l'interfaccia di GoogleSQL e PostgreSQL. Ciò consente di integrare perfettamente la funzionalità di pubblicazione delle previsioni di ML con le operazioni di accesso ai dati di Spanner generali eseguite utilizzando query DQL/DML.

Vantaggi dell'integrazione di Spanner Vertex AI

La generazione di previsioni ML utilizzando l'integrazione di Spanner Vertex AI offre diversi vantaggi rispetto all'approccio in cui l'accesso ai dati Spanner e all'endpoint di previsione Vertex AI vengono eseguiti separatamente:

Rendimento:
- Latenza migliore: l'integrazione di Spanner Vertex AI che comunica direttamente con il servizio Vertex AI elimina i round trip aggiuntivi tra un nodo di calcolo che esegue un client Spanner e il servizio Vertex AI.
- Maggiore velocità effettiva/parallelismo: l'integrazione di Spanner Vertex AI viene eseguita sull'infrastruttura di elaborazione delle query distribuita di Spanner, che supporta l'esecuzione di query altamente parallelizzabile.
Esperienza utente:
- La possibilità di utilizzare un'interfaccia SQL singola, semplice, coerente e familiare per facilitare gli scenari di trasformazione dei dati e di servizio ML a livello di scalabilità di Spanner riduce la barriera di accesso all'ML e consente un'esperienza utente molto più fluida.
Costi:
- L'integrazione di Spanner Vertex AI utilizza la capacità di calcolo di Spanner per unire i risultati dei calcoli ML e dell'esecuzione delle query SQL, il che elimina la necessità di eseguire il provisioning di un ulteriore calcolo (ad esempio in Compute Engine o Google Kubernetes Engine) per questo scopo.

Come funziona l'integrazione di Spanner Vertex AI?

L'integrazione di Spanner Vertex AI non ospita modelli ML, ma si basa sull'infrastruttura del servizio Vertex AI. Non è necessario addestrare un modello utilizzando Vertex AI per utilizzarlo con l'integrazione di Spanner Vertex AI, ma devi eseguirne il deployment su un endpoint Vertex AI.

Per addestrare i modelli sui dati archiviati in Spanner, puoi utilizzare quanto segue:

Query federate BigQuery insieme a BigQuery ML.
Dataflow per esportare i dati da Spanner in formato CSV e importare l'origine dati CSV in Vertex AI.

L'integrazione di Spanner Vertex AI estende le seguenti funzioni per l'utilizzo dei modelli ML:

Genera previsioni di ML chiamando un modello utilizzando SQL sui tuoi dati Spanner. Puoi utilizzare un modello di Vertex AI Model Garden o un modello di cui è stato eseguito il deployment nell'endpoint Vertex AI.
Genera incorporamenti di testo per consentire a un LLM di tradurre i prompt di testo in numeri. Per scoprire di più sugli embedding, consulta Ottenere embedding di testo.

Utilizzo delle funzioni di integrazione di Spanner Vertex AI

Un modello nell'integrazione di Spanner Vertex AI può essere utilizzato per generare previsioni o incorporamenti di testo nel codice SQL utilizzando le funzioni ML.PREDICT. Queste funzioni sono le seguenti:

GoogleSQL

Puoi utilizzare la seguente funzione di previsione ML per GoogleSQL:

ML.PREDICT

Prima di utilizzare il modello con la funzione ML.PREDICT, devi registrarlo utilizzando l'istruzione DDL CREATE MODEL.

Puoi anche utilizzare SAFE.ML.PREDICT per restituire null anziché un errore nelle previsioni. Ciò è utile nei casi in cui l'esecuzione di query di grandi dimensioni in cui alcune previsioni non riuscite sono tollerabili.

PostgreSQL

Puoi utilizzare la seguente funzione ML.PREDICT per PostgreSQL:

spanner.ML_PREDICT_ROW

Per utilizzare le funzioni, puoi selezionare un modello da Vertex AI Model Garden o utilizzare un modello di cui hai eseguito il deployment su Vertex AI.

Per ulteriori informazioni su come eseguire il deployment di un modello su un endpoint in Vertex AI, consulta Eseguire il deployment di un modello su un endpoint.

Per ulteriori informazioni su come utilizzare queste funzioni per generare una previsione ML, consulta Generare previsioni ML utilizzando SQL.

Per ulteriori informazioni su come utilizzare queste funzioni per generare incorporamenti di testo, vedi Ottenere incorporamenti di testo.

Prezzi

Non ci sono addebiti aggiuntivi da parte di Spanner quando lo utilizzi con l'integrazione di Spanner Vertex AI. Tuttavia, ci sono altri possibili addebiti associati a questa funzionalità:

Paghi le tariffe standard per la previsione online di Vertex AI. L'addebito totale dipende dal tipo di modello utilizzato. Alcuni tipi di modelli hanno una tariffa oraria fissa, a seconda del tipo di macchina e del numero di nodi utilizzati. Alcuni tipi di modelli hanno tariffe per chiamata. Ti consigliamo di eseguire il deployment di quest'ultimo in un progetto dedicato in cui hai impostato quote di previsione esplicite.
Paghi le tariffe standard per il trasferimento di dati tra Spanner e Vertex AI. L'addebito totale dipende dalla regione che ospita il server che esegue la query e dalla regione che ospita l'endpoint chiamato. Per ridurre al minimo gli addebiti, esegui il deployment degli endpoint Vertex AI nella stessa regione dell'istanza Spanner. Quando utilizzi configurazioni di istanze multiregionali o più endpoint Vertex AI, esegui il deployment degli endpoint sullo stesso continente.

SLA

A causa della minore disponibilità della previsione online di Vertex AI, devi configurare correttamente i modelli ML di Spanner per mantenere l'alta disponibilità di Spanner durante l'utilizzo dell'integrazione di Spanner Vertex AI:

I modelli ML di Spanner devono utilizzare più endpoint Vertex AI nel backend per attivare il failover.
Gli endpoint Vertex AI devono essere conformi all'SLA di Vertex AI.
Gli endpoint Vertex AI devono fornire una capacità sufficiente per gestire il traffico in entrata.
Gli endpoint Vertex AI devono utilizzare regioni separate vicine al database Spanner per evitare interruzioni regionali.
Gli endpoint Vertex AI devono utilizzare progetti separati per evitare problemi con le quote di previsione per progetto.

Il numero di endpoint Vertex AI ridondanti dipende dal relativo SLA e dal numero di righe nelle query Spanner:

SLA di Spanner	SLA di Vertex AI	1 riga	10 righe	100 righe	1000 righe
99,99%	99,9%	2	2	2	3
99,99%	99,50%	2	3	3	4
99,999%	99,9%	2	2	3	3
99,999%	99,50%	3	3	4	4

Gli endpoint Vertex AI non devono ospitare esattamente lo stesso modello. Ti consigliamo di configurare il modello Spanner ML in modo che abbia un modello principale, complesso e a elevato utilizzo di risorse di calcolo come primo endpoint. Gli endpoint di failover successivi possono puntare a modelli semplificati che richiedono meno risorse di calcolo, scalano meglio e possono assorbire i picchi di traffico.

Limitazioni

L'input e l'output del modello devono essere un oggetto JSON.

Conformità

Assured Workloads non supporta l'API Vertex AI Prediction. L'attivazione di un vincolo di utilizzo delle risorse con limitazioni disabilita l'API Vertex AI e di fatto la funzionalità di integrazione di Spanner Vertex AI.

Inoltre, ti consigliamo di creare un perimetro dei Controlli di servizio VPC per assicurarti che i tuoi database di produzione non possano connettersi agli endpoint Vertex AI nei tuoi progetti non di produzione che potrebbero non avere la configurazione di conformità corretta.