Archivia, indicizza ed esegui query sui vettori
L'estensione pgvector
PostgreSQL
extension
è personalizzata per AlloyDB e viene chiamata vector
.
Supporta l'archiviazione degli embedding generati in una colonna vettoriale. L'estensione aggiunge anche il supporto della funzionalità di quantizzazione scalare per creare indici IVF
. Puoi anche creare un indice IVFFlat
o HSNW
disponibile con le azioni pgvector
.
Per saperne di più sull'archiviazione dei vettori, consulta Memorizzare gli incorporamenti vettoriali.
Oltre all'estensione vector
personalizzata, AlloyDB
include l'estensione alloydb_scann
che implementa un indice
di ricerca dei vicini più prossimi altamente efficiente basato sull'algoritmo
ScaNN.
Per ulteriori informazioni sulla creazione di indici e sull'esecuzione di query sui vettori, consulta Creare indici ed eseguire query sui vettori.
Ottimizzare il rendimento delle query vettoriali
Puoi ottimizzare gli indici per trovare un equilibrio tra query al secondo (QPS) e richiamo con le tue query. Per ulteriori informazioni sull'ottimizzazione degli indici, vedi Ottimizzare le prestazioni delle query vettoriali.
Generare incorporamenti e previsioni di testo
AlloyDB AI estende la sintassi PostgreSQL con due funzioni per
interrogare i modelli utilizzando l'estensione google_ml_integration
:
Richiama le previsioni per chiamare un modello utilizzando SQL all'interno di una transazione.
Genera incorporamenti per consentire a un LLM di tradurre i prompt di testo in vettori numerici.
Puoi utilizzare la funzione
embedding()
per eseguire query sui modelli Vertex AI, mentre la funzionegoogle_ml.embedding()
può essere utilizzata per eseguire query sui modelli registrati di Vertex AI, ospitati e di terze parti.Puoi quindi applicare questi incorporamenti vettoriali come input alle funzioni
pgvector
. Sono inclusi metodi per confrontare e ordinare campioni di testo in base alla loro distanza semantica relativa.
Utilizzare i modelli nel cloud con Vertex AI
Puoi configurare AlloyDB Omni per funzionare con Vertex AI.
In questo modo, le tue applicazioni offrono i seguenti vantaggi:
Le tue applicazioni possono richiamare le previsioni utilizzando qualsiasi modello archiviato in Vertex AI Model Garden a cui hanno accesso.
Le tue applicazioni possono generare embedding utilizzando i
text-embedding-005
modelli in inglese LLM.