Questa pagina è stata tradotta dall'API Cloud Translation.

Ricerca vettoriale

MySQL | PostgreSQL | SQL Server

Per utilizzare la versione GA della ricerca vettoriale, la versione di manutenzione dell'istanza deve essere la versione MYSQL_8_0_version.R20241208.01_00 o successive, dove version è il numero di versione secondaria. Per informazioni su come eseguire l'upgrade dell'istanza a una versione più recente che supporta gli incorporamenti vettoriali GA, consulta Manutenzione self-service.

Per informazioni sulla sintassi e sul comportamento degli embedding vettoriali per la versione di anteprima pubblica di questa funzionalità, consulta Utilizzare gli embedding vettoriali (anteprima).

Questa pagina descrive come vengono implementate le ricerche vettoriali sulle istanze Cloud SQL per MySQL. Cloud SQL ti consente di archiviare vector embedding, creare indici vettoriali ed eseguire ricerche vettoriali in combinazione con gli altri dati archiviati.

Archiviazione di vector embedding

Archivi gli incorporamenti vettoriali in una tabella conforme alle proprietà di atomicità, coerenza, isolamento e durabilità (ACID). Come altri dati relazionali nella tabella, puoi accedere agli incorporamenti vettoriali nella tabella con la semantica transazionale esistente.

Per stabilire la mappatura tra le righe della tabella e le rappresentazioni vettoriali, devi creare una colonna nella tabella per archiviare gli embedding vettoriali. La colonna deve utilizzare il tipo di dati VECTOR di Cloud SQL e deve indicare il numero di dimensioni richieste dall'incorporamento. La colonna di incorporamento vettoriale può archiviare solo gli incorporamenti vettoriali che utilizzano esattamente le stesse dimensioni specificate quando definisci la colonna.

Una tabella può avere una sola colonna di incorporamento vettoriale. Non esistono limitazioni per il numero di righe nella tabella.

Per distinguere la colonna di vector embedding dalle altre colonne, Cloud SQL aggiunge COMMENT e CONSTRAINT speciali alla colonna. Il vincolo è obbligatorio per la convalida dell'input e l'annotazione della colonna di embedding vettoriale è visibile come COMMENT. Non puoi modificare o eliminare il commento o il vincolo.

Se hai spazio di archiviazione e memoria sufficienti disponibili sull'istanza Cloud SQL, puoi avere più tabelle con le proprie colonne di vector embedding.

La replica dei dati funziona allo stesso modo per la colonna di vector embedding e per le altre colonne MySQL InnoDB.

Per un elenco di limitazioni e restrizioni per tabelle, colonne e istruzioni DML di incorporamento vettoriale, consulta Limitazioni.

Indici vettoriali

Devi utilizzare un indice vettoriale per eseguire ricerche di similarità ANN sugli incorporamenti vettoriali. Cloud SQL crea indici vettoriali utilizzando l'algoritmo Scalable Nearest Neighbors (ScANN).

Gli indici vettoriali devono soddisfare i seguenti requisiti:

Puoi creare un solo indice vettoriale per tabella.
Se nella tua istanza sono presenti più tabelle con incorporamenti vettoriali, puoi creare indici vettoriali per ciascuna.
Se crei un indice vettoriale, non puoi aggiungere un vincolo alla chiave primaria della tabella indicizzata.

Per una migliore qualità della ricerca, crea un indice vettoriale solo dopo aver caricato la maggior parte dei dati nella tabella di base. Se hai meno di 1000 incorporamenti nella tabella di base, la creazione dell'indice non riesce.

Quando decidi se creare un indice vettoriale, se hai un numero ridotto di righe, valuta se puoi eseguire una ricerca KNN. La decisione di utilizzare una ricerca KNN anziché una ricerca ANN dipende anche dal numero di dimensioni dell'incorporamento vettoriale. Un numero maggiore di incorporamenti potrebbe richiedere un indice vettoriale.

Per un elenco di limitazioni e restrizioni per gli indici vettoriali, vedi Limitazioni. Per informazioni sulla creazione di un indice vettoriale, consulta Creare e gestire indici vettoriali.

Aggiornamenti dell'indice vettoriale

Cloud SQL aggiorna gli indici vettoriali in tempo reale. Qualsiasi transazione che esegue operazioni di data manipulation language (DML) sulla tabella di base propaga anche le modifiche agli indici vettoriali associati. Gli indici vettoriali si comportano allo stesso modo di qualsiasi altro indice secondario della tabella. Gli indici vettoriali sono completamente coerenti a livello transazionale e conformi ad ACID. Se esegui il rollback di una transazione, le modifiche di rollback corrispondenti vengono apportate anche all'indice vettoriale.

Replica degli indici vettoriali

Cloud SQL replica gli indici vettoriali in tutte le repliche di lettura, anche per la replica a cascata. Quando crei una nuova replica di lettura da un'istanza principale con incorporamento vettoriale, la replica di lettura eredita le impostazioni di incorporamento vettoriale dall'istanza principale. Per le repliche di lettura esistenti, devi abilitare il supporto dell'incorporamento vettoriale su ciascuna.

In termini di impatto sul ritardo di replica, la creazione e la manutenzione degli indici vettoriali funzionano allo stesso modo degli indici MySQL regolari.

Persistenza, arresto e impatto sulla manutenzione

Gli indici vettoriali vengono mantenuti allo stesso modo delle tabelle di base, con supporto ACID completo. Gli indici vettoriali sono sempre sincronizzati con i dati della tabella di base e hanno la stessa visibilità, isolamento e sicurezza in caso di arresto anomalo. L'indice vettoriale non viene interessato quando l'istanza viene arrestata o sottoposta a manutenzione.

Manutenzione indici

Dopo aver eseguito operazioni DML estese sulla tabella di base, l'indice vettoriale che hai addestrato sui dati iniziali (al momento della creazione dell'indice) potrebbe non riflettere il nuovo stato. Ciò può influire sulla qualità della ricerca.

L'indice è composto da due parti:

L'albero degli indici. Viene creato eseguendo l'addestramento sui dati esistenti. Rimane invariato per tutta la durata dell'indice.
L'indice viene chiuso. Questi contengono tutte le righe di dati. L'indice non viene mai desincronizzato.

L'albero dell'indice potrebbe diventare meno efficiente dopo l'esecuzione di un numero elevato di istruzioni DML perché le righe si spostano da una foglia all'altra. Per aggiornare l'albero dell'indice, devi ricompilarlo.

Operazioni DDL non supportate su tabelle con indici vettoriali

Modifica le operazioni tabella che richiedono l'algoritmo di copia.
Operazioni di modifica della tabella che richiedono la ricostruzione della tabella.
Elimina o modifica la chiave primaria.
Sposta la tabella in uno spazio delle tabelle generale.

Ricerca vettoriale

Cloud SQL fornisce funzioni di distanza vettoriale che utilizzi per eseguire ricerche di similarità vettoriale approssimativa del vicino più prossimo (ANN) e K-Nearest Neighbor (KNN) nella tua istanza. Quando esegui una query, il vettore della query viene confrontato con i vettori nel tuo set di dati. Le funzioni di distanza calcolano la distanza tra i vettori utilizzando una metrica di similarità come il coseno. I vettori con la distanza più breve tra loro sono i più simili e vengono restituiti nei risultati di ricerca.

Cloud SQL utilizza le seguenti funzioni per misurare la distanza tra i vettori nelle ricerche vettoriali quando esegui ricerche vettoriali ANN e KNN:

Coseno: misura il coseno dell'angolo tra due vettori. Un valore più piccolo indica una maggiore somiglianza tra i vettori.
Prodotto scalare: calcola il coseno dell'angolo moltiplicato per il prodotto delle magnitudo dei vettori corrispondenti.
Distanza L2 al quadrato: misura la distanza euclidea tra due vettori sommando la distanza al quadrato su ogni dimensione.

Ricerca KNN

Una ricerca vettoriale KNN è il metodo di ricerca preferito quando hai bisogno di risultati esatti o vuoi aggiungere un filtro selettivo. La ricerca KNN esegue un calcolo della distanza del vettore di query con ogni incorporamento nel set di dati per trovare il vicino più prossimo. Le ricerche KNN in Cloud SQL forniscono un richiamo perfetto. Le ricerche KNN non utilizzano un indice vettoriale, quindi sono una buona opzione quando si lavora con set di dati più piccoli.

Per eseguire una ricerca KNN, utilizzi la funzione vector_distance che accetta due vettori come input: il vettore di query (ciò che stai cercando) e un vettore candidato dal tuo set di dati. Calcola la distanza tra questi due vettori. Utilizzi vector_distance in un'istruzione SELECT. Per saperne di più, consulta Ricerca dei K-Nearest Neighbor (KNN).

Se noti che KNN non ha un buon rendimento, puoi creare un indice vettoriale in un secondo momento e continuare a utilizzare approx_distance nella tua applicazione per le ricerche ANN.

Ricerca ANN

Una ricerca vettoriale ANN è il tipo di ricerca preferito quando l'efficienza delle query è un problema. Accelera le ricerche di somiglianza calcolando la distanza tra il vettore della query e solo una parte dei vettori nel set di dati. A questo scopo, Cloud SQL organizza i dati in cluster o partizioni e poi concentra la ricerca sui cluster più vicini alla query. Le ricerche ANN richiedono indici vettoriali. Questi indici danno la priorità alla velocità di ricerca rispetto al richiamo perfetto. In Cloud SQL, il tipo di indice TREE_SQ viene utilizzato per le ricerche ANN.

Per eseguire una ricerca ANN, utilizza la funzione approx_distance con un'opzione di misurazione della distanza. Utilizzi approx_distance in un elenco ORDER BY o SELECT ed è consentita una clausola LIMIT per limitare i risultati di ricerca. Puoi anche aggiungere una clausola WHERE per eseguire il post-filtraggio dei risultati di ricerca. Per maggiori informazioni, consulta Ricerca dei vicini più prossimi approssimati (ANN).

In alcuni casi, una ricerca ANN viene eseguita come ricerca KNN. Per ulteriori informazioni, consulta Controllare lo stato di fallback per le ricerche ANN.

Requisiti

Cloud SQL richiede di abilitare i vector embedding sull'istanza utilizzando il flag cloudsql_vector prima di aggiungere i vector embedding. Per ulteriori informazioni, vedi Attivare e disattivare gli embedding vettoriali nell'istanza.

Limitazioni

Di seguito sono riportate le limitazioni relative alle tabelle che hanno una colonna di incorporamento vettoriale:

Può esserci una sola colonna di incorporamento vettoriale per tabella.
Può esserci un solo indice vettoriale per tabella.
Un incorporamento vettoriale è limitato a 16.000 dimensioni.
La colonna di incorporamento vettoriale non può essere una colonna generata.
Il partizionamento a livello di tabella nelle tabelle con colonne di incorporamento vettoriale non è supportato.
Le chiavi primarie che utilizzano i tipi di dati BIT, BINARY, VARBINARY, JSON, BLOB, TEXT o i dati spaziali non sono supportate per gli indici vettoriali. Le chiavi primarie composite non possono includere nessuno di questi tipi.
Se esiste un indice vettoriale, non puoi aggiungere un vincolo alla chiave primaria della tabella di base.
Quando è presente un indice vettoriale in una tabella, non puoi eseguire alcune operazioni DDL. Per saperne di più, consulta Operazioni DDL non supportate su tabelle con indici vettoriali.

Di seguito sono riportate le limitazioni per le query di ricerca vettoriale:

La funzione approx_distance può essere utilizzata solo in un elenco ORDER BY o SELECT.
I predicati che coinvolgono la tabella di base possono essere utilizzati nella condizione WHERE in combinazione con le espressioni approx_distance nell'elenco ORDER BY o SELECT. I predicati della condizione WHERE vengono valutati dopo le funzioni vettoriali approx_distance.

Best practice per lavorare con gli indici vettoriali

Questa sezione fornisce le best practice per lavorare con gli indici vettoriali. Ogni carico di lavoro è diverso e potrebbe essere necessario apportare modifiche di conseguenza.

Dopo le principali operazioni DML, è buona norma ricompilare l'indice.
In genere, è accettabile lasciare che Cloud SQL calcoli il numero di foglie da utilizzare. Se hai un caso d'uso in cui vuoi specificare il numero di foglie, ti consigliamo di avere almeno 100 vettori per foglia per ottenere il miglior richiamo.

Passaggi successivi

Leggi la panoramica della ricerca vettoriale su Cloud SQL.
Scopri come generare vector embedding.
Scopri come creare indici vettoriali.
Scopri come eseguire ricerche sugli embedding vettoriali.