Memorizza gli embedding vettoriali

Questa pagina mostra come utilizzare AlloyDB come database vettoriale con l'estensione vector che include funzioni e operatori pgvector. Queste funzioni e questi operatori ti consentono di memorizzare gli incorporamenti come valori vettore.

Estensione del database obbligatoria

Utilizza l'estensione vector, versione 0.5.0.google-1 o successiva, che include funzioni e operatori pgvector, per memorizzare gli embedding generati come valori vector. Si tratta di una versione di pgvector estesa da Google con ottimizzazioni specifiche per AlloyDB.

CREATE EXTENSION IF NOT EXISTS vector;

Memorizza gli incorporamenti generati

Assicurati di aver già creato una tabella nel tuo database AlloyDB.

Per archiviare gli embedding vettoriali:

  1. Crea una colonna vector[] nella tabella per archiviare gli embedding:

    ALTER TABLE TABLE ADD COLUMN EMBEDDING_COLUMN vector(DIMENSIONS);
    

    Sostituisci quanto segue:

    • TABLE: il nome della tabella

    • EMBEDDING_COLUMN: il nome della nuova colonna di embedding

    • DIMENSIONS: il numero di dimensioni supportate dal modello.

      Ad esempio, se utilizzi uno dei modelli in inglese text-embedding, ad esempio text-embedding-005 con Vertex AI, specifica 768.

  2. Copia i vettori nella colonna dei vettori. Nell'esempio seguente si presume che gli embedding siano disponibili in un file CSV:

    COPY TABLE (EMBEDDING_COLUMN) FROM 'PATH_TO_VECTOR_CSV (FORMAT CSV);
    

    Sostituisci quanto segue:

    • PATH_TO_VECTOR_CSV: il percorso completo della posizione in cui hai archiviato il file .csv.

Dopo aver archiviato gli embedding, puoi utilizzare l'estensione vector o l'estensione alloydb_scann per creare indici per un rendimento più rapido delle query.

Passaggi successivi