Memorizza gli embedding vettoriali

Questa pagina mostra come utilizzare AlloyDB come database vettoriale con l'estensione vector che include funzioni e operatori pgvector. Queste funzioni e questi operatori ti consentono di memorizzare gli incorporamenti come valori vettore.

Estensione del database obbligatoria

Utilizza l'estensione vector, versione 0.5.0.google-1 o successiva, che include funzioni e operatori pgvector, per memorizzare gli embedding generati come valori vector. Si tratta di una versione di pgvector estesa da Google con ottimizzazioni specifiche per AlloyDB.

CREATE EXTENSION IF NOT EXISTS vector;

Memorizza gli incorporamenti generati

Assicurati di aver già creato una tabella nel tuo database AlloyDB.

Per archiviare gli embedding vettoriali:

  1. Crea una colonna vector[] nella tabella per archiviare gli embedding:

    ALTER TABLE TABLE ADD COLUMN EMBEDDING_COLUMN vector(DIMENSIONS);
    

    Sostituisci quanto segue:

    • TABLE: il nome della tabella

    • EMBEDDING_COLUMN: il nome della nuova colonna di embedding

    • DIMENSIONS: il numero di dimensioni supportate dal modello.

      Ad esempio, se utilizzi uno dei textembedding-geckomodelli in inglese, ad esempio textembedding-gecko@003, con Vertex AI, specifica 768.

  2. Copia i vettori nella colonna dei vettori. Nell'esempio seguente si presuppone che gli embedding siano disponibili in un file CSV:

    COPY TABLE (EMBEDDING_COLUMN) FROM 'PATH_TO_VECTOR_CSV (FORMAT CSV);
    

    Sostituisci quanto segue:

    • PATH_TO_VECTOR_CSV: il percorso completo della posizione in cui hai archiviato il file CSV.

Dopo aver archiviato gli embedding, puoi utilizzare l'estensione vector o l'estensione alloydb_scann per creare indici per un rendimento più rapido delle query.

Passaggi successivi