Menyimpan, mengindeks, dan membuat kueri vektor
Ekstensi pgvector
PostgreSQL
extension
bawaan disesuaikan untuk AlloyDB, dan disebut sebagai vector
.
Fitur ini mendukung penyimpanan embedding yang dihasilkan dalam kolom vektor. Ekstensi ini juga menambahkan dukungan untuk fitur kuantisasi skalar guna membuat indeks IVF
. Anda juga dapat membuat indeks IVFFlat
atau indeks HSNW
yang tersedia dengan stok pgvector
.
Untuk mengetahui informasi selengkapnya tentang menyimpan vektor, lihat Menyimpan vektor.
Selain ekstensi vector
yang disesuaikan, AlloyDB
mencakup ekstensi alloydb_scann
yang menerapkan indeks tetangga terdekat yang sangat efisien yang didukung oleh algoritma ScaNN.
Untuk mengetahui informasi selengkapnya tentang cara membuat indeks dan membuat kueri vektor, lihat Membuat indeks dan membuat kueri vektor.
Menyesuaikan performa kueri vektor
Anda dapat menyesuaikan indeks untuk menyeimbangkan kueri per detik (QPS) dan perolehan dengan kueri Anda. Untuk mengetahui informasi selengkapnya tentang cara menyesuaikan indeks, lihat Menyesuaikan performa kueri vektor.
Membuat embedding dan prediksi teks
AlloyDB AI memperluas sintaksis PostgreSQL dengan dua fungsi untuk
mengueri model menggunakan ekstensi google_ml_integration
:
Panggil prediksi untuk memanggil model menggunakan SQL dalam transaksi.
Buat embedding agar LLM menerjemahkan perintah teks menjadi vektor numerik.
Anda dapat menggunakan fungsi
embedding()
untuk membuat kueri model Vertex AI, sedangkan fungsigoogle_ml.embedding()
dapat digunakan untuk membuat kueri model pihak ketiga, yang dihosting, dan Vertex AI terdaftar.Anda kemudian dapat menerapkan embedding vektor ini sebagai input ke fungsi
pgvector
. Hal ini mencakup metode untuk membandingkan dan mengurutkan sampel teks menurut jarak semantik relatifnya.
Menggunakan model di cloud dengan Vertex AI
Anda dapat mengonfigurasi AlloyDB Omni agar dapat digunakan dengan Vertex AI.
Hal ini memberikan manfaat berikut bagi aplikasi Anda:
Aplikasi Anda dapat memanggil prediksi menggunakan model apa pun yang disimpan di Vertex AI Model Garden yang dapat diakses.
Aplikasi Anda dapat membuat embedding menggunakan LLM model berbahasa Inggris
textembedding-gecko
.