Rasakan kecanggihan teknologi penelusuran vektor canggih dengan demo interaktif Penelusuran Vektor. Dengan memanfaatkan set data dunia nyata, demo ini memberikan contoh realistis yang akan membantu Anda mempelajari cara kerja Penelusuran Vektor, menjelajahi penelusuran semantik dan campuran, serta melihat cara kerja pemeringkatan ulang. Kirimkan deskripsi singkat tentang hewan, tanaman, merchandise e-commerce, atau item lainnya, dan biarkan Vector Search melakukan sisanya.
Cobalah!
Bereksperimenlah dengan berbagai opsi dalam demo untuk memulai dengan Penelusuran Vektor dan memahami dasar-dasar teknologi penelusuran vektor.
Untuk menjalankan:
Di kolom teks Query, deskripsikan item yang ingin Anda buat kuerinya (misalnya,
vintage 1970s pinball machine
). Atau, klik Generate Query untuk membuat deskripsi secara otomatis.Klik Kirim.
Untuk mempelajari lebih lanjut hal yang dapat Anda lakukan dalam demo, lihat Antarmuka Pengguna.
Antarmuka Pengguna
Bagian ini menjelaskan setelan di UI yang dapat Anda gunakan untuk mengontrol hasil yang ditampilkan Penelusuran Vektor dan cara hasil tersebut diberi peringkat.
Set data
Gunakan drop-down Set data untuk memilih set data yang akan digunakan Vector Search untuk menjalankan kueri Anda. Lihat Set data untuk mengetahui detail setiap set data.
Kueri
Untuk kolom Kueri, tambahkan deskripsi atau satu atau beberapa kata kunci untuk menentukan item yang ingin Anda temukan dengan Vector Search. Atau, klik Buat Kueri untuk membuat deskripsi secara otomatis.
Mengubah
Ada beberapa opsi yang tersedia untuk mengubah hasil yang ditampilkan Penelusuran Vektor:
Klik Baris, lalu pilih jumlah maksimum hasil penelusuran yang ingin ditampilkan oleh Penelusuran Vektor.
Pilih Gunakan embedding padat jika Anda ingin Vector Search menampilkan hasil yang secara semantik serupa.
Pilih Gunakan penyematan jarang jika Anda ingin Penelusuran Vektor menampilkan hasil berdasarkan sintaksis teks kueri Anda. Tidak semua set data yang tersedia mendukung model penyematan jarang.
Pilih Gunakan embedding padat dan Gunakan embedding jarang jika Anda ingin Vector Search menggunakan penelusuran campuran. Tidak semua set data mendukung model ini. Penelusuran campuran menggabungkan elemen penyematan padat dan jarang yang dapat meningkatkan kualitas hasil penelusuran. Untuk mempelajari lebih lanjut, buka Tentang penelusuran campuran.
Di kolom RRF Alpha, masukkan antara 0,0 dan 1,0 untuk menentukan efek peringkat RRF.
Untuk mengurutkan ulang hasil penelusuran, pilih ranking_api dari dropdown Pengurutan ulang atau pilih Tidak ada untuk menonaktifkan pengurutan ulang.
Metrik
Setelah kueri berjalan, Anda akan mendapatkan metrik latensi yang menguraikan waktu yang diperlukan untuk menyelesaikan berbagai tahap penelusuran.
Proses Kueri
Saat kueri diproses, hal berikut akan terjadi:
Pembuatan penyematan kueri: Penyematan dibuat untuk teks kueri yang ditentukan.
Kueri Vector Search: Kueri dijalankan dengan indeks Vector Search.
Pengambilan Vertex AI Feature Store: Fitur dibaca (misalnya, nama item, deskripsi, atau URL gambar) dari Vertex AI Feature Store menggunakan daftar ID item yang ditampilkan Vector Search.
Pemberian peringkat ulang: Item yang diambil diurutkan melalui API peringkat yang menggunakan teks kueri, nama item, dan deskripsi item untuk menghitung skor relevansi.
Embeddings
Multimodal: Penelusuran semantik multimodal pada gambar item. Untuk mengetahui detailnya, buka Apa itu Penelusuran Multimodal: "LLM dengan visi" mengubah bisnis.
Teks (kemiripan semantik): Penelusuran semantik teks pada nama dan deskripsi item berdasarkan kemiripan semantik. Untuk mempelajari lebih lanjut, buka Vertex AI Embeddings for Text: Grounding LLMs made easy.
Teks (pertanyaan-jawaban): Penelusuran semantik teks pada nama dan deskripsi item, dengan kualitas penelusuran yang ditingkatkan berdasarkan jenis tugas QUESTION_ANSWERING. Hal ini cocok untuk jenis aplikasi Tanya Jawab. Untuk mengetahui informasi tentang penyematan jenis tugas, buka Meningkatkan kasus penggunaan AI generatif dengan penyematan dan jenis tugas Vertex AI.
Jarang (Penelusuran Hybrid): Penelusuran kata kunci (berbasis token) pada nama dan deskripsi item, yang dihasilkan dengan algoritma TF-IDF. Untuk mengetahui informasi selengkapnya, buka Tentang penelusuran campuran.
Set data
Demo interaktif ini mencakup beberapa set data tempat Anda dapat menjalankan kueri. Set data berbeda satu sama lain berdasarkan model penyematan, dukungan untuk penyematan jarang, dimensi penyematan, dan jumlah item yang disimpan.
Set data | Model Penyematan | Model Sparse Embedding | Dimensi Embed | Jumlah Item |
---|---|---|---|---|
Embedding Mercari Multimodal + Sparse | Embedding multimodal | TF-IDF (nama dan deskripsi item) |
1408 | ~3 juta |
Teks Mercari (kemiripan semantik) + Sparse embeddings | text-embedding-005 ) (Jenis tugas: SEMANTIC_SIMILARITY) |
TF-IDF (nama dan deskripsi item) |
768 | ~3 juta |
Teks Mercari (pemberian jawaban atas pertanyaan) + Penyematan jarang | text-embedding-005 ) (Jenis tugas: QUESTION_ANSWERING) |
TF-IDF (nama dan deskripsi item) |
768 | ~3 juta |
Bunga GBIF Multimodal + Embedding jarang | Embedding multimodal | TF-IDF (nama dan deskripsi item) |
1408 | ~3,3 juta |
Embedding Multimodal Hewan GBIF | Embedding multimodal | T/A | 1408 | ~7 juta |
Langkah berikutnya
Setelah memahami demo, Anda siap untuk mempelajari lebih dalam cara menggunakan Penelusuran Vektor.
Panduan memulai: Gunakan set data contoh untuk membuat dan men-deploy indeks dalam waktu 30 menit atau kurang.
Sebelum memulai: Temukan hal yang harus dilakukan untuk menyiapkan penyematan dan menentukan jenis endpoint tempat indeks Anda akan di-deploy.