Sebelum Anda memulai

Sebelum mulai menggunakan Vector Search, Anda harus memilih model penyematan, menyiapkan data, dan menentukan jenis endpoint yang akan digunakan. Halaman ini memberikan beberapa informasi tentang cara melakukannya.

Menyiapkan embedding Anda

Untuk menggunakan Vector Search, Anda harus menyiapkan embedding Anda. Jika sudah memiliki penyematan, lanjutkan ke bagian Memilih endpoint.

Untuk membuat embedding, lakukan langkah berikut:

  1. Memilih model penyematan: Tersedia banyak model penyematan eksternal yang menawarkan berbagai fitur.

    Penelusuran Vektor mendukung embedding padat, embedding jarang, dan penelusuran campuran. Penelusuran campuran menggunakan penyematan rapat dan renggang sesuai dengan bobot yang Anda tentukan untuk jenis penyematan tersebut.

    Bergantung pada kasus penggunaan Anda, pilih salah satu jenis model berikut:

    • Siap digunakan: Jika Anda ingin mencocokkan teks secara semantik dengan teks atau teks dengan gambar berdasarkan relevansi teks atau gambar saja. Ini adalah kasus penggunaan standar, sehingga Anda tidak perlu melatih atau menyesuaikan model. AI Generatif di Vertex AI adalah opsi yang direkomendasikan untuk kasus penggunaan ini. AI Generatif di Vertex AI menggunakan model penyematan padat.

    • Model kustom untuk embedding: Jika Anda ingin mencocokkan berdasarkan data Anda sendiri atau kasus penggunaan tertentu.

  2. Menyiapkan data: Bersihkan dan pra-proses data Anda untuk memastikan bahwa data tersebut dalam format yang dapat digunakan oleh model penyematan.

  3. Melatih model embedding jika Anda menggunakan model kustom: Jika memilih untuk menggunakan model embedding kustom (penyesuaian), Anda perlu melatihnya pada data Anda. Proses ini dapat memakan waktu dan bergantung pada ukuran serta kompleksitas data Anda. Jika Anda menggunakan model terlatih sebelumnya dari Model Garden, Anda dapat melewati langkah ini.

  4. Membuat embedding: Setelah model dilatih, gunakan model tersebut untuk membuat embedding untuk data Anda.

Memilih endpoint

Setelah membuat indeks, Anda akan men-deploy-nya ke endpoint. Untuk mengetahui informasi selengkapnya, lihat Men-deploy dan mengelola endpoint indeks publik dan Men-deploy dan mengelola endpoint indeks di jaringan VPC. Sebaiknya tentukan jenis endpoint yang Anda perlukan sebelum membuat indeks.

Anda dapat men-deploy indeks kueri ke salah satu opsi berikut:

  • Endpoint publik: Jika men-deploy ke endpoint publik, Anda tidak perlu menyiapkan jaringan. Jaringan publik memiliki latensi yang sedikit lebih tinggi, tetapi lebih cepat disiapkan dan lebih mudah dikelola.

  • Endpoint Pribadi: Jika ingin menggunakan VPC, Anda harus menyiapkan jaringan terlebih dahulu. Penelusuran Vektor mendukung dua jenis jaringan pribadi.

Langkah berikutnya

Setelah Anda membuat embedding dan memutuskan tempat untuk men-deploy indeks, langkah selanjutnya adalah mengonfigurasi indeks Anda.