Sebelum memulai

Sebelum mulai menggunakan Penelusuran Vektor, Anda harus memilih model embedding, menyiapkan data, dan memutuskan jenis endpoint yang akan digunakan. Halaman ini memberikan beberapa informasi tentang cara melakukan hal-hal tersebut.

Menyiapkan embedding Anda

Untuk menggunakan Vector Search, Anda harus menyiapkan embedding Anda. Jika Anda sudah memiliki embeddings, lanjutkan ke bagian Choose an endpoint.

Untuk membuat embedding, lakukan langkah berikut:

  1. Memilih model embedding: Ada banyak model embedding eksternal yang tersedia, yang menawarkan berbagai fitur. Bergantung pada kasus penggunaan Anda, pilih salah satu jenis model berikut:

    • Siap digunakan: Jika Anda ingin mencocokkan teks ke teks atau teks ke gambar secara semantik berdasarkan relevansi teks atau gambar saja. Ini adalah kasus penggunaan standar, sehingga Anda tidak perlu melatih atau menyesuaikan model tersebut. AI Generatif di Vertex AI adalah opsi yang direkomendasikan untuk kasus penggunaan ini.

    • Model kustom untuk embedding: Jika Anda ingin mencocokkan secara semantik berdasarkan data Anda sendiri atau kasus penggunaan tertentu.

  2. Menyiapkan data: Bersihkan dan lakukan pra-pemrosesan data untuk memastikan data tersebut dalam format yang dapat digunakan oleh model embedding.

  3. Melatih model embedding jika menggunakan model kustom: Jika memilih untuk menggunakan model embedding kustom (tuning), Anda perlu melatihnya pada data. Hal ini dapat menjadi proses yang memakan waktu dan bergantung pada ukuran dan kompleksitas data Anda. Jika Anda menggunakan model yang telah dilatih sebelumnya dari Model Garden, Anda dapat melewati langkah ini.

  4. Membuat embeddings: Setelah model dilatih, gunakan model tersebut untuk membuat embeddings untuk data Anda.

Memilih endpoint

Setelah membuat indeks, Anda akan men-deploy indeks ke endpoint. Untuk mengetahui informasi selengkapnya, lihat Men-deploy dan mengelola endpoint indeks publik serta Men-deploy dan mengelola endpoint indeks di jaringan VPC. Sebaiknya tentukan jenis endpoint yang Anda perlukan sebelum membuat indeks.

Anda dapat men-deploy indeks kueri ke salah satu opsi berikut:

  • Endpoint publik: Jika men-deploy ke endpoint publik, Anda tidak perlu menyiapkan jaringan. Jaringan publik memiliki latensi yang sedikit lebih tinggi, tetapi lebih cepat disiapkan dan lebih mudah dikelola.

  • Endpoint Pribadi: Jika ingin menggunakan VPC, Anda harus menyiapkan jaringan terlebih dahulu. Vector Search mendukung dua jenis jaringan pribadi.

Langkah selanjutnya

Setelah Anda membuat embedding dan memutuskan tempat untuk men-deploy indeks, langkah selanjutnya adalah mengonfigurasi indeks Anda.