Vertex AI API untuk membuat pengalaman penelusuran dan RAG

Vertex AI menawarkan serangkaian API untuk membantu Anda membuat aplikasi Retrieval Augmented Generation (RAG) Anda sendiri atau membuat mesin Penelusuran Anda sendiri. Halaman ini memperkenalkan API tersebut.

Pengambilan dan pembuatan

RAG adalah metodologi yang memungkinkan Model Bahasa Besar (LLM) menghasilkan respons yang didasarkan pada sumber data pilihan Anda. Ada dua tahap dalam RAG:

  1. Pengambilan: Mendapatkan fakta yang paling relevan dengan cepat dapat menjadi masalah penelusuran umum. Dengan RAG, Anda dapat dengan cepat mengambil fakta yang penting untuk menghasilkan jawaban.
  2. Pembuatan: Fakta yang diambil digunakan oleh LLM untuk menghasilkan respons yang berisi rujukan.

Vertex AI menawarkan opsi untuk kedua tahap tersebut agar sesuai dengan berbagai kebutuhan developer.

Opsi pengambilan mencakup Vertex AI, membuat pengambil Anda sendiri, LlamaIndex di Vertex AI, membawa pengambil Anda sendiri, dan Google Penelusuran. Opsi pembuatan mencakup Grounded generation API dan Gemini.

Retrieval

Pilih metode pengambilan terbaik untuk kebutuhan Anda:

  • Vertex AI Search: Vertex AI Search adalah mesin pengambilan informasi berkualitas Google Penelusuran yang dapat menjadi komponen dalam aplikasi AI generatif apa pun yang menggunakan data perusahaan Anda. Vertex AI Search berfungsi sebagai mesin telusur semantik & kata kunci siap pakai untuk RAG dengan kemampuan untuk memproses berbagai jenis dokumen dan dengan konektor ke berbagai sistem sumber, termasuk BigQuery dan banyak sistem pihak ketiga.

    Untuk mengetahui informasi selengkapnya, lihat Vertex AI Search.

  • Membuat pengambilan sendiri: Jika ingin membuat penelusuran semantik, Anda dapat mengandalkan Vertex AI API untuk komponen sistem RAG kustom. Rangkaian API ini menyediakan implementasi berkualitas tinggi untuk penguraian dokumen, pembuatan penyematan, penelusuran vektor, dan pemeringkatan semantik. Penggunaan API tingkat rendah ini memberi Anda fleksibilitas penuh pada desain retriever sekaligus menawarkan waktu peluncuran yang dipercepat dan kualitas tinggi dengan mengandalkan Vertex AI API tingkat rendah.

    Untuk informasi selengkapnya, lihat Mem-build Retrieval Augmented Generation Anda sendiri.

  • Membawa pengambilan yang ada: Anda dapat menggunakan penelusuran yang ada sebagai pengambil untuk pembuatan yang berdasar. Anda juga dapat menggunakan Vertex API untuk RAG guna mengupgrade penelusuran yang ada ke kualitas yang lebih tinggi.

  • LlamaIndex di Vertex AI: LlamaIndex di Vertex AI memungkinkan developer yang sudah memahami framework software open source (OSS) populer ini untuk membuat retriever yang akan digunakan dalam produksi dan dalam konteks siap perusahaan.

    Untuk mengetahui informasi selengkapnya, lihat Ringkasan LlamaIndex di Vertex AI untuk RAG dalam dokumentasi AI Generatif di Vertex AI.

  • Google Penelusuran: Jika Anda menggunakan Perujukan dengan Google Penelusuran untuk model Gemini, Gemini akan menggunakan Google Penelusuran dan menghasilkan output yang didasarkan pada hasil penelusuran yang relevan. Metode pengambilan ini tidak memerlukan pengelolaan dan Anda mendapatkan pengetahuan dunia yang tersedia untuk Gemini.

    Untuk mengetahui informasi selengkapnya, lihat Pembumian dengan Google Penelusuran dalam dokumentasi AI Generatif di Vertex AI.

Generation

Pilih metode pembuatan terbaik untuk kebutuhan Anda:

  • Grounded generation API (GA dengan daftar yang diizinkan): Gunakan grounded generation API untuk menghasilkan jawaban yang berdasar pada kueri pengguna. API ini menggunakan model Gemini khusus yang telah disesuaikan dan merupakan cara efektif untuk mengurangi halusinasi dan memberikan respons yang didasarkan pada sumber Anda, sumber pihak ketiga, atau Google Penelusuran, termasuk referensi ke konten dukungan dasar.

    Untuk informasi selengkapnya, lihat Membuat jawaban yang berdasar.

  • Gemini: Gemini adalah model Google yang paling canggih dan menawarkan dasar bawaan dengan Google Penelusuran. Anda dapat menggunakannya untuk membuat solusi pembuatan yang disesuaikan sepenuhnya.

    Untuk mengetahui informasi selengkapnya, lihat Pemrosesan data dengan Google Penelusuran dalam dokumentasi AI Generatif di Vertex AI.

  • Model Garden: Jika menginginkan kontrol penuh dan model pilihan Anda, Anda dapat menggunakan model apa pun di Model Garden Vertex AI untuk pembuatan.

Membuat Retrieval-Augmented Generation Anda sendiri

Mengembangkan sistem RAG kustom untuk perujukan menawarkan fleksibilitas dan kontrol di setiap langkah proses. Vertex AI menawarkan serangkaian API untuk membantu Anda membuat solusi penelusuran Anda sendiri. Penggunaan API tersebut memberi Anda fleksibilitas penuh dalam desain aplikasi RAG, sekaligus menawarkan waktu peluncuran yang lebih cepat dan kualitas tinggi dengan mengandalkan Vertex AI API level rendah ini.

Vertex AI menawarkan API untuk memproses dan menganotasi, menyematkan, mengindeks, dan mengambil, memberi peringkat, membuat perujukan, dan melakukan validasi.

  • Document AI Layout Parser. Document AI Layout Parser mengubah dokumen dalam berbagai format menjadi representasi terstruktur, sehingga konten seperti paragraf, tabel, daftar, dan elemen struktural seperti judul, header halaman, dan footer dapat diakses, serta membuat potongan kontekstual yang memfasilitasi pengambilan informasi dalam berbagai aplikasi penemuan dan AI generatif.

    Untuk informasi selengkapnya, lihat Parser Tata Letak Document AI dalam dokumentasi Document AI.

  • Embeddings API: Vertex AI embeddings API memungkinkan Anda membuat embedding untuk input teks atau multimodal. Embedding adalah vektor bilangan floating point yang dirancang untuk menangkap makna inputnya. Anda dapat menggunakan penyematan untuk mendukung penelusuran semantik menggunakan penelusuran vektor.

    Untuk mengetahui informasi selengkapnya, lihat Embedding teks dan Embedding multimodal dalam dokumentasi AI Generatif di Vertex AI.

  • Vector Search. Mesin pengambilan adalah bagian penting dari aplikasi penelusuran atau RAG Anda. Vertex AI Vector Search adalah mesin pengambilan yang dapat menelusuri miliaran item yang memiliki kemiripan atau keterkaitan semantik dalam skala besar, dengan kueri per detik (QPS) tinggi, perolehan tinggi, latensi rendah, dan biaya yang rendah. Model ini dapat menelusuri penyematan yang padat, serta mendukung penelusuran kata kunci penyematan yang jarang dan penelusuran hybrid di Pratinjau publik.

    Untuk mengetahui informasi selengkapnya, lihat: Ringkasan Penelusuran Vektor Vertex AI dalam dokumentasi Vertex AI.

  • API peringkat. API peringkat mengambil daftar dokumen dan mengurutkan ulang dokumen tersebut berdasarkan relevansi dokumen dengan kueri tertentu. Dibandingkan dengan penyematan yang hanya melihat kemiripan semantik dokumen dan kueri, Ranking API dapat memberi Anda skor yang lebih akurat untuk seberapa baik dokumen menjawab kueri tertentu.

    Untuk informasi selengkapnya, lihat Mengurutkan dan mengurutkan ulang dokumen.

  • API pembuatan yang di-ground. Gunakan API generasi yang beralasan untuk menghasilkan jawaban yang beralasan atas perintah pengguna. Sumber perujukan dapat berupa penyimpanan data Vertex AI Search, data kustom yang Anda berikan, atau Google Penelusuran.

    Untuk informasi selengkapnya, lihat Membuat jawaban yang berdasar.

  • API pemeriksaan grounding. API pemeriksaan grounding menentukan seberapa baik bagian teks tertentu dalam kumpulan teks referensi tertentu. API ini dapat menghasilkan kutipan pendukung dari teks referensi untuk menunjukkan tempat teks tertentu didukung oleh teks referensi. Di antara hal lainnya, API dapat digunakan untuk menilai kesesuaian respons dari sistem RAG. Selain itu, sebagai fitur eksperimental, API juga menghasilkan kutipan yang bertentangan yang menunjukkan bagian yang tidak sesuai antara teks yang diberikan dan teks referensi.

    Untuk informasi selengkapnya, lihat Memeriksa pentanahan.

Alur kerja: Membuat respons yang berdasar dari data tidak terstruktur

Berikut adalah alur kerja yang menguraikan cara mengintegrasikan Vertex AI RAG API untuk menghasilkan respons yang berdasar dari data tidak terstruktur.

  1. Impor dokumen tidak terstruktur, seperti file PDF, file HTML, atau gambar dengan teks, ke lokasi Cloud Storage.
  2. Memproses dokumen yang diimpor menggunakan parser tata letak. Parser tata letak membagi dokumen tidak terstruktur menjadi beberapa bagian dan mengubah konten tidak terstruktur menjadi representasi terstrukturnya. Parser tata letak juga mengekstrak anotasi dari potongan.
  3. Buat embedding teks untuk bagian menggunakan Vertex AI text embeddings API.
  4. Indeks dan ambil penyematan bagian menggunakan Penelusuran Vektor.
  5. Rangkingkan potongan menggunakan API peringkat dan tentukan potongan berperingkat teratas.
  6. Buat jawaban yang berdasar berdasarkan bagian berperingkat teratas menggunakan API pembuatan yang berdasar.

Jika Anda membuat jawaban menggunakan model pembuatan jawaban selain model Google, Anda dapat memeriksa dasar jawaban ini menggunakan metode pemeriksaan dasar.