Halaman ini memberikan ringkasan kemampuan yang ditawarkan oleh Cloud SQL untuk PostgreSQL guna membantu Anda membangun aplikasi AI generatif. Untuk mulai menggunakan aplikasi contoh, lihat Mulai menggunakan Cloud SQL untuk aplikasi AI generatif.
Retrieval-Augmented Generation (RAG) adalah teknik untuk mengoptimalkan output model bahasa besar (LLM) dengan merujuk pada pusat informasi yang kredibel sebelum menghasilkan respons. RAG meningkatkan aplikasi AI generatif dengan meningkatkan akurasinya. Database Cloud SQL menawarkan kemampuan yang dikurasi untuk aplikasi RAG dan AI generatif, seperti yang dijelaskan di halaman ini.
Membuat embedding vektor
Embedding vektor sangat penting untuk RAG karena memungkinkan pemahaman semantik dan penelusuran kemiripan yang efisien. Embedding ini adalah representasi numerik dari teks, gambar, audio, dan video. Model embedding menghasilkan embedding vektor sehingga, jika dua konten serupa secara semantik, maka embedding masing-masing akan berdekatan satu sama lain di ruang vektor embedding.
Cloud SQL terintegrasi dengan Vertex AI. Anda dapat menggunakan model yang dihosting oleh Vertex AI untuk membuat penyematan vektor menggunakan kueri SQL.
Cloud SQL memperluas sintaksis PostgreSQL dengan fungsi penyematan untuk membuat penyematan vektor teks. Setelah membuat embedding ini, Anda dapat menyimpannya di database Cloud SQL tanpa memerlukan database vektor terpisah.
Anda juga dapat menggunakan Cloud SQL untuk menyimpan embedding vektor yang dibuat di luar Cloud SQL. Misalnya, Anda dapat menyimpan embedding vektor yang dihasilkan menggunakan model terlatih di Vertex AI Model Garden. Anda dapat menggunakan embedding vektor ini sebagai input ke fungsi pgvector
untuk penelusuran semantik dan kemiripan.
Menyimpan, mengindeks, dan membuat kueri embedding vektor dengan pgvector
Anda dapat menyimpan, mengindeks, dan membuat kueri embedding vektor di Cloud SQL menggunakan ekstensi PostgreSQL pgvector
.
Untuk mengetahui informasi selengkapnya tentang cara mengonfigurasi ekstensi ini, lihat Mengonfigurasi ekstensi PostgreSQL. Untuk mengetahui informasi selengkapnya tentang menyimpan, mengindeks, dan membuat kueri embedding vektor, lihat Menyimpan embedding yang dihasilkan dan Membuat kueri dan mengindeks embedding menggunakan pgvector
.
Memanggil prediksi online menggunakan kueri SQL
Anda dapat memanggil prediksi online menggunakan model yang disimpan di Vertex AI Model Garden dengan menggunakan kueri SQL.
Menggunakan integrasi LangChain
Cloud SQL terintegrasi dengan LangChain, framework orkestrasi LLM open source, untuk menyederhanakan pengembangan aplikasi AI generatif. Anda dapat menggunakan paket LangChain berikut:
- Loader dokumen: memuat dan menyimpan informasi dari dokumen
- Penyimpanan vektor: menggunakan LangChain untuk mengaktifkan penelusuran semantik
- Pesan chat: mengaktifkan rantai untuk mengingat percakapan sebelumnya
Meningkatkan performa penelusuran vektor
Anda dapat meningkatkan performa penelusuran vektor dengan menggunakan hal berikut:
- Cache data: gunakan cache data bawaan yang memanfaatkan SSD lokal yang cepat untuk menyimpan halaman data yang sering dibaca. Anda bisa mendapatkan peningkatan performa baca hingga tiga kali lipat dibandingkan dengan membaca dari persistent disk.
Metrik cache data: mengoptimalkan kueri berdasarkan seberapa efektif cache data digunakan dalam penelusuran vektor.
Cloud SQL menyediakan metrik berikut di Metrics Explorer di Cloud Monitoring:
Metrik Deskripsi Label metrik Cache data yang digunakan Penggunaan cache data (dalam byte) database/data_cache/bytes_used
Kuota cache data Ukuran cache data maksimum (dalam byte) database/data_cache/quota
Jumlah hit cache data Jumlah total operasi baca hit cache data untuk sebuah instance database/postgresql/data_cache/hit_count
Jumlah cache data tidak ditemukan Jumlah total operasi baca yang tidak ada di cache data untuk sebuah instance database/postgresql/data_cache/miss_count
Rasio cache data ditemukan Rasio operasi baca hit cache data terhadap operasi baca miss cache data untuk sebuah instance
database/postgresql/data_cache/hit_ratio
Insight Sistem: memberikan metrik sistem seperti pemakaian CPU, pemakaian disk, dan throughput untuk membantu Anda memantau kondisi instance dan memecahkan masalah yang memengaruhi performa aplikasi AI generatif Anda. Untuk melihat metrik ini, gunakan dasbor Insight Sistem Cloud SQL.
Query Insights: mendeteksi, mendiagnosis, dan mencegah masalah performa kueri. Hal ini berguna untuk meningkatkan performa penelusuran vektor di aplikasi AI generatif Anda.
Anda dapat menggunakan dasbor Cloud SQL Query Insights untuk mengamati performa kueri teratas dan menganalisis kueri ini menggunakan rencana kueri visual. Anda juga dapat memantau performa di tingkat aplikasi dan melacak sumber kueri yang bermasalah di seluruh stack aplikasi ke database menggunakan SQLcommenter. Ini adalah library instrumentasi otomatis pemetaan relasional objek (ORM) open source.
Insight Kueri juga dapat membantu Anda berintegrasi dengan alat pemantauan aplikasi (APM) yang sudah ada sehingga Anda dapat memecahkan masalah kueri menggunakan alat yang sudah Anda kenal.
Manfaat menggunakan Cloud SQL untuk aplikasi AI generatif
Menggunakan Cloud SQL untuk membangun aplikasi AI generatif memberikan manfaat berikut:
- Gunakan PostgreSQL untuk membangun aplikasi AI generatif. Cloud SQL untuk PostgreSQL mendukung
pgvector
dan terintegrasi dengan Vertex AI dan LangChain. - Menggunakan layanan tepercaya yang memiliki perlindungan, keamanan, dan tata kelola data tingkat perusahaan. Dengan menggunakan Cloud SQL, Anda akan mendapatkan manfaat berikut:
- SLA ketersediaan tinggi sebesar 99,99% yang sudah termasuk pemeliharaan
- Layanan terkelola yang menyediakan fitur seperti pencadangan otomatis, replikasi, patch, enkripsi, dan peningkatan kapasitas penyimpanan otomatis
- Kemampuan keamanan, tata kelola, dan kepatuhan
- Gabungkan dengan data operasional kontekstual. Gunakan gabungan dan filter pada data operasional saat menggunakan penyematan vektor untuk mendapatkan respons yang kontekstual, akurat, dan terbaru di aplikasi AI generatif Anda.
- Mengurangi pekerjaan operasi yang berulang. Gunakan Cloud SQL sebagai database vektor Anda untuk mengurangi beban operasi yang terkait dengan mengekspor data ke database vektor terpisah.
- Akses model AI generatif terbaru. Gunakan kueri SQL untuk mengakses model AI terbaru yang dihosting di Vertex AI.
Mulai menggunakan Cloud SQL untuk aplikasi AI generatif
Untuk mulai membuat aplikasi AI generatif, gunakan aplikasi contoh ini. Aplikasi ini menggunakan Cloud SQL, Vertex AI, dan Google Kubernetes Engine (GKE) atau Cloud Run. Anda dapat menggunakan aplikasi untuk membuat API chatbot dasar yang:
- Mengintegrasikan GKE atau Cloud Run dengan Cloud SQL, Vertex AI, dan
pgvector
- Mendemonstrasikan konektivitas ke Cloud SQL menggunakan Private Service Connect di Virtual Private Cloud (VPC)
- Menggunakan Terraform untuk mengonfigurasi infrastruktur Anda
- Menggunakan Python dengan
asyncpg
danFastAPI
- Mendukung penyiapan Cloud SQL dan aplikasi yang berjalan di GKE atau Cloud Run dalam project Google Cloud terpisah
Solusi ini berisi konten berikut:
- Template Terraform untuk menyiapkan infrastruktur Anda dengan praktik terbaik untuk keamanan
- Aplikasi contoh untuk Chatbot yang didukung LLM yang dapat Anda deploy ke GKE atau Cloud Run