Last reviewed 2025-09-22 UTC
Berikut adalah daftar arsitektur referensi untuk men-deploy aplikasi AI generatif dengan retrieval-augmented generation (RAG) di Google Cloud.
Arsitektur referensi | Deskripsi |
---|---|
Infrastruktur RAG untuk AI generatif menggunakan Google Agentspace dan Vertex AI | Arsitektur berbasis agen yang menggunakan Google Agentspace sebagai platform terpadu untuk mengatur alur data RAG end-to-end untuk aplikasi perusahaan yang memerlukan ketersediaan data real-time dan penelusuran kontekstual yang lebih baik. |
Infrastruktur RAG untuk AI generatif menggunakan Vertex AI dan Penelusuran Vektor. | Arsitektur serverless yang terkelola sepenuhnya yang menyediakan penelusuran vektor berperforma tinggi dan dioptimalkan untuk aplikasi skala besar. |
Infrastruktur RAG untuk AI generatif menggunakan Vertex AI dan AlloyDB untuk PostgreSQL. | Arsitektur database terkelola sepenuhnya yang menyimpan sematan vektor bersama data operasional Anda dalam database terkelola sepenuhnya seperti Cloud SQL atau AlloyDB untuk PostgreSQL. |
Infrastruktur RAG untuk AI generatif menggunakan GKE dan Cloud SQL | Arsitektur berbasis container yang fleksibel dan memberikan kontrol maksimum untuk membangun aplikasi kustom dengan alat open source seperti Ray, Hugging Face, dan LangChain. |
Infrastruktur GraphRAG untuk AI generatif menggunakan Vertex AI dan Spanner Graph | Arsitektur RAG canggih yang menggabungkan penelusuran vektor dengan kueri grafik pengetahuan untuk mengambil data kontekstual yang saling terhubung, sehingga menghasilkan respons AI generatif yang lebih mendetail dan relevan. |