Memilih infrastruktur untuk aplikasi AI generatif Anda
Pelajari produk, framework, dan alat yang paling cocok untuk membangun aplikasi AI generatif Anda. Komponen umum dalam aplikasi AI generatif yang dihosting di Cloud meliputi:
- Hosting aplikasi: Menghitung untuk menghosting aplikasi Anda. Aplikasi Anda dapat menggunakan SDK dan library klien Google Cloud untuk berkomunikasi dengan berbagai produk Cloud.
- Hosting model: Hosting yang skalabel dan aman untuk model generatif.
- Model: Model generatif untuk teks, chat, gambar, kode, embedding, dan multimodal.
- Solusi ground: Menghubungkan output model ke sumber informasi terbaru yang dapat diverifikasi.
- Database: Menyimpan data aplikasi Anda. Anda dapat menggunakan kembali database yang ada sebagai solusi grounding, dengan meningkatkan prompt menggunakan kueri SQL, atau dengan menyimpan data sebagai embedding vektor menggunakan ekstensi seperti pgvector.
- Penyimpanan: Menyimpan file seperti gambar, video, atau frontend web statis. Anda juga dapat menggunakan Storage untuk data grounding mentah (misalnya, PDF) yang nantinya Anda konversi menjadi embeddings dan disimpan dalam database vektor.
Bagian berikut membahas setiap komponen tersebut, sehingga membantu Anda memilih produk Google Cloud yang akan dicoba.
Infrastruktur hosting aplikasi
Pilih produk untuk menghosting dan menyalurkan beban kerja aplikasi Anda, yang akan melakukan panggilan ke model generatif.
Mulai menggunakan:
Infrastruktur hosting model
Google Cloud menyediakan berbagai cara untuk menghosting model generatif, mulai dari platform Vertex AI unggulan, hingga hosting yang dapat disesuaikan dan portabel di Google Kubernetes Engine.
Mulai menggunakan:
Model
Google Cloud menyediakan serangkaian model dasar canggih melalui Vertex AI, termasuk Gemini. Anda juga dapat men-deploy model pihak ketiga ke Vertex AI Model Garden atau menghosting sendiri di GKE, Cloud Run, atau Compute Engine.
Mulai gunakan:
- Gemini
- Codey
- Gambar
- text-embedding
- Vertex AI Model Garden (model open source)
- Hugging Face Model Hub (model open source)
Grounding
Untuk memastikan respons model yang tepat dan akurat, Anda mungkin ingin memberi dasar pada aplikasi AI generatif Anda dengan data real-time. Tindakan ini disebut retrieval-augmented generation (RAG).
Anda dapat menerapkan grounding dengan data Anda sendiri di database vektor, yang merupakan format optimal untuk operasi seperti penelusuran kesamaan. Google Cloud menawarkan beberapa solusi database vektor untuk berbagai kasus penggunaan.
Catatan: Anda juga dapat melakukan grounding menggunakan database tradisional (non-vektor), dengan membuat kueri ke database yang ada seperti Cloud SQL atau Firestore, dan menggunakan hasilnya di perintah model Anda.
Mulai gunakan:
- Vertex AI Agent Builder (sebelumnya Enterprise Search, Gen AI App Builder, Discovery Engine)
- Vector Search (sebelumnya Matching Engine)
- AlloyDB untuk PostgreSQL
- Cloud SQL
- BigQuery
Dasar-Dasar API
Daripada (atau sebagai tambahan untuk) menggunakan data Anda sendiri untuk grounding, banyak layanan online yang menawarkan API yang dapat Anda gunakan untuk mengambil data grounding guna meningkatkan prompt model Anda.
Ekstensi Vertex AI (Pratinjau Pribadi)
Buat, deploy, dan kelola ekstensi yang menghubungkan model bahasa besar (LLM) ke API sistem eksternal.
Komponen Langchain
Pelajari berbagai loader dokumen dan integrasi API untuk aplikasi AI generatif Anda, mulai dari YouTube hingga Google Cendekia.
Grounding di Vertex AI
Jika menggunakan model yang dihosting di Vertex AI, Anda dapat melakukan grounding respons model menggunakan Vertex AI Search, Google Penelusuran, atau teks inline/infile.
Mulai membuat aplikasi
Menyiapkan lingkungan pengembangan Anda untuk Google Cloud
Siapkan LangChain
LangChain adalah framework open source untuk aplikasi AI generatif yang memungkinkan Anda membangun konteks ke dalam perintah dan mengambil tindakan berdasarkan respons model.
Melihat contoh kode dan men-deploy aplikasi contoh
Lihat contoh kode untuk kasus penggunaan populer dan deploy contoh aplikasi AI generatif yang aman, efisien, tangguh, berperforma tinggi, dan hemat biaya.