Membangun aplikasi AI generatif di Google Cloud
Google Cloud menawarkan berbagai produk dan alat untuk membangun aplikasi AI generatif dengan penskalaan, keamanan, dan kemampuan observasi tingkat perusahaan.
Gunakan halaman ini untuk mempelajari tahap pengembangan aplikasi AI generatif, memilih produk dan alat terbaik untuk kasus penggunaan Anda, dan mengakses dokumentasi yang Anda perlukan untuk memulai.
Pelajari dasar-dasar pengembangan AI generatif
Kapan harus menggunakan AI generatif atau AI tradisional
Kecenderungan pengembangan aplikasi AI generatif
Memilih infrastruktur untuk aplikasi AI generatif Anda
Pelajari produk, framework, dan alat yang paling cocok untuk membangun aplikasi AI generatif Anda. Komponen umum dalam aplikasi AI generatif yang dihosting di Cloud meliputi:
- Hosting aplikasi: Komputasi untuk menghosting aplikasi Anda. Aplikasi Anda dapat menggunakan library klien Google Cloud dan SDK untuk berkomunikasi dengan berbagai produk Cloud.
- Hosting model: Hosting yang skalabel dan aman untuk model generatif.
- Model:Model generatif untuk teks, chat, gambar, kode, embedding, dan multimodal.
- Solusi ground: Anchor output model ke sumber informasi yang dapat diverifikasi dan diperbarui.
- Database: Menyimpan data aplikasi Anda. Anda dapat menggunakan kembali database yang ada sebagai solusi landasan, dengan meningkatkan kualitas perintah melalui kueri SQL, dan/atau menyimpan data sebagai embedding vektor menggunakan ekstensi seperti pgvector.
- Penyimpanan: Menyimpan file seperti gambar, video, atau frontend web statis. Anda juga dapat menggunakan Storage untuk data landasan mentah (misalnya, PDF) yang nantinya dikonversi menjadi embedding dan disimpan dalam database vektor.
Bagian di bawah ini membahas setiap komponen tersebut, yang dapat membantu Anda memilih produk Google Cloud yang akan dicoba.
Infrastruktur hosting aplikasi
Mulai gunakan:
Infrastruktur hosting model
Mulai gunakan:
Model
Mulai gunakan:
- Gemini
- Codey
- Imagen
- penyematan teks
- Vertex AI Model Garden (model open source)
- HuggingFace Model Hub (model open source)
Grounding
Untuk memastikan respons model yang tepat dan akurat, sebaiknya dasarkan aplikasi AI generatif Anda dengan data real-time. Opsi ini disebut retrieval-augmentedgeneration (RAG).
Anda dapat menerapkan landasan dengan data Anda sendiri di database vektor, yang merupakan format optimal untuk operasi seperti penelusuran kemiripan. Google Cloud menawarkan beberapa solusi database vektor untuk berbagai kasus penggunaan.
Catatan: Anda juga dapat melakukan ground dengan database tradisional (non-vektor), hanya dengan membuat kueri database yang ada seperti Cloud SQL atau Firestore, dan menggunakan hasilnya dalam perintah model Anda.
Mulai gunakan:
- Vertex AI Search and Conversation (sebelumnya Enterprise Search, Gen AI App Builder, Discovery Engine)
- Vector Search (sebelumnya Matching Engine)
- AlloyDB untuk PostgreSQL
- Cloud SQL
- BigQuery
Grounding dengan API
Ekstensi Vertex AI (Pratinjau Pribadi)
Komponen Langchain
Ketinggian di Vertex AI
Mulai Membuat Aplikasi
Menyiapkan lingkungan pengembangan Anda
Menginstal Google Cloud CLI.
Menginstal ekstensi Cloud Code di IDE Anda
Menyiapkan autentikasi
Menyiapkan LangChain
Mendesain perintah dan mengevaluasi model
Pengantar Prompt Design
Vertex AI Studio
Contoh Perintah AI Generatif
Ideasi dengan Model Generatif di Vertex AI
Evaluasi Model di Vertex AI
Contoh kode
Chatbot web: Menjawab pertanyaan tentang Google Store
Pelajari cara membangun chatbot tanya jawab berbasis web, menggunakan Vertex AI Search and Conversation dan Firebase.
Aplikasi Chat dengan Eventarc dan Vertex AI
Pelajari cara membangun aplikasi Python Flask sederhana yang memanggil model dasar terlatih di Vertex AI.
Buat kampanye pemasaran dengan Gemini
Buat aplikasi web untuk menghasilkan ide kampanye pemasaran, menggunakan Gemini di Vertex AI, Cloud Run, dan Streamlit.
Aplikasi tanya jawab dengan "The Practitioner's Guide to MLOps"
Pelajari cara menggunakan perintah Vertex AI Search dan LangChain ke sumber pengetahuan yang dapat diverifikasi (laporan resmi Google Cloud).
Bantuan Permintaan Weather API: Panggilan fungsi dengan Gemini
Pelajari cara menerapkan panggilan fungsi, yaitu proses penggunaan LLM untuk mengisi isi permintaan yang kemudian dapat Anda kirim ke API eksternal.
Asisten Bandara: Aplikasi Pengambilan Database AI Generatif
Aplikasi contoh untuk pembuatan yang diperluas dengan AlloyDB untuk PostgreSQL dan Vertex AI. (postingan blog, codelab).
Panduan arsitektur dan solusi jump start
Infrastruktur untuk aplikasi AI generatif berkemampuan RAG menggunakan Vertex AI
Gunakan arsitektur referensi ini untuk mendesain infrastruktur guna menjalankan aplikasi AI generatif dengan retrieval-augmented Generation (RAG).
Mendesain penyimpanan untuk workload AI dan ML di Google Cloud
Dokumen ini memberikan panduan desain tentang cara menggunakan dan mengintegrasikan berbagai opsi penyimpanan yang ditawarkan oleh Google Cloud untuk workload AI dan ML utama.
Solusi Langsung: Perangkuman Dokumen
Deploy aplikasi contoh sekali klik untuk meringkas dokumen yang panjang dengan Vertex AI.