Google Cloud menawarkan berbagai produk dan alat untuk membangun aplikasi AI generatif dengan penskalaan, keamanan, dan kemampuan observasi tingkat perusahaan.

Gunakan halaman ini untuk mempelajari tahap pengembangan aplikasi AI generatif, memilih produk dan alat terbaik untuk kasus penggunaan Anda, dan mengakses dokumentasi yang Anda perlukan untuk memulai.

Pelajari dasar-dasar pengembangan AI generatif

Pelajari cara mengembangkan aplikasi AI generatif.
Pelajari kasus penggunaan dan jenis model AI generatif yang umum.
Identifikasi apakah AI generatif, AI tradisional, atau kombinasi keduanya mungkin sesuai dengan kasus penggunaan bisnis Anda.
Pelajari cara mengatasi tantangan di setiap tahap pengembangan aplikasi AI generatif.

Memilih infrastruktur untuk aplikasi AI generatif Anda

Pelajari produk, framework, dan alat yang paling cocok untuk membangun aplikasi AI generatif Anda. Komponen umum dalam aplikasi AI generatif yang dihosting di Cloud meliputi:

  1. Hosting aplikasi: Komputasi untuk menghosting aplikasi Anda. Aplikasi Anda dapat menggunakan library klien Google Cloud dan SDK untuk berkomunikasi dengan berbagai produk Cloud.
  2. Hosting model: Hosting yang skalabel dan aman untuk model generatif.
  3. Model:Model generatif untuk teks, chat, gambar, kode, embedding, dan multimodal.
  4. Solusi ground: Anchor output model ke sumber informasi yang dapat diverifikasi dan diperbarui.
  5. Database: Menyimpan data aplikasi Anda. Anda dapat menggunakan kembali database yang ada sebagai solusi landasan, dengan meningkatkan kualitas perintah melalui kueri SQL, dan/atau menyimpan data sebagai embedding vektor menggunakan ekstensi seperti pgvector.
  6. Penyimpanan: Menyimpan file seperti gambar, video, atau frontend web statis. Anda juga dapat menggunakan Storage untuk data landasan mentah (misalnya, PDF) yang nantinya dikonversi menjadi embedding dan disimpan dalam database vektor.

Diagram yang menunjukkan ringkasan tingkat tinggi dari infrastruktur hosting aplikasi AI generatif, termasuk model dan infrastruktur hosting modelnya, solusi ground, database, penyimpanan, dan hosting aplikasi.

Bagian di bawah ini membahas setiap komponen tersebut, yang dapat membantu Anda memilih produk Google Cloud yang akan dicoba.

Infrastruktur hosting aplikasi

Pilih produk untuk menghosting dan melayani beban kerja aplikasi Anda, yang melakukan panggilan ke model generatif.
Pohon keputusan memandu pengguna dalam memilih layanan yang sesuai untuk hosting aplikasi.

Mulai gunakan:

Infrastruktur hosting model

Google Cloud menyediakan banyak cara untuk menghosting model generatif, mulai dari platform Vertex AI unggulan, hingga hosting yang dapat disesuaikan dan portabel di Google Kubernetes Engine.

Pohon keputusan memandu pengguna untuk memilih model layanan cloud hosting yang tepat berdasarkan prioritas dan persyaratan mereka.

Mulai gunakan:

Model

Google Cloud menyediakan serangkaian model dasar yang canggih melalui Vertex AI, termasuk Gemini. Anda juga dapat men-deploy model pihak ketiga ke Vertex AI Model Garden atau host mandiri di GKE, Cloud Run, atau Compute Engine.

Pohon keputusan yang memandu pengguna untuk memilih layanan Vertex AI, untuk menghasilkan teks atau kode, dengan opsi untuk menggunakan embedding teks, gambar, atau video.

Mulai gunakan:

Grounding

Untuk memastikan respons model yang tepat dan akurat, sebaiknya dasarkan aplikasi AI generatif Anda dengan data real-time. Opsi ini disebut retrieval-augmentedgeneration (RAG).

Anda dapat menerapkan landasan dengan data Anda sendiri di database vektor, yang merupakan format optimal untuk operasi seperti penelusuran kemiripan. Google Cloud menawarkan beberapa solusi database vektor untuk berbagai kasus penggunaan.

Catatan: Anda juga dapat melakukan ground dengan database tradisional (non-vektor), hanya dengan membuat kueri database yang ada seperti Cloud SQL atau Firestore, dan menggunakan hasilnya dalam perintah model Anda.

Pohon keputusan yang memandu pengguna melalui pemilihan solusi database vektor yang tepat untuk kebutuhan mereka.

Mulai gunakan:

Grounding dengan API

Daripada (atau sebagai tambahan) menggunakan data Anda sendiri untuk landasan, banyak layanan online menawarkan API yang dapat digunakan untuk mengambil data landasan guna meningkatkan perintah model Anda.
Buat, deploy, dan kelola ekstensi yang menghubungkan model bahasa besar ke API sistem eksternal.
Pelajari berbagai pemuat dokumen dan integrasi API untuk aplikasi AI generatif Anda, mulai dari YouTube hingga Google Cendekia.
Jika menggunakan model yang dihosting di Vertex AI, Anda dapat mendasarkan respons model menggunakan Vertex AI Search, Google Penelusuran, atau teks inline/infile.

Mulai Membuat Aplikasi

Menyiapkan lingkungan pengembangan Anda

Instal alat yang Anda perlukan untuk membangun aplikasi AI generatif di Google Cloud.
Alat command line untuk menyiapkan lingkungan pengembangan lokal dan untuk berinteraksi dengan Cloud API.
Lihat dokumentasi dan sampel API di IDE Anda, serta percepat pengembangan lokal GKE dan Cloud Run.
Pelajari cara melakukan autentikasi ke Google Cloud API dari lingkungan lokal Anda dan dari workload yang dihosting.
LangChain adalah framework open source untuk aplikasi AI generatif yang memungkinkan Anda membangun konteks ke dalam perintah Anda, dan mengambil tindakan berdasarkan respons model.

Mendesain perintah dan mengevaluasi model

Pelajari strategi untuk memberikan perintah, dan bereksperimen dengan berbagai model.
Pelajari strategi untuk mendesain prompt untuk berbagai jenis data, mulai dari teks dan kode hingga multimodal.
Pelajari cara mendesain, menguji, dan mengelola prompt Anda di Vertex AI Studio.
Lihat lusinan contoh perintah yang mencakup kasus penggunaan termasuk klasifikasi, pembentukan ide, dan perangkuman.
Menjelajahi contoh petunjuk untuk menghasilkan, mengembangkan, dan mengomunikasikan ide-ide baru.

Contoh kode

Lakukan fork contoh di GitHub, dan mulai membangun.

Pelajari cara membangun chatbot tanya jawab berbasis web, menggunakan Vertex AI Search and Conversation dan Firebase.

Pemula Node.js

Pelajari cara membangun aplikasi Python Flask sederhana yang memanggil model dasar terlatih di Vertex AI.

Pemula Python

Buat aplikasi web untuk menghasilkan ide kampanye pemasaran, menggunakan Gemini di Vertex AI, Cloud Run, dan Streamlit.

Pemula Python

Pelajari cara menggunakan perintah Vertex AI Search dan LangChain ke sumber pengetahuan yang dapat diverifikasi (laporan resmi Google Cloud).

Menengah Python

Pelajari cara menerapkan panggilan fungsi, yaitu proses penggunaan LLM untuk mengisi isi permintaan yang kemudian dapat Anda kirim ke API eksternal.

Menengah Python

Aplikasi contoh untuk pembuatan yang diperluas dengan AlloyDB untuk PostgreSQL dan Vertex AI. (postingan blog, codelab).

Menengah Python

Panduan arsitektur dan solusi jump start

Rekomendasi dan contoh aplikasi AI generatif yang aman, efisien, tangguh, berperforma tinggi, dan hemat biaya.

Gunakan arsitektur referensi ini untuk mendesain infrastruktur guna menjalankan aplikasi AI generatif dengan retrieval-augmented Generation (RAG).

Menengah

Dokumen ini memberikan panduan desain tentang cara menggunakan dan mengintegrasikan berbagai opsi penyimpanan yang ditawarkan oleh Google Cloud untuk workload AI dan ML utama.

Lanjutan

Deploy aplikasi contoh sekali klik untuk meringkas dokumen yang panjang dengan Vertex AI.

Menengah