Google Cloud menawarkan berbagai produk dan alat untuk melengkapi siklus proses membangun aplikasi AI generatif.

Pelajari cara membangun aplikasi AI generatif

AI Generatif di Vertex AI

Akses model AI generatif besar dari Google agar Anda dapat menguji, menyesuaikan, dan men-deploy model tersebut untuk digunakan dalam aplikasi yang didukung teknologi AI.

Panduan Memulai Gemini

Lihat bagaimana rasanya mengirim permintaan ke Gemini API melalui platform AI-ML Google Cloud, Vertex AI.

Memilih infrastruktur untuk aplikasi AI generatif Anda

Pilih produk dan alat terbaik untuk kasus penggunaan Anda dan akses dokumentasi yang diperlukan untuk memulai.

Kapan harus menggunakan AI generatif

Identifikasi apakah AI generatif, AI tradisional, atau kombinasi keduanya mungkin sesuai dengan kasus penggunaan bisnis Anda.

Mengembangkan aplikasi AI generatif

Pelajari cara mengatasi tantangan di setiap tahap pengembangan aplikasi AI generatif.

Sampel kode dan aplikasi contoh

Lihat contoh kode untuk kasus penggunaan populer dan deploy contoh aplikasi AI generatif yang aman, efisien, tangguh, berperforma tinggi, dan hemat biaya.

Eksplorasi dan hosting model

Google Cloud menyediakan serangkaian model dasar canggih melalui Vertex AI, termasuk Gemini. Anda juga dapat men-deploy model pihak ketiga ke Vertex AI Model Garden atau menghosting sendiri di GKE atau Compute Engine.

Model Google di Vertex AI (Gemini, Imagen)

Temukan, uji, sesuaikan, dan deploy model dan aset Google dari library model ML.

Model lain di Model Garden Vertex AI

Temukan, uji, sesuaikan, dan deploy model serta aset OSS tertentu dari library model ML.

Model pembuatan teks melalui HuggingFace

Pelajari cara men-deploy model pembuatan teks HuggingFace ke Vertex AI atau Google Kubernetes Engine (GKE).

Orkestrasi AI/ML di GKE

GKE secara efisien mengorkestrasi workload AI/ML, yang mendukung GPU dan TPU untuk pelatihan dan inferensi AI generatif yang skalabel.

GPU di Compute Engine

Lampirkan GPU ke instance VM untuk mempercepat beban kerja AI generatif di Compute Engine.

Desain dan rekayasa perintah

Prompt Design adalah proses pembuatan pasangan perintah dan respons untuk memberikan konteks dan instruksi tambahan kepada model bahasa. Setelah menulis perintah, Anda akan memasukkannya ke model sebagai set data perintah untuk prapelatihan. Saat menayangkan prediksi, model akan merespons dengan petunjuk bawaan Anda.

Vertex AI Studio

Merancang, menguji, dan menyesuaikan perintah Anda yang dikirim ke model bahasa besar (LLM) Gemini dan PaLM 2 di Google.

Ringkasan Strategi Perintah

Pelajari alur kerja rekayasa perintah dan strategi umum yang dapat Anda gunakan untuk memengaruhi respons model.
Lihat contoh perintah dan respons untuk kasus penggunaan tertentu.

Grounding dan RAG

Grounding menghubungkan model AI ke sumber data untuk meningkatkan akurasi respons dan mengurangi halusinasi. RAG, teknik dasar umum, menelusuri informasi yang relevan dan menambahkannya ke perintah model, sehingga memastikan output didasarkan pada fakta dan informasi terbaru.

Pembumian Vertex AI

Anda dapat memberi landasan model Vertex AI dengan Google Penelusuran atau dengan data Anda sendiri yang tersimpan di Vertex AI Search.
Gunakan Perujukan dengan Google Penelusuran untuk menghubungkan model ke pengetahuan terbaru yang tersedia di internet.

Embedding vektor di AlloyDB

Gunakan AlloyDB untuk menghasilkan dan menyimpan embedding vektor, lalu mengindeks dan membuat kueri embeddings menggunakan ekstensi pgvector.

Cloud SQL dan pgvector

Simpan embedding vektor di Postgres SQL, lalu mengindeks dan membuat kueri embeddings menggunakan ekstensi pgvector.

Mengintegrasikan data BigQuery ke aplikasi LangChain

Gunakan LangChain untuk mengekstrak data dari BigQuery serta memperkaya dan mendasarkan respons model Anda.

Embedding vektor di Firestore

Buat embedding vektor dari data Firestore Anda, lalu indeks dan buat kueri embeddings tersebut.

Vector embedding di Memorystore (Redis)

Gunakan LangChain untuk mengekstrak data dari Memorystore dan memperkaya serta memberi landasan pada respons model Anda.

Panggilan agen dan fungsi

Agen memudahkan desain dan mengintegrasikan antarmuka pengguna percakapan ke dalam aplikasi seluler Anda, sementara panggilan fungsi memperluas kemampuan model.

Builder Agen Vertex AI

Manfaatkan model dasar, keahlian penelusuran, dan teknologi AI percakapan Google untuk aplikasi AI generatif tingkat perusahaan.

Panggilan Vertex AI Function

Tambahkan panggilan fungsi ke model Anda untuk mengaktifkan tindakan seperti memesan reservasi berdasarkan informasi kalender yang diekstrak.

Penyesuaian dan pelatihan model

Tugas khusus, seperti melatih model bahasa dengan terminologi tertentu, mungkin memerlukan lebih banyak pelatihan daripada yang dapat Anda lakukan dengan desain prompt atau grounding saja. Dalam skenario tersebut, Anda dapat menggunakan tuning model untuk meningkatkan performa, atau melatih model Anda sendiri.

Mengevaluasi model di Vertex AI

Evaluasi performa model dasar dan model AI generatif Anda yang telah disesuaikan di Vertex AI.

Menyesuaikan model Vertex AI

Model dasar tujuan umum dapat memanfaatkan penyesuaian untuk meningkatkan performanya pada tugas tertentu.

Cloud TPU

TPU adalah ASIC Google yang dikembangkan khusus dan digunakan untuk mempercepat workload machine learning, seperti melatih LLM.

Mulai membuat aplikasi

LangChain adalah framework open source untuk aplikasi AI generatif yang memungkinkan Anda membangun konteks ke dalam perintah, dan mengambil tindakan berdasarkan respons model.
Lihat contoh kode untuk kasus penggunaan populer dan deploy contoh aplikasi AI generatif yang aman, efisien, tangguh, berperforma tinggi, dan hemat biaya.