AI generatif | Generative AI

Halaman ini diterjemahkan oleh Cloud Translation API.

Memilih model dan infrastruktur untuk aplikasi AI generatif Anda

Pelajari produk, framework, dan alat mana yang paling cocok untuk mem-build aplikasi AI generatif Anda. Gambar berikut menunjukkan komponen umum dalam aplikasi AI generatif yang dihosting di Cloud.

Diagram Venn yang menunjukkan komponen sistem AI generatif

Hosting aplikasi: Komputasi untuk menghosting aplikasi Anda. Aplikasi Anda dapat menggunakan library klien dan SDK Google Cloud untuk berkomunikasi dengan berbagai produk Cloud.
Hosting model: Hosting yang skalabel dan aman untuk model generatif.
Model: Model generatif untuk teks, chat, gambar, kode, penyematan, dan multimodal.
Solusi dasar: Mengaitkan output model ke sumber informasi yang dapat diverifikasi dan diperbarui.
Database: Menyimpan data aplikasi Anda. Anda dapat menggunakan kembali database yang ada sebagai solusi dasar, dengan menambahkan perintah melalui kueri SQL, dan/atau menyimpan data sebagai penyematan vektor menggunakan ekstensi seperti pgvector.
Penyimpanan: Menyimpan file seperti gambar, video, atau frontend web statis. Anda juga dapat menggunakan Storage untuk data grounding mentah (misalnya, PDF) yang nantinya Anda konversi menjadi penyematan dan simpan di database vektor.

Bagian di bawah ini membahas setiap komponen tersebut, yang membantu Anda memilih produk Google Cloud yang akan dicoba.

Infrastruktur hosting aplikasi

Pilih produk untuk menghosting dan menayangkan beban kerja aplikasi Anda, yang melakukan panggilan ke model generatif.

Ingin infrastruktur serverless terkelola?

tutup

centang

Cloud Run

tutup

Dapatkah aplikasi Anda di-containerisasi?

tutup

centang

Kubernetes Engine

tutup

Compute Engine

Infrastruktur hosting model

Google Cloud menyediakan beberapa cara untuk menghosting model generatif, mulai dari platform Vertex AI unggulan, hingga hosting portabel dan yang dapat disesuaikan di Google Kubernetes Engine.

Menggunakan Gemini dan memerlukan fitur perusahaan seperti penskalaan, keamanan, privasi data, dan visibilitas

centang

tutup

Gemini Developer API

centang

Ingin infrastruktur yang terkelola sepenuhnya, dengan alat dan API AI generatif kelas satu?

tutup

centang

Vertex AI

tutup

Apakah model Anda memerlukan kernel khusus, OS lama, atau memiliki persyaratan pemberian lisensi khusus?

tutup

centang

Compute Engine

tutup

Kubernetes Engine

Model

Google Cloud menyediakan kumpulan model dasar canggih melalui Vertex AI , termasuk Gemini. Anda juga dapat men-deploy model pihak ketiga ke Vertex AI Model Garden atau men-hosting sendiri di GKE , Cloud Run, atau Compute Engine.

Membuat kode?

tutup

centang

Codey (Vertex AI)

tutup

Membuat gambar?

tutup

centang

Imagen (Vertex AI)

tutup

Membuat embedding untuk penelusuran, klasifikasi, atau pengelompokan?

tutup

centang

text-embedding (Vertex AI)

tutup

Oke, Anda ingin membuat teks. Apakah Anda ingin menyertakan gambar atau video dalam perintah teks? (multimodal)

tutup

centang

Gemini (Vertex AI)

tutup

Oke, hanya perintah teks. Ingin memanfaatkan model unggulan tercanggih Google?

tutup

centang

Gemini (Vertex AI)

tutup

Men-deploy model open source ke: Vertex AI (Model Garden) GKE (HuggingFace)

Grounding dan RAG

Untuk memastikan respons model yang akurat dan berdasarkan informasi, landaskan aplikasi AI generatif Anda dengan data real-time. Hal ini disebut retrieval-augmented generation (RAG).

Jika Anda ingin membuat konten yang didasarkan pada informasi terbaru dari internet, model Gemini dapat mengevaluasi apakah pengetahuan model sudah memadai atau apakah perlu melakukan grounding dengan Google Penelusuran.

Anda dapat menerapkan perujukan menggunakan indeks data dengan mesin telusur. Banyak mesin telusur kini menyimpan penyematan di database vektor, yang merupakan format optimal untuk operasi seperti penelusuran kemiripan. Google Cloud menawarkan beberapa solusi database vektor, untuk berbagai kasus penggunaan.

Catatan: Anda dapat melakukan grounding menggunakan database non-vektor dengan membuat kueri database yang ada seperti Cloud SQL atau Firestore, dan Anda dapat menggunakan hasil kueri di perintah model.

Apakah Anda menginginkan solusi yang dioptimalkan dan terkelola sepenuhnya yang mendukung sebagian besar sumber data dan mencegah akses langsung ke penyematan yang mendasarinya?

tutup

centang

Vertex AI Search

tutup

Anda sedang membuat mesin telusur untuk RAG

Apakah Anda ingin membuat mesin telusur untuk RAG menggunakan orchestrator terkelola dengan antarmuka seperti LlamaIndex?

tutup

centang

Vertex AI RAG Engine

tutup

Anda dapat menggunakan arsitektur referensi untuk membuat mesin telusur yang disesuaikan dan database vektor untuk kasus penggunaan RAG.

tutup

Apakah Anda memerlukan penelusuran vektor dengan latensi rendah, penayangan berskala besar, atau database vektor khusus dan yang dioptimalkan?

tutup

centang

Vertex AI Vector Search

tutup

Apakah data Anda diakses secara terprogram (OLTP)? Sudah menggunakan database SQL?

tutup

centang

Ingin menggunakan model AI Google langsung dari database Anda? Memerlukan latensi rendah?

centang

tutup

AlloyDB Cloud SQL

tutup

Memiliki set data analisis (OLAP) yang besar? Memerlukan pemrosesan batch, dan akses tabel SQL yang sering dilakukan oleh manusia atau skrip (data science)?

centang

BigQuery

Memahami dasar-dasar API

Daripada (atau sebagai tambahan) menggunakan data Anda sendiri untuk grounding, banyak layanan online menawarkan API yang dapat Anda gunakan untuk mengambil data grounding guna meningkatkan perintah model Anda.

Mulai membuat

Menyiapkan lingkungan pengembangan untuk Google Cloud

Menyiapkan LangChain

LangChain adalah framework open source untuk aplikasi AI generatif yang memungkinkan Anda membuat konteks ke dalam perintah, dan mengambil tindakan berdasarkan respons model.

Melihat contoh kode dan men-deploy aplikasi contoh

Lihat contoh kode untuk kasus penggunaan populer dan deploy contoh aplikasi AI generatif yang aman, efisien, tangguh, berperforma tinggi, dan hemat biaya.

Memilih model dan infrastruktur untuk aplikasi AI generatif Anda

Infrastruktur hosting aplikasi

Infrastruktur hosting model

Model

Grounding dan RAG

Memahami dasar-dasar API

Vertex AI Extensions (Pratinjau Pribadi)

Komponen LangChain

Grounding di Vertex AI

Mulai membuat

Menyiapkan lingkungan pengembangan untuk Google Cloud

Menyiapkan LangChain

Melihat contoh kode dan men-deploy aplikasi contoh