Pilih model dan infrastruktur untuk aplikasi AI generatif Anda
Pelajari produk, framework, dan alat mana yang paling cocok untuk mem-build aplikasi AI generatif Anda. Gambar berikut menunjukkan komponen umum dalam aplikasi AI generatif yang dihosting di Cloud.
Diagram Venn yang menunjukkan komponen sistem AI generatif Diagram Venn yang menunjukkan komponen sistem AI generatif
  1. Hosting aplikasi: Komputasi untuk menghosting aplikasi Anda. Aplikasi Anda dapat menggunakan library klien dan SDK Google Cloud untuk berkomunikasi dengan berbagai produk Cloud.

  2. Hosting model: Hosting yang skalabel dan aman untuk model generatif.

  3. Model: Model generatif untuk teks, chat, gambar, kode, penyematan, dan multimodal.

  4. Solusi dasar: Mengaitkan output model ke sumber informasi yang dapat diverifikasi dan diperbarui.

  5. Database: Menyimpan data aplikasi Anda. Anda dapat menggunakan kembali database yang ada sebagai solusi dasar, dengan menambahkan perintah melalui kueri SQL, dan/atau menyimpan data sebagai penyematan vektor menggunakan ekstensi seperti pgvector.

  6. Penyimpanan: Menyimpan file seperti gambar, video, atau frontend web statis. Anda juga dapat menggunakan Storage untuk data grounding mentah (misalnya, PDF) yang nantinya Anda konversi menjadi penyematan dan simpan di database vektor.

Bagian di bawah ini membahas setiap komponen tersebut, yang membantu Anda memilih produk Google Cloud yang akan dicoba.

Infrastruktur hosting aplikasi

Pilih produk untuk menghosting dan menayangkan beban kerja aplikasi Anda, yang melakukan panggilan ke model generatif.

Ingin infrastruktur serverless terkelola?

tutup
centang
Cloud Run
tutup

Dapatkah aplikasi Anda di-containerisasi?

tutup
centang
Kubernetes Engine
tutup

Infrastruktur hosting model

Google Cloud menyediakan beberapa cara untuk menghosting model generatif, mulai dari platform Vertex AI unggulan, hingga hosting portabel dan yang dapat disesuaikan di Google Kubernetes Engine.

Menggunakan Gemini dan memerlukan fitur perusahaan seperti penskalaan, keamanan, privasi data, dan visibilitas

centang
tutup
Gemini Developer API
centang

Ingin infrastruktur yang terkelola sepenuhnya, dengan alat dan API AI generatif kelas satu?

tutup
centang
Vertex AI
tutup

Apakah model Anda memerlukan kernel khusus, OS lama, atau memiliki persyaratan pemberian lisensi khusus?

tutup
centang
Compute Engine
tutup

Model

Google Cloud menyediakan kumpulan model dasar canggih melalui Vertex AI , termasuk Gemini. Anda juga dapat men-deploy model pihak ketiga ke Vertex AI Model Garden atau men-hosting sendiri di GKE , Cloud Run, atau Compute Engine.

Membuat kode?

tutup
centang
Codey (Vertex AI)
tutup

Membuat gambar?

tutup
centang
Imagen (Vertex AI)
tutup

Membuat embedding untuk penelusuran, klasifikasi, atau pengelompokan?

tutup
centang
text-embedding (Vertex AI)
tutup

Oke, Anda ingin membuat teks. Apakah Anda ingin menyertakan gambar atau video dalam perintah teks? (multimodal)

tutup
centang
Gemini (Vertex AI)
tutup

Oke, hanya perintah teks. Ingin memanfaatkan model unggulan tercanggih Google?

tutup
centang
Gemini (Vertex AI)
tutup

Grounding dan RAG

Untuk memastikan respons model yang akurat dan berdasarkan informasi, landaskan aplikasi AI generatif Anda dengan data real-time. Hal ini disebut retrieval-augmented generation (RAG).

Jika Anda ingin membuat konten yang didasarkan pada informasi terbaru dari internet, model Gemini dapat mengevaluasi apakah pengetahuan model sudah memadai atau apakah perlu melakukan grounding dengan Google Penelusuran.

Anda dapat menerapkan perujukan menggunakan indeks data dengan mesin telusur. Banyak mesin telusur kini menyimpan penyematan di database vektor, yang merupakan format optimal untuk operasi seperti penelusuran kemiripan. Google Cloud menawarkan beberapa solusi database vektor, untuk berbagai kasus penggunaan.

Catatan: Anda dapat melakukan grounding menggunakan database non-vektor dengan membuat kueri database yang ada seperti Cloud SQL atau Firestore, dan Anda dapat menggunakan hasil kueri di perintah model.

Apakah Anda menginginkan solusi yang dioptimalkan dan terkelola sepenuhnya yang mendukung sebagian besar sumber data dan mencegah akses langsung ke penyematan yang mendasarinya?

tutup
centang
Vertex AI Search
tutup
Anda sedang membuat mesin telusur untuk RAG

Apakah Anda ingin membuat mesin telusur untuk RAG menggunakan orchestrator terkelola dengan antarmuka seperti LlamaIndex?

tutup
centang
Vertex AI RAG Engine
tutup
Anda dapat menggunakan arsitektur referensi untuk membuat mesin telusur yang disesuaikan dan database vektor untuk kasus penggunaan RAG.
tutup

Apakah Anda memerlukan penelusuran vektor dengan latensi rendah, penayangan berskala besar, atau database vektor khusus dan yang dioptimalkan?

tutup
centang
Vertex AI Vector Search
tutup

Apakah data Anda diakses secara terprogram (OLTP)? Sudah menggunakan database SQL?

tutup
centang

Ingin menggunakan model AI Google langsung dari database Anda? Memerlukan latensi rendah?

centang
tutup
tutup

Memiliki set data analisis (OLAP) yang besar? Memerlukan pemrosesan batch, dan akses tabel SQL yang sering dilakukan oleh manusia atau skrip (data science)?

centang
BigQuery

Memahami dasar-dasar API

Daripada (atau sebagai tambahan) menggunakan data Anda sendiri untuk grounding, banyak layanan online menawarkan API yang dapat Anda gunakan untuk mengambil data grounding guna meningkatkan perintah model Anda.
Buat, deploy, dan kelola ekstensi yang menghubungkan model bahasa besar ke API sistem eksternal.
Pelajari berbagai loader dokumen dan integrasi API untuk aplikasi AI generatif Anda, mulai dari YouTube hingga Google Cendekia.
Jika menggunakan model yang dihosting di Vertex AI, Anda dapat melandasi respons model menggunakan Vertex AI Search, Google Penelusuran, atau teks inline/infile.

Mulai membuat

LangChain adalah framework open source untuk aplikasi AI generatif yang memungkinkan Anda membuat konteks ke dalam perintah, dan mengambil tindakan berdasarkan respons model.

Lihat contoh kode untuk kasus penggunaan populer dan deploy contoh aplikasi AI generatif yang aman, efisien, tangguh, berperforma tinggi, dan hemat biaya.