Pilih model dan infrastruktur untuk aplikasi AI generatif Anda

Pelajari produk, framework, dan alat mana yang paling cocok untuk membuat aplikasi AI generatif Anda. Gambar berikut menunjukkan komponen umum dalam aplikasi AI generatif yang dihosting di Cloud.
Diagram Venn yang menunjukkan komponen sistem AI generatif Diagram Venn yang menunjukkan komponen sistem AI generatif
  1. Hosting aplikasi: Komputasi untuk menghosting aplikasi Anda. Aplikasi Anda dapat menggunakan library klien dan SDK Google Cloud untuk berkomunikasi dengan berbagai produk Cloud.

  2. Hosting model: Hosting yang skalabel dan aman untuk model generatif.

  3. Model: Model generatif untuk teks, chat, gambar, kode, penyematan, dan multimodal.

  4. Solusi dasar: Mengaitkan output model ke sumber informasi yang dapat diverifikasi dan diperbarui.

  5. Database: Menyimpan data aplikasi Anda. Anda dapat menggunakan kembali database yang ada sebagai solusi dasar, dengan menambahkan perintah melalui kueri SQL, dan/atau menyimpan data sebagai penyematan vektor menggunakan ekstensi seperti pgvector.

  6. Penyimpanan: Menyimpan file seperti gambar, video, atau frontend web statis. Anda juga dapat menggunakan Storage untuk data grounding mentah (misalnya, PDF) yang nantinya Anda konversi menjadi penyematan dan simpan di database vektor.

Bagian di bawah ini membahas setiap komponen tersebut, yang membantu Anda memilih produk Google Cloud yang akan dicoba.

Infrastruktur hosting aplikasi

Pilih produk untuk menghosting dan menayangkan beban kerja aplikasi Anda, yang melakukan panggilan ke model generatif.

Ingin infrastruktur serverless terkelola?

tutup
centang
Cloud Run
tutup

Dapatkah aplikasi Anda di-containerisasi?

tutup
centang
Kubernetes Engine
tutup

Infrastruktur hosting model

Google Cloud menyediakan beberapa cara untuk menghosting model generatif, mulai dari platform Vertex AI unggulan, hingga hosting portabel dan yang dapat disesuaikan di Google Kubernetes Engine.

Menggunakan Gemini dan memerlukan fitur perusahaan seperti penskalaan, keamanan, privasi data, dan visibilitas

centang
tutup
Gemini Developer API
centang

Ingin infrastruktur yang terkelola sepenuhnya, dengan alat dan API AI generatif kelas satu?

tutup
centang
Vertex AI
tutup

Apakah model Anda memerlukan kernel khusus, OS lama, atau memiliki persyaratan pemberian lisensi khusus?

tutup
centang
Compute Engine
tutup

Model

Google Cloud menyediakan kumpulan model dasar canggih melalui Vertex AI , termasuk Gemini. Anda juga dapat men-deploy model pihak ketiga ke Vertex AI Model Garden atau men-hosting sendiri di GKE , Cloud Run, atau Compute Engine.

Membuat kode?

tutup
centang
Codey (Vertex AI)
tutup

Membuat gambar?

tutup
centang
Imagen (Vertex AI)
tutup

Membuat embedding untuk penelusuran, klasifikasi, atau pengelompokan?

tutup
centang
text-embedding (Vertex AI)
tutup

Oke, Anda ingin membuat teks. Apakah Anda ingin menyertakan gambar atau video dalam perintah teks? (multimodal)

tutup
centang
Gemini (Vertex AI)
tutup

Oke, hanya perintah teks. Ingin memanfaatkan model unggulan tercanggih Google?

tutup
centang
Gemini (Vertex AI)
tutup

Grounding

Untuk memastikan respons model yang akurat dan berdasarkan informasi, sebaiknya landaskan aplikasi AI generatif Anda dengan data real-time. Hal ini disebut retrieval-augmented generation (RAG).

Anda dapat menerapkan grounding dengan data Anda sendiri di database vektor, yang merupakan format optimal untuk operasi seperti penelusuran kemiripan. Google Cloud menawarkan beberapa solusi database vektor, untuk berbagai kasus penggunaan.

Catatan: Anda juga dapat melakukan grounding dengan database tradisional (non-vektor), cukup dengan membuat kueri database yang ada seperti Cloud SQL atau Firestore, dan menggunakan hasilnya di perintah model Anda.

Ingin solusi sederhana, tanpa akses ke penyematan yang mendasarinya?

tutup
centang
Vertex AI Search & Conversation
tutup

Apakah Anda memerlukan penelusuran vektor latensi rendah, penayangan berskala besar, atau ingin menggunakan DB vektor khusus?

tutup
centang
Vertex AI Vector Search
tutup

Apakah data Anda diakses secara terprogram (OLTP)? Sudah menggunakan database SQL?

tutup
centang

Ingin menggunakan model AI Google langsung dari database Anda? Memerlukan latensi rendah?

centang
tutup
tutup

Memiliki set data analisis (OLAP) dalam jumlah besar? Memerlukan pemrosesan batch, dan akses tabel SQL yang sering dilakukan oleh manusia atau skrip (data science)?

centang
BigQuery

Dasar-Dasar API

Daripada (atau sebagai tambahan) menggunakan data Anda sendiri untuk grounding, banyak layanan online menawarkan API yang dapat Anda gunakan untuk mengambil data grounding guna meningkatkan perintah model Anda.
Buat, deploy, dan kelola ekstensi yang menghubungkan model bahasa besar ke API sistem eksternal.
Pelajari berbagai loader dokumen dan integrasi API untuk aplikasi AI generatif Anda, mulai dari YouTube hingga Google Cendekia.
Jika menggunakan model yang dihosting di Vertex AI, Anda dapat melandasi respons model menggunakan Vertex AI Search, Google Penelusuran, atau teks inline/infile.

Mulai membuat

LangChain adalah framework open source untuk aplikasi AI generatif yang memungkinkan Anda membuat konteks ke dalam perintah, dan mengambil tindakan berdasarkan respons model.

Lihat contoh kode untuk kasus penggunaan populer dan deploy contoh aplikasi AI generatif yang aman, efisien, tangguh, berperforma tinggi, dan hemat biaya.