Memilih infrastruktur untuk aplikasi AI generatif Anda

Pelajari produk, framework, dan alat yang paling cocok untuk membangun aplikasi AI generatif Anda. Komponen umum dalam aplikasi AI generatif yang dihosting di Cloud meliputi:

  1. Hosting aplikasi: Menghitung untuk menghosting aplikasi Anda. Aplikasi Anda dapat menggunakan SDK dan library klien Google Cloud untuk berkomunikasi dengan berbagai produk Cloud.
  2. Hosting model: Hosting yang skalabel dan aman untuk model generatif.
  3. Model: Model generatif untuk teks, chat, gambar, kode, embedding, dan multimodal.
  4. Solusi ground: Menghubungkan output model ke sumber informasi terbaru yang dapat diverifikasi.
  5. Database: Menyimpan data aplikasi Anda. Anda dapat menggunakan kembali database yang ada sebagai solusi grounding, dengan meningkatkan prompt menggunakan kueri SQL, atau dengan menyimpan data sebagai embedding vektor menggunakan ekstensi seperti pgvector.
  6. Penyimpanan: Menyimpan file seperti gambar, video, atau frontend web statis. Anda juga dapat menggunakan Storage untuk data grounding mentah (misalnya, PDF) yang nantinya Anda konversi menjadi embeddings dan disimpan dalam database vektor.

Diagram yang menunjukkan ringkasan umum infrastruktur hosting aplikasi AI generatif, termasuk model dan infrastruktur hosting modelnya, solusi grounding, database, penyimpanan, dan hosting aplikasi.

Bagian berikut membahas setiap komponen tersebut, sehingga membantu Anda memilih produk Google Cloud yang akan dicoba.

Infrastruktur hosting aplikasi

Pilih produk untuk menghosting dan menyalurkan beban kerja aplikasi Anda, yang akan melakukan panggilan ke model generatif.

Pohon keputusan yang memandu pengguna dalam memilih layanan yang sesuai untuk hosting aplikasi.

Mulai menggunakan:

Infrastruktur hosting model

Google Cloud menyediakan berbagai cara untuk menghosting model generatif, mulai dari platform Vertex AI unggulan, hingga hosting yang dapat disesuaikan dan portabel di Google Kubernetes Engine.

Pohon keputusan yang memandu pengguna untuk memilih model yang tepat untuk menghosting layanan cloud berdasarkan prioritas dan kebutuhan mereka.

Mulai menggunakan:

Model

Google Cloud menyediakan serangkaian model dasar canggih melalui Vertex AI, termasuk Gemini. Anda juga dapat men-deploy model pihak ketiga ke Vertex AI Model Garden atau menghosting sendiri di GKE, Cloud Run, atau Compute Engine.

Pohon keputusan yang memandu pengguna untuk memilih layanan Vertex AI, untuk menghasilkan teks atau kode, dengan opsi untuk menggunakan embedding teks, gambar, atau video.

Mulai gunakan:

Grounding

Untuk memastikan respons model yang tepat dan akurat, Anda mungkin ingin memberi dasar pada aplikasi AI generatif Anda dengan data real-time. Tindakan ini disebut retrieval-augmented generation (RAG).

Anda dapat menerapkan grounding dengan data Anda sendiri di database vektor, yang merupakan format optimal untuk operasi seperti penelusuran kesamaan. Google Cloud menawarkan beberapa solusi database vektor untuk berbagai kasus penggunaan.

Catatan: Anda juga dapat melakukan grounding menggunakan database tradisional (non-vektor), dengan membuat kueri ke database yang ada seperti Cloud SQL atau Firestore, dan menggunakan hasilnya di perintah model Anda.

Pohon keputusan yang memandu pengguna untuk memilih solusi {i>database<i} vektor yang tepat untuk kebutuhan mereka.

Mulai gunakan:

Dasar-Dasar API

Daripada (atau sebagai tambahan untuk) menggunakan data Anda sendiri untuk grounding, banyak layanan online yang menawarkan API yang dapat Anda gunakan untuk mengambil data grounding guna meningkatkan prompt model Anda.

Ekstensi Vertex AI (Pratinjau Pribadi)

Buat, deploy, dan kelola ekstensi yang menghubungkan model bahasa besar (LLM) ke API sistem eksternal.

Komponen Langchain

Pelajari berbagai loader dokumen dan integrasi API untuk aplikasi AI generatif Anda, mulai dari YouTube hingga Google Cendekia.

Grounding di Vertex AI

Jika menggunakan model yang dihosting di Vertex AI, Anda dapat melakukan grounding respons model menggunakan Vertex AI Search, Google Penelusuran, atau teks inline/infile.

Mulai membuat aplikasi

Menyiapkan lingkungan pengembangan Anda untuk Google Cloud

Siapkan LangChain

LangChain adalah framework open source untuk aplikasi AI generatif yang memungkinkan Anda membangun konteks ke dalam perintah dan mengambil tindakan berdasarkan respons model.

Melihat contoh kode dan men-deploy aplikasi contoh

Lihat contoh kode untuk kasus penggunaan populer dan deploy contoh aplikasi AI generatif yang aman, efisien, tangguh, berperforma tinggi, dan hemat biaya.