Pilih model dan infrastruktur untuk aplikasi AI generatif Anda
![Diagram Venn yang menunjukkan komponen sistem AI generatif](https://cloud.google.com/static/docs/generative-ai/choose-models-infra-for-ai/venn-diagram.png?authuser=4&hl=id)
![Diagram Venn yang menunjukkan komponen sistem AI generatif](https://cloud.google.com/static/docs/generative-ai/choose-models-infra-for-ai/venn-diagram-mobile.png?authuser=4&hl=id)
Hosting aplikasi: Komputasi untuk menghosting aplikasi Anda. Aplikasi Anda dapat menggunakan library klien dan SDK Google Cloud untuk berkomunikasi dengan berbagai produk Cloud.
Hosting model: Hosting yang skalabel dan aman untuk model generatif.
Model: Model generatif untuk teks, chat, gambar, kode, penyematan, dan multimodal.
Solusi dasar: Mengaitkan output model ke sumber informasi yang dapat diverifikasi dan diperbarui.
Database: Menyimpan data aplikasi Anda. Anda dapat menggunakan kembali database yang ada sebagai solusi dasar, dengan menambahkan perintah melalui kueri SQL, dan/atau menyimpan data sebagai penyematan vektor menggunakan ekstensi seperti pgvector.
Penyimpanan: Menyimpan file seperti gambar, video, atau frontend web statis. Anda juga dapat menggunakan Storage untuk data grounding mentah (misalnya, PDF) yang nantinya Anda konversi menjadi penyematan dan simpan di database vektor.
Bagian di bawah ini membahas setiap komponen tersebut, yang membantu Anda memilih produk Google Cloud yang akan dicoba.
Infrastruktur hosting aplikasi
Pilih produk untuk menghosting dan menayangkan beban kerja aplikasi Anda, yang melakukan panggilan ke model generatif.
Infrastruktur hosting model
Google Cloud menyediakan beberapa cara untuk menghosting model generatif, mulai dari platform Vertex AI unggulan, hingga hosting portabel dan yang dapat disesuaikan di Google Kubernetes Engine.
Menggunakan Gemini dan memerlukan fitur perusahaan seperti penskalaan, keamanan, privasi data, dan visibilitas
Ingin infrastruktur yang terkelola sepenuhnya, dengan alat dan API AI generatif kelas satu?
Apakah model Anda memerlukan kernel khusus, OS lama, atau memiliki persyaratan pemberian lisensi khusus?
Model
Google Cloud menyediakan kumpulan model dasar canggih melalui Vertex AI , termasuk Gemini. Anda juga dapat men-deploy model pihak ketiga ke Vertex AI Model Garden atau men-hosting sendiri di GKE , Cloud Run, atau Compute Engine.
Membuat embedding untuk penelusuran, klasifikasi, atau pengelompokan?
Oke, Anda ingin membuat teks. Apakah Anda ingin menyertakan gambar atau video dalam perintah teks? (multimodal)
Oke, hanya perintah teks. Ingin memanfaatkan model unggulan tercanggih Google?
Men-deploy model open source ke: Vertex AI (Model Garden) GKE (HuggingFace)
Grounding dan RAG
Untuk memastikan respons model yang akurat dan berdasarkan informasi, landaskan aplikasi AI generatif Anda dengan data real-time. Hal ini disebut retrieval-augmented generation (RAG).
Jika Anda ingin membuat konten yang didasarkan pada informasi terbaru dari internet, model Gemini dapat mengevaluasi apakah pengetahuan model sudah memadai atau apakah perlu melakukan grounding dengan Google Penelusuran.
Anda dapat menerapkan perujukan menggunakan indeks data dengan mesin telusur. Banyak mesin telusur kini menyimpan penyematan di database vektor, yang merupakan format optimal untuk operasi seperti penelusuran kemiripan. Google Cloud menawarkan beberapa solusi database vektor, untuk berbagai kasus penggunaan.
Catatan: Anda dapat melakukan grounding menggunakan database non-vektor dengan membuat kueri database yang ada seperti Cloud SQL atau Firestore, dan Anda dapat menggunakan hasil kueri di perintah model.
Apakah Anda menginginkan solusi yang dioptimalkan dan terkelola sepenuhnya yang mendukung sebagian besar sumber data dan mencegah akses langsung ke penyematan yang mendasarinya?
Apakah Anda ingin membuat mesin telusur untuk RAG menggunakan orchestrator terkelola dengan antarmuka seperti LlamaIndex?
Apakah Anda memerlukan penelusuran vektor dengan latensi rendah, penayangan berskala besar, atau database vektor khusus dan yang dioptimalkan?
Apakah data Anda diakses secara terprogram (OLTP)? Sudah menggunakan database SQL?
Ingin menggunakan model AI Google langsung dari database Anda? Memerlukan latensi rendah?
Memahami dasar-dasar API
Vertex AI Extensions (Pratinjau Pribadi)
Komponen LangChain
Grounding di Vertex AI
Mulai membuat
Menyiapkan lingkungan pengembangan untuk Google Cloud
Menyiapkan LangChain
LangChain adalah framework open source untuk aplikasi AI generatif yang memungkinkan Anda membuat konteks ke dalam perintah, dan mengambil tindakan berdasarkan respons model.
Melihat contoh kode dan men-deploy aplikasi contoh
Lihat contoh kode untuk kasus penggunaan populer dan deploy contoh aplikasi AI generatif yang aman, efisien, tangguh, berperforma tinggi, dan hemat biaya.