Pilih model dan infrastruktur untuk aplikasi AI generatif Anda
Hosting aplikasi: Komputasi untuk menghosting aplikasi Anda. Aplikasi Anda dapat menggunakan library klien dan SDK Google Cloud untuk berkomunikasi dengan berbagai produk Cloud.
Hosting model: Hosting yang skalabel dan aman untuk model generatif.
Model: Model generatif untuk teks, chat, gambar, kode, penyematan, dan multimodal.
Solusi dasar: Mengaitkan output model ke sumber informasi yang dapat diverifikasi dan diperbarui.
Database: Menyimpan data aplikasi Anda. Anda dapat menggunakan kembali database yang ada sebagai solusi dasar, dengan menambahkan perintah melalui kueri SQL, dan/atau menyimpan data sebagai penyematan vektor menggunakan ekstensi seperti pgvector.
Penyimpanan: Menyimpan file seperti gambar, video, atau frontend web statis. Anda juga dapat menggunakan Storage untuk data grounding mentah (misalnya, PDF) yang nantinya Anda konversi menjadi penyematan dan simpan di database vektor.
Bagian di bawah ini membahas setiap komponen tersebut, yang membantu Anda memilih produk Google Cloud yang akan dicoba.
Infrastruktur hosting aplikasi
Pilih produk untuk menghosting dan menayangkan beban kerja aplikasi Anda, yang melakukan panggilan ke model generatif.
Infrastruktur hosting model
Google Cloud menyediakan beberapa cara untuk menghosting model generatif, mulai dari platform Vertex AI unggulan, hingga hosting portabel dan yang dapat disesuaikan di Google Kubernetes Engine.
Menggunakan Gemini dan memerlukan fitur perusahaan seperti penskalaan, keamanan, privasi data, dan visibilitas
Ingin infrastruktur yang terkelola sepenuhnya, dengan alat dan API AI generatif kelas satu?
Apakah model Anda memerlukan kernel khusus, OS lama, atau memiliki persyaratan pemberian lisensi khusus?
Model
Google Cloud menyediakan kumpulan model dasar canggih melalui Vertex AI , termasuk Gemini. Anda juga dapat men-deploy model pihak ketiga ke Vertex AI Model Garden atau men-hosting sendiri di GKE , Cloud Run, atau Compute Engine.
Membuat embedding untuk penelusuran, klasifikasi, atau pengelompokan?
Oke, Anda ingin membuat teks. Apakah Anda ingin menyertakan gambar atau video dalam perintah teks? (multimodal)
Oke, hanya perintah teks. Ingin memanfaatkan model unggulan tercanggih Google?
Men-deploy model open source ke: Vertex AI (Model Garden) GKE (HuggingFace)
Grounding
Untuk memastikan respons model yang akurat dan informatif, sebaiknya landaskan aplikasi AI generatif Anda dengan data real-time. Hal ini disebut retrieval-augmented generation (RAG).
Anda dapat menerapkan grounding dengan data Anda sendiri di database vektor, yang merupakan format optimal untuk operasi seperti penelusuran kemiripan. Google Cloud menawarkan beberapa solusi database vektor, untuk berbagai kasus penggunaan.
Catatan: Anda juga dapat melakukan grounding dengan database tradisional (non-vektor), cukup dengan membuat kueri database yang ada seperti Cloud SQL atau Firestore, dan menggunakan hasilnya di perintah model Anda.
Ingin solusi sederhana, tanpa akses ke penyematan yang mendasarinya?
Apakah Anda memerlukan penelusuran vektor latensi rendah, penayangan berskala besar, atau ingin menggunakan DB vektor khusus?
Apakah data Anda diakses secara terprogram (OLTP)? Sudah menggunakan database SQL?
Ingin menggunakan model AI Google langsung dari database Anda? Memerlukan latensi rendah?
Memiliki set data analisis (OLAP) yang besar? Memerlukan pemrosesan batch, dan akses tabel SQL yang sering dilakukan oleh manusia atau skrip (data science)?
Dasar-Dasar API
Vertex AI Extensions (Pratinjau Pribadi)
Komponen LangChain
Grounding di Vertex AI
Mulai membuat
Menyiapkan lingkungan pengembangan untuk Google Cloud
Menyiapkan LangChain
LangChain adalah framework open source untuk aplikasi AI generatif yang memungkinkan Anda membuat konteks ke dalam perintah, dan mengambil tindakan berdasarkan respons model.
Melihat contoh kode dan men-deploy aplikasi contoh
Lihat contoh kode untuk kasus penggunaan populer dan deploy contoh aplikasi AI generatif yang aman, efisien, tangguh, berperforma tinggi, dan hemat biaya.