Vertex AI Agent Engine (sebelumnya dikenal sebagai LangChain di Vertex AI atau Vertex AI Reasoning Engine) adalah layanan Google Cloud terkelola sepenuhnya yang memungkinkan developer men-deploy, mengelola, dan menskalakan agen AI dalam produksi. Agent Engine menangani infrastruktur untuk menskalakan agen dalam produksi sehingga Anda dapat berfokus pada pembuatan aplikasi yang cerdas dan berdampak. Vertex AI Agent Engine menawarkan:
Terkelola sepenuhnya: Men-deploy dan menskalakan agen dengan runtime terkelola yang menyediakan fitur keamanan andal, termasuk kepatuhan VPC-SC dan kemampuan pengelolaan menyeluruh yang komprehensif. Dapatkan akses CRUD ke aplikasi multi-agen yang menggunakan Google Cloud Trace (mendukung OpenTelemetry) untuk pemantauan performa dan pelacakan. Untuk mempelajari lebih lanjut, lihat men-deploy agen.
Kualitas dan evaluasi: Pastikan kualitas agen dengan layanan Vertex AI Rapid Evaluation yang terintegrasi.
Pengembangan yang disederhanakan: Agent Engine memisahkan tugas tingkat rendah seperti pengembangan server aplikasi dan konfigurasi autentikasi serta IAM, sehingga Anda dapat berfokus pada kemampuan unik agen, seperti perilaku, alat, dan parameter modelnya. Selain itu, agen Anda dapat menggunakan model dan alat apa pun, seperti panggilan fungsi, di Vertex AI.
Agnostic framework: Nikmati fleksibilitas saat men-deploy agen yang Anda bangun menggunakan framework python yang berbeda, termasuk LangGraph, Langchain, AG2, dan CrewAI. Jika sudah memiliki agen, Anda dapat menyesuaikannya untuk berjalan di Agent Engine menggunakan template kustom di SDK kami. Atau, Anda dapat mengembangkan agen dari awal menggunakan salah satu template khusus framework yang kami sediakan.
Kasus penggunaan
Untuk mempelajari Agent Engine dengan contoh menyeluruh, lihat referensi berikut:
Membuat dan men-deploy di Agent Engine
Catatan: Untuk pengalaman pengembangan dan deployment yang berbasis IDE dan disederhanakan dengan Agent Engine, pertimbangkan agent-starter-pack. Layanan ini menyediakan template siap pakai, UI bawaan untuk eksperimen, serta menyederhanakan deployment, operasi, evaluasi, penyesuaian, dan visibilitas.
Alur kerja untuk membuat agen di Agent Engine adalah:
Langkah | Deskripsi |
---|---|
1. Menyiapkan lingkungan | Siapkan project Google Anda dan instal Vertex AI SDK untuk Python versi terbaru. |
2. Mengembangkan agen | Mengembangkan agen yang dapat di-deploy di Agent Engine. |
3. Men-deploy agen | Deploy agen di runtime yang dikelola Agent Engine. |
4. Menggunakan agen | Buat kueri agen dengan mengirimkan permintaan API. |
5. Mengelola agen yang di-deploy | Mengelola dan menghapus agen yang telah Anda deploy ke Agent Engine. |
Langkah-langkahnya diilustrasikan oleh diagram berikut:
Keamanan perusahaan
Agent Engine mendukung Kontrol Layanan VPC untuk memperkuat keamanan data dan memitigasi risiko pemindahan data yang tidak sah. Saat Kontrol Layanan VPC dikonfigurasi, agen yang di-deploy akan mempertahankan akses aman ke API dan layanan Google, seperti BigQuery API, Cloud SQL Admin API, dan Vertex AI API, sehingga memastikan operasi yang lancar dalam perimeter yang Anda tentukan. Yang terpenting, Kontrol Layanan VPC secara efektif memblokir semua akses internet publik, membatasi pergerakan data ke batas jaringan yang diizinkan, dan secara signifikan meningkatkan postur keamanan perusahaan Anda.
Harga
Harga didasarkan pada resource komputasi (jam vCPU) dan memori (jam GiB) yang digunakan oleh agen yang di-deploy ke runtime yang dikelola Agent Engine.
Produk | ID SKU | Harga |
---|---|---|
vCPU ReasoningEngine | 8A55-0B95-B7DC | $0,0994/vCPU-Jam |
Memori ReasoningEngine | 0B45-6103-6EC1 | $0,0105/GiB-Jam |
Untuk informasi selengkapnya, lihat harga.