Konsep inti agen AI
Agen AI telah berevolusi dari chatbot pasif menjadi sistem otonom yang mampu melakukan penalaran, menggunakan alat perusahaan, dan mengeksekusi alur kerja yang kompleks.
Untuk memanfaatkan potensi besar agen tersebut—dan beralih dari kasus penggunaan dan prototipe eksperimental ke sistem yang tangguh dan berkelas perusahaan yang mendorong ROI terukur—ada baiknya untuk memahami elemen-elemen penyusunnya. Di sini, kami menguraikan konsep inti agen AI, termasuk:
Model
Anggap model sebagai otak agen Anda. Model ini membaca dan memahami permintaan Anda, mencari tahu apa yang perlu dilakukan, dan menghasilkan respons cerdas.
Memilih model yang tepat adalah masalah menyeimbangkan kemampuan, kecepatan, dan biaya untuk kasus penggunaan Anda. Tujuannya bukan untuk memaksimalkan daya mentah, tetapi untuk mengoptimalkan efisiensi. Kesalahan paling umum adalah berinvestasi berlebihan dalam kemampuan yang tidak diperlukan oleh kasus penggunaan, sehingga menyebabkan pengeluaran yang tidak efisien dan performa yang lebih lambat.
Arsitektur kognitif yang tangguh menggunakan beberapa agen khusus yang secara dinamis memilih model paling efisien untuk sub-tugas tertentu. Hal ini seperti memiliki tim spesialis yang siap membantu—dengan pekerjaan yang secara cerdas diarahkan ke spesialis yang berbeda bergantung pada tugasnya. Misalnya, model yang canggih dicadangkan untuk tugas berat seperti perencanaan dan penalaran yang kompleks, sedangkan tugas yang lebih sederhana dan bervolume tinggi seperti mengklasifikasikan niat pengguna akan dialihkan ke model yang lebih cepat dan hemat biaya. Perutean model dinamis ini adalah kunci untuk mengoptimalkan performa dan biaya.
Dengan menawarkan serangkaian model yang luas untuk dipilih, beserta mode penalaran yang dapat dikonfigurasi, developer mendapatkan serangkaian alat dinamis untuk pengoptimalan yang canggih. Semua hal tersebut membantu mereka mengkalibrasi biaya dan performa di seluruh sistem multi-agen untuk memenuhi kebutuhan bisnis dan teknis tertentu.
Setelah memilih model yang sesuai dengan kebutuhan biaya-latensi-kualitas, Anda mungkin memiliki opsi untuk menyempurnakannya. Hal ini mengkhususkan pengetahuan dan gaya untuk kebutuhan bisnis spesifik Anda, dan dilakukan menggunakan set data pilihan dari contoh berkualitas tinggi milik Anda sendiri. Untuk mengetahui apakah suatu model mengizinkan dan mendukung penyesuaian, tinjau dokumentasi dan perjanjian lisensinya.
Pembahasan mendalam: Membangun agen perusahaan
Siap mempraktikkan pemilihan model Anda? Lihat cara menyeimbangkan keamanan, keandalan, dan efisiensi dalam arsitektur kognitif yang tangguh.
Dapatkan panduan teknis untuk membangun sistem multi-agen perusahaan.
Tips pro
Gunakan platform terpusat untuk menemukan, menyesuaikan, dan men-deploy model dasar. Temukan platform yang menawarkan pilihan model terbaik di dunia yang sangat terseleksi, memungkinkan Anda melakukan deployment dengan sekali klik, dan menawarkan keamanan tingkat perusahaan sejak awal.
Grounding
Kredibilitas dan kegunaan agen bergantung pada kemampuannya memberikan jawaban yang akurat dan tepercaya berdasarkan fakta yang dapat diverifikasi. Di sinilah grounding berperan. Gemini mengubah agen menjadi pengotomatis alur kerja yang sesungguhnya yang di-grounding secara mendalam dan akurat pada data bisnis Anda.
Dalam hal grounding, ada tiga lapisan yang perlu dipertimbangkan.
1. RAG: Langkah pertama yang mendasar
Kredibilitas agen bergantung pada kemampuannya memberikan jawaban berdasarkan fakta yang dapat diverifikasi. Retrieval-augmented generation (RAG) menghubungkan agen ke sumber data real-time yang dapat diverifikasi, sehingga memastikan agen bertindak berdasarkan fakta, bukan halusinasi.
Proses pengambilan lalu pembuatan yang sederhana ini dapat diterapkan pada teks, gambar, dan jenis data lainnya. Solusi ini memungkinkan penelusuran set data besar yang sangat cepat, sehingga menghasilkan keputusan yang responsif dan tepat waktu.
Namun, meskipun RAG membantu menjawab pertanyaan, RAG tidak dapat menangani kueri kompleks yang memerlukan pemahaman lebih mendalam tentang hubungan antara titik data.
2. GraphRAG: Grounding yang lebih cerdas
GraphRAG memperkaya grounding dengan memahami hubungan eksplisit antara titik data dalam pustaka pengetahuan, dan mengambil data kontekstual yang lebih mencerminkan interkoneksinya dengan sumber data lain. Jadi, alih-alih hanya mencocokkan frasa yang mirip, agen Anda memahami hubungan antarkonsep.
Yang terpenting, pustaka pengetahuan memberi Anda kontrol langsung atas logika bisnis Anda. Meskipun RAG standar mengandalkan pola yang dihasilkan model, pustaka pengetahuan memungkinkan Anda menentukan dan mengelola hubungan spesifik antarentitas, sehingga memastikan agen mematuhi taksonomi dan aturan unik organisasi Anda. Untuk keandalan maksimum, organisasi terkemuka menggunakan pendekatan hybrid, yakni menggabungkan pengambilan luas dari RAG standar dengan presisi dan kontrol GraphRAG.
Kasus penggunaan
Tampilan data terstruktur dari berbagai sumber
Perusahaan jasa keuangan menggunakan pustaka pengetahuan untuk memberi analis pandangan terpadu tentang laporan analis, telekonferensi pembahasan kinerja finansial, penilaian risiko, dan lainnya. Jaringan data yang lengkap dan saling terhubung ini membantu analis menemukan insight yang sebelumnya tersembunyi, seperti ketergantungan supply chain yang rumit, keanggotaan dewan yang tumpang tindih di antara para pesaing, dan eksposur terhadap risiko geopolitik yang kompleks.
3. RAG Agentic: Penalaran dan pengambilan dinamis
Pendekatan grounding yang paling efektif adalah RAG Agentic, di mana agen tidak lagi menjadi penerima informasi pasif, tetapi peserta aktif yang bernalar dalam proses pengambilan informasi itu sendiri. Dengan RAG Agentic, agen dapat menganalisis kueri kompleks, merumuskan rencana multi-langkah, dan menjalankan beberapa panggilan alat secara berurutan untuk menemukan informasi terbaik. Hal ini bukan pengganti penelusuran tradisional, melainkan menambahkan penalaran lanjutan di atas infrastruktur RAG dan pustaka pengetahuan yang ada untuk menyelesaikan kueri multi-hop.
Kemampuan untuk memahami dan menalar berbagai jenis data mengubah agen dari pemroses data menjadi alat pemecahan masalah yang memahami dan berinteraksi dengan dunia secara lebih lengkap. Dengan memberdayakan agen untuk menjadi peserta aktif yang mampu bernalar, developer dapat membangun sistem yang mampu mengeksekusi kueri multi-langkah yang kompleks dan tugas jangka panjang yang menentukan kemampuan agen generasi berikutnya.
Tips pro
Menggunakan pendekatan pengambilan dan pemeringkatan ulang
Atasi kompromi antara perolehan (menemukan semua dokumen yang relevan) dan presisi (memastikan dokumen yang diambil relevan) menggunakan pendekatan “pengambilan dan pemeringkatan ulang”, yang memperluas jangkauan perolehan untuk mengambil serangkaian dokumen yang lebih besar dari yang diperlukan. Set yang lebih besar ini diteruskan ke LLM atau layanan pemeringkatan ulang khusus, yang mengidentifikasi dokumen paling relevan dan menghapus dokumen yang tidak relevan atau berlawanan secara semantik.
Catatan
Fine-tuning bukanlah grounding. Fine-tuning menyesuaikan gaya model dan menyempurnakan pengetahuannya tentang tugas tertentu. Grounding menghubungkan model ke sumber data yang dapat diverifikasi dan bersifat real-time untuk memastikan responsnya akurat secara faktual.
Alat
Alat adalah kemampuan yang ditentukan yang memungkinkan agen melakukan lebih dari fungsi bawaan model penalaran intinya. Mulai dari melakukan perhitungan internal sederhana hingga berinteraksi dengan sistem eksternal menggunakan panggilan API, alat menjembatani kesenjangan antara penalaran agen dan kemampuannya untuk bertindak. Karena grounding adalah cara utama agen untuk mengambil informasi baru, secara teknis, grounding adalah alat paling mendasar dalam toolkit agen.
Alat dapat meliputi:
Arsitektur data
Agen menggunakan berbagai jenis memori untuk berbagai tugas. Arsitektur data perusahaan yang tangguh harus memenuhi tiga kebutuhan berbeda: penyimpanan persisten untuk pengambilan pengetahuan jangka panjang, akses latensi rendah untuk konteks percakapan jangka pendek, dan buku besar yang andal untuk audit transaksional.
1. Pusat informasi jangka panjang (grounding dan memori)
Memori jangka panjang adalah fondasi kecerdasan, grounding, dan personalisasi agen, dan berbeda dari konteks percakapan langsung yang cepat serta jangka pendek. Arsitekturnya memiliki tiga komponen utama:
Kasus penggunaan
Mendapatkan akses ke semua informasi yang relevan
Agen hukum langsung mengambil yurisprudensi, dokumen kebijakan internal, dan panduan pelatihan untuk membuat draf pertama kontrak yang mematuhi hukum.
2. Memori kerja (konteks percakapan dan status jangka pendek)
Lapisan ini mengelola informasi sementara (jendela konteks LLM) yang diperlukan untuk tugas atau percakapan yang sedang berlangsung. Untuk mempertahankan pengalaman pengguna yang responsif, LLM harus menyediakan akses latensi yang sangat rendah untuk urutan tindakan dan pengamatan berulang yang dilakukan.
Kasus penggunaan
Melakukan percakapan yang bermanfaat
Agen dukungan pelanggan mempertahankan status alur pemecahan masalah multi-langkah, mengingat nomor seri atau langkah diagnosis yang sebelumnya diberikan pengguna untuk mencegah pengulangan.
3. Memori transaksional (pengelolaan status dan pengauditan tindakan)
Lapisan ini bertanggung jawab untuk mencatat tindakan dan perubahan status dengan integritas dan konsistensi kuat. Lapisan ini berfungsi sebagai sistem catatan yang andal—yang penting dari sudut pandang keamanan dan untuk memberikan jejak audit yang tidak dapat disangkal untuk setiap tindakan yang dilakukan oleh agen.
Kasus penggunaan
Mempertahankan buku besar yang andal
Agen supply chain mencatat keberhasilan eksekusi pesanan pembelian yang kompleks dan melibatkan banyak pihak, sehingga memastikan transaksi tersebut dilacak dan diverifikasi secara permanen di seluruh sistem keuangan.
Orkestrasi
Orkestrasi adalah inti operasional yang memandu agen melalui tugas multi-langkah. Untuk setiap proses yang memerlukan lebih dari satu tindakan, orkestrasi menentukan alat apa yang diperlukan, urutan penggunaannya, dan cara menggabungkan outputnya untuk mencapai tujuan akhir.
Sebagai fungsi eksekutif agen, orkestrasi adalah kunci untuk menciptakan sistem canggih yang mengotomatiskan proses bisnis yang kompleks. Dengan orkestrasi, Anda dapat mengatasi masalah yang sebelumnya tidak mungkin dilakukan secara teknis, sehingga membuka peluang untuk aplikasi dan pengalaman pengguna yang baru.
Pola orkestrasi yang umum dan efektif adalah ReAct (Penalaran + Tindakan). Framework ini mengintegrasikan kemampuan penalaran dan tindakan model bahasa besar, serta membangun loop multi-giliran yang dinamis, di mana model menghasilkan jejak penalaran (pemikiran) dan tindakan khusus tugas secara bergantian.
Dengan ReAct, penalaran membantu model melacak dan memperbarui rencana tindakan, sementara tindakan mengumpulkan informasi dari alat eksternal untuk menginformasikan proses penalaran. Berikut cara kerjanya:
Kasus penggunaan
Otomatisasi HR lintas departemen
Untuk mengorientasi karyawan baru, agen secara berurutan memulai tindakan di berbagai sistem. Pertama, agen membuat data karyawan di sistem; lalu memicu panggilan API ke agen IT untuk menyediakan hardware dan kredensial jaringan; dan terakhir, agen mendaftarkan karyawan ke modul pelatihan kepatuhan regional yang diperlukan.
Perbaikan supply chain proaktif
Untuk mendeteksi dan menyelesaikan gangguan pengiriman secara otomatis, agen diatur untuk mengikuti langkah-langkah penting. Pertama, pemberitahuan pemantauan memicu alat untuk mengkueri pemasok alternatif. Kemudian, alat simulasi dijalankan untuk menghitung manfaat biaya dari mengganti pemasok versus pengiriman yang tertunda. Terakhir, jika disetujui oleh manusia dalam loop, agen akan menjalankan tindakan untuk mengirimkan pesanan pembelian baru kepada agen logistik.
Runtime
Untuk men-deploy prototipe agen fungsional ke lingkungan produksi dalam skala besar, Anda memerlukan infrastruktur runtime yang tangguh dan terintegrasi dengan sistem layanan yang kohesif untuk grounding, alat, memori, sesi, dan lainnya. Hal ini memastikan agen Anda dapat beroperasi dalam ekosistem yang aman dan berperforma tinggi yang mampu menangani tuntutan kompleks dari perkembangan perusahaan global.
Lingkungan runtime tingkat produksi memerlukan:
Skalabilitas: Infrastruktur harus otomatis diskalakan untuk menangani beban variabel, mulai dari nol hingga jutaan permintaan. Hal ini mencakup load balancing berbasis permintaan dan penskalaan otomatis berbasis resource untuk mengelola permintaan komputasi secara efisien.
Keamanan dan kontrol: Platform harus menyediakan lingkungan eksekusi yang aman, mengelola identitas pengguna dan agen, kebijakan organisasi, pendaftaran alat dan agen, kontrol akses jaringan, dan saluran komunikasi yang aman (seperti TLS) untuk melindungi agen dan data yang diaksesnya.
Keandalan dan kemampuan observasi: Sistem harus mencakup mekanisme untuk penanganan error dan pemantauan berkelanjutan. Untuk proses debug yang kompleks, runtime harus menangkap trace eksekusi dengan fidelitas tinggi—rekaman langkah demi langkah dari penalaran dan panggilan alat agen. Hal ini mengekspos seluruh lintasan keputusan, sehingga tim Anda dapat menjawab “Mengapa?” jika terjadi kegagalan yang tidak terduga. Untuk pengawasan tingkat tinggi, sistem harus menyertakan metrik untuk penyelesaian tugas dan masukan pengguna. Otomatisasi dengan simulasi dan evaluasi memungkinkan keyakinan sebelum dan sesudah di-deploy ke produksi.