Konsep inti agen AI

Agen AI telah berevolusi dari chatbot pasif menjadi sistem otonom yang mampu melakukan penalaran, menggunakan alat perusahaan, dan mengeksekusi alur kerja yang kompleks.

Untuk memanfaatkan potensi besar agen tersebut—dan beralih dari kasus penggunaan dan prototipe eksperimental ke sistem yang tangguh dan berkelas perusahaan yang mendorong ROI terukur—ada baiknya untuk memahami elemen-elemen penyusunnya. Di sini, kami menguraikan konsep inti agen AI, termasuk:

Model: Mesin penalaran yang digunakan agen untuk berpikir
Grounding: Pusat informasi, yang menjadi mekanisme untuk akurasi faktual dan pengambilan informasi
Alat: Kemampuan yang ditentukan untuk melakukan tugas, yang menentukan apa yang dapat dilakukan agen
Arsitektur data: Tempat agen menyimpan memori dan datanya
Orkestrasi: Cara agen merencanakan dan menghubungkan semua bagian dalam tugas multi-langkah
Runtime: Tempat agen berada dan dieksekusi dalam skala besar

Model

Anggap model sebagai otak agen Anda. Model ini membaca dan memahami permintaan Anda, mencari tahu apa yang perlu dilakukan, dan menghasilkan respons cerdas.

Memilih model yang tepat adalah masalah menyeimbangkan kemampuan, kecepatan, dan biaya untuk kasus penggunaan Anda. Tujuannya bukan untuk memaksimalkan daya mentah, tetapi untuk mengoptimalkan efisiensi. Kesalahan paling umum adalah berinvestasi berlebihan dalam kemampuan yang tidak diperlukan oleh kasus penggunaan, sehingga menyebabkan pengeluaran yang tidak efisien dan performa yang lebih lambat.

Arsitektur kognitif yang tangguh menggunakan beberapa agen khusus yang secara dinamis memilih model paling efisien untuk sub-tugas tertentu. Hal ini seperti memiliki tim spesialis yang siap membantu—dengan pekerjaan yang secara cerdas diarahkan ke spesialis yang berbeda bergantung pada tugasnya. Misalnya, model yang canggih dicadangkan untuk tugas berat seperti perencanaan dan penalaran yang kompleks, sedangkan tugas yang lebih sederhana dan bervolume tinggi seperti mengklasifikasikan niat pengguna akan dialihkan ke model yang lebih cepat dan hemat biaya. Perutean model dinamis ini adalah kunci untuk mengoptimalkan performa dan biaya.

Dengan menawarkan serangkaian model yang luas untuk dipilih, beserta mode penalaran yang dapat dikonfigurasi, developer mendapatkan serangkaian alat dinamis untuk pengoptimalan yang canggih. Semua hal tersebut membantu mereka mengkalibrasi biaya dan performa di seluruh sistem multi-agen untuk memenuhi kebutuhan bisnis dan teknis tertentu.

Setelah memilih model yang sesuai dengan kebutuhan biaya-latensi-kualitas, Anda mungkin memiliki opsi untuk menyempurnakannya. Hal ini mengkhususkan pengetahuan dan gaya untuk kebutuhan bisnis spesifik Anda, dan dilakukan menggunakan set data pilihan dari contoh berkualitas tinggi milik Anda sendiri. Untuk mengetahui apakah suatu model mengizinkan dan mendukung penyesuaian, tinjau dokumentasi dan perjanjian lisensinya.

Pembahasan mendalam: Membangun agen perusahaan

Siap mempraktikkan pemilihan model Anda? Lihat cara menyeimbangkan keamanan, keandalan, dan efisiensi dalam arsitektur kognitif yang tangguh.

Dapatkan panduan teknis untuk membangun sistem multi-agen perusahaan.

Tips pro

Gunakan platform terpusat untuk menemukan, menyesuaikan, dan men-deploy model dasar. Temukan platform yang menawarkan pilihan model terbaik di dunia yang sangat terseleksi, memungkinkan Anda melakukan deployment dengan sekali klik, dan menawarkan keamanan tingkat perusahaan sejak awal.

Grounding

Kredibilitas dan kegunaan agen bergantung pada kemampuannya memberikan jawaban yang akurat dan tepercaya berdasarkan fakta yang dapat diverifikasi. Di sinilah grounding berperan. Gemini mengubah agen menjadi pengotomatis alur kerja yang sesungguhnya yang di-grounding secara mendalam dan akurat pada data bisnis Anda.

Dalam hal grounding, ada tiga lapisan yang perlu dipertimbangkan.

1. RAG: Langkah pertama yang mendasar

Kredibilitas agen bergantung pada kemampuannya memberikan jawaban berdasarkan fakta yang dapat diverifikasi. Retrieval-augmented generation (RAG) menghubungkan agen ke sumber data real-time yang dapat diverifikasi, sehingga memastikan agen bertindak berdasarkan fakta, bukan halusinasi.

Proses pengambilan lalu pembuatan yang sederhana ini dapat diterapkan pada teks, gambar, dan jenis data lainnya. Solusi ini memungkinkan penelusuran set data besar yang sangat cepat, sehingga menghasilkan keputusan yang responsif dan tepat waktu.

Namun, meskipun RAG membantu menjawab pertanyaan, RAG tidak dapat menangani kueri kompleks yang memerlukan pemahaman lebih mendalam tentang hubungan antara titik data.

2. GraphRAG: Grounding yang lebih cerdas

GraphRAG memperkaya grounding dengan memahami hubungan eksplisit antara titik data dalam pustaka pengetahuan, dan mengambil data kontekstual yang lebih mencerminkan interkoneksinya dengan sumber data lain. Jadi, alih-alih hanya mencocokkan frasa yang mirip, agen Anda memahami hubungan antarkonsep.

Yang terpenting, pustaka pengetahuan memberi Anda kontrol langsung atas logika bisnis Anda. Meskipun RAG standar mengandalkan pola yang dihasilkan model, pustaka pengetahuan memungkinkan Anda menentukan dan mengelola hubungan spesifik antarentitas, sehingga memastikan agen mematuhi taksonomi dan aturan unik organisasi Anda. Untuk keandalan maksimum, organisasi terkemuka menggunakan pendekatan hybrid, yakni menggabungkan pengambilan luas dari RAG standar dengan presisi dan kontrol GraphRAG.

Kasus penggunaan

Tampilan data terstruktur dari berbagai sumber

Perusahaan jasa keuangan menggunakan pustaka pengetahuan untuk memberi analis pandangan terpadu tentang laporan analis, telekonferensi pembahasan kinerja finansial, penilaian risiko, dan lainnya. Jaringan data yang lengkap dan saling terhubung ini membantu analis menemukan insight yang sebelumnya tersembunyi, seperti ketergantungan supply chain yang rumit, keanggotaan dewan yang tumpang tindih di antara para pesaing, dan eksposur terhadap risiko geopolitik yang kompleks.

3. RAG Agentic: Penalaran dan pengambilan dinamis

Pendekatan grounding yang paling efektif adalah RAG Agentic, di mana agen tidak lagi menjadi penerima informasi pasif, tetapi peserta aktif yang bernalar dalam proses pengambilan informasi itu sendiri. Dengan RAG Agentic, agen dapat menganalisis kueri kompleks, merumuskan rencana multi-langkah, dan menjalankan beberapa panggilan alat secara berurutan untuk menemukan informasi terbaik. Hal ini bukan pengganti penelusuran tradisional, melainkan menambahkan penalaran lanjutan di atas infrastruktur RAG dan pustaka pengetahuan yang ada untuk menyelesaikan kueri multi-hop.

Kemampuan untuk memahami dan menalar berbagai jenis data mengubah agen dari pemroses data menjadi alat pemecahan masalah yang memahami dan berinteraksi dengan dunia secara lebih lengkap. Dengan memberdayakan agen untuk menjadi peserta aktif yang mampu bernalar, developer dapat membangun sistem yang mampu mengeksekusi kueri multi-langkah yang kompleks dan tugas jangka panjang yang menentukan kemampuan agen generasi berikutnya.

Tips pro

Menggunakan pendekatan pengambilan dan pemeringkatan ulang

Atasi kompromi antara perolehan (menemukan semua dokumen yang relevan) dan presisi (memastikan dokumen yang diambil relevan) menggunakan pendekatan “pengambilan dan pemeringkatan ulang”, yang memperluas jangkauan perolehan untuk mengambil serangkaian dokumen yang lebih besar dari yang diperlukan. Set yang lebih besar ini diteruskan ke LLM atau layanan pemeringkatan ulang khusus, yang mengidentifikasi dokumen paling relevan dan menghapus dokumen yang tidak relevan atau berlawanan secara semantik.

Catatan

Fine-tuning bukanlah grounding. Fine-tuning menyesuaikan gaya model dan menyempurnakan pengetahuannya tentang tugas tertentu. Grounding menghubungkan model ke sumber data yang dapat diverifikasi dan bersifat real-time untuk memastikan responsnya akurat secara faktual.

Alat

Alat adalah kemampuan yang ditentukan yang memungkinkan agen melakukan lebih dari fungsi bawaan model penalaran intinya. Mulai dari melakukan perhitungan internal sederhana hingga berinteraksi dengan sistem eksternal menggunakan panggilan API, alat menjembatani kesenjangan antara penalaran agen dan kemampuannya untuk bertindak. Karena grounding adalah cara utama agen untuk mengambil informasi baru, secara teknis, grounding adalah alat paling mendasar dalam toolkit agen.

Alat dapat meliputi:

Fungsi dan layanan internal: Logika eksklusif atau kode khusus yang ditulis oleh tim Anda sendiri untuk menyelesaikan masalah spesifik bisnis.
API Eksternal: Koneksi aman ke layanan pihak ketiga yang memungkinkan agen menjalankan tugas di dunia nyata.
Pengambilan dan grounding data: Kemampuan untuk mengkueri database secara dinamis (termasuk bahasa alami ke SQL), menelusuri penyimpanan vektor, atau mengakses pusat informasi perusahaan. Baik itu penelusuran sederhana atau kueri database yang kompleks, alat ini memastikan tindakan agen didasarkan pada data yang dapat diverifikasi.
Kolaborasi agen: Dalam sistem yang lebih canggih, satu agen dapat berkolaborasi dengan agen khusus lainnya untuk mengatasi masalah. Meskipun agen dapat digunakan sebagai “alat” untuk tugas tertentu, sistem perusahaan yang paling canggih memperlakukan agen sebagai kolaborator yang mengoordinasikan tindakan secara aman di berbagai domain.

Arsitektur data

Agen menggunakan berbagai jenis memori untuk berbagai tugas. Arsitektur data perusahaan yang tangguh harus memenuhi tiga kebutuhan berbeda: penyimpanan persisten untuk pengambilan pengetahuan jangka panjang, akses latensi rendah untuk konteks percakapan jangka pendek, dan buku besar yang andal untuk audit transaksional.

1. Pusat informasi jangka panjang (grounding dan memori)

Memori jangka panjang adalah fondasi kecerdasan, grounding, dan personalisasi agen, dan berbeda dari konteks percakapan langsung yang cepat serta jangka pendek. Arsitekturnya memiliki tiga komponen utama:

Pusat informasi terstruktur untuk retrieval-augmented generation (RAG) berbasis fakta
Penyimpanan persisten untuk memori pengguna yang disaring. Alih-alih menyimpan setiap interaksi historis, agen ini menghasilkan dan menyimpan fakta penting tentang pengguna, tim, atau tugas untuk memungkinkan pengalaman yang berkelanjutan dan dipersonalisasi
Data lake operasional untuk materi mentah seperti transkrip percakapan dan status alur kerja, yang memungkinkan proses kognitif yang lebih kompleks dan analisis di masa mendatang

Kasus penggunaan

Mendapatkan akses ke semua informasi yang relevan

Agen hukum langsung mengambil yurisprudensi, dokumen kebijakan internal, dan panduan pelatihan untuk membuat draf pertama kontrak yang mematuhi hukum.

2. Memori kerja (konteks percakapan dan status jangka pendek)

Lapisan ini mengelola informasi sementara (jendela konteks LLM) yang diperlukan untuk tugas atau percakapan yang sedang berlangsung. Untuk mempertahankan pengalaman pengguna yang responsif, LLM harus menyediakan akses latensi yang sangat rendah untuk urutan tindakan dan pengamatan berulang yang dilakukan.

Kasus penggunaan

Melakukan percakapan yang bermanfaat

Agen dukungan pelanggan mempertahankan status alur pemecahan masalah multi-langkah, mengingat nomor seri atau langkah diagnosis yang sebelumnya diberikan pengguna untuk mencegah pengulangan.

3. Memori transaksional (pengelolaan status dan pengauditan tindakan)

Lapisan ini bertanggung jawab untuk mencatat tindakan dan perubahan status dengan integritas dan konsistensi kuat. Lapisan ini berfungsi sebagai sistem catatan yang andal—yang penting dari sudut pandang keamanan dan untuk memberikan jejak audit yang tidak dapat disangkal untuk setiap tindakan yang dilakukan oleh agen.

Kasus penggunaan

Mempertahankan buku besar yang andal

Agen supply chain mencatat keberhasilan eksekusi pesanan pembelian yang kompleks dan melibatkan banyak pihak, sehingga memastikan transaksi tersebut dilacak dan diverifikasi secara permanen di seluruh sistem keuangan.

Orkestrasi

Orkestrasi adalah inti operasional yang memandu agen melalui tugas multi-langkah. Untuk setiap proses yang memerlukan lebih dari satu tindakan, orkestrasi menentukan alat apa yang diperlukan, urutan penggunaannya, dan cara menggabungkan outputnya untuk mencapai tujuan akhir.

Sebagai fungsi eksekutif agen, orkestrasi adalah kunci untuk menciptakan sistem canggih yang mengotomatiskan proses bisnis yang kompleks. Dengan orkestrasi, Anda dapat mengatasi masalah yang sebelumnya tidak mungkin dilakukan secara teknis, sehingga membuka peluang untuk aplikasi dan pengalaman pengguna yang baru.

Pola orkestrasi yang umum dan efektif adalah ReAct (Penalaran + Tindakan). Framework ini mengintegrasikan kemampuan penalaran dan tindakan model bahasa besar, serta membangun loop multi-giliran yang dinamis, di mana model menghasilkan jejak penalaran (pemikiran) dan tindakan khusus tugas secara bergantian.

Dengan ReAct, penalaran membantu model melacak dan memperbarui rencana tindakan, sementara tindakan mengumpulkan informasi dari alat eksternal untuk menginformasikan proses penalaran. Berikut cara kerjanya:

Bernalar: Agen menilai sasaran dan kondisi saat ini, membentuk hipotesis tentang langkah terbaik berikutnya dan apakah alat diperlukan atau tidak.
Bertindak: Agen memilih dan memanggil alat yang sesuai.
Mengamati: Agen menerima output dari alat. Informasi baru ini diintegrasikan ke dalam konteks agen dan dimasukkan ke langkah Penalaran berikutnya dalam siklus.

Kasus penggunaan

Otomatisasi HR lintas departemen

Untuk mengorientasi karyawan baru, agen secara berurutan memulai tindakan di berbagai sistem. Pertama, agen membuat data karyawan di sistem; lalu memicu panggilan API ke agen IT untuk menyediakan hardware dan kredensial jaringan; dan terakhir, agen mendaftarkan karyawan ke modul pelatihan kepatuhan regional yang diperlukan.

Perbaikan supply chain proaktif

Untuk mendeteksi dan menyelesaikan gangguan pengiriman secara otomatis, agen diatur untuk mengikuti langkah-langkah penting. Pertama, pemberitahuan pemantauan memicu alat untuk mengkueri pemasok alternatif. Kemudian, alat simulasi dijalankan untuk menghitung manfaat biaya dari mengganti pemasok versus pengiriman yang tertunda. Terakhir, jika disetujui oleh manusia dalam loop, agen akan menjalankan tindakan untuk mengirimkan pesanan pembelian baru kepada agen logistik.

Runtime

Untuk men-deploy prototipe agen fungsional ke lingkungan produksi dalam skala besar, Anda memerlukan infrastruktur runtime yang tangguh dan terintegrasi dengan sistem layanan yang kohesif untuk grounding, alat, memori, sesi, dan lainnya. Hal ini memastikan agen Anda dapat beroperasi dalam ekosistem yang aman dan berperforma tinggi yang mampu menangani tuntutan kompleks dari perkembangan perusahaan global.

Lingkungan runtime tingkat produksi memerlukan:

Skalabilitas: Infrastruktur harus otomatis diskalakan untuk menangani beban variabel, mulai dari nol hingga jutaan permintaan. Hal ini mencakup load balancing berbasis permintaan dan penskalaan otomatis berbasis resource untuk mengelola permintaan komputasi secara efisien.

Keamanan dan kontrol: Platform harus menyediakan lingkungan eksekusi yang aman, mengelola identitas pengguna dan agen, kebijakan organisasi, pendaftaran alat dan agen, kontrol akses jaringan, dan saluran komunikasi yang aman (seperti TLS) untuk melindungi agen dan data yang diaksesnya.

Keandalan dan kemampuan observasi: Sistem harus mencakup mekanisme untuk penanganan error dan pemantauan berkelanjutan. Untuk proses debug yang kompleks, runtime harus menangkap trace eksekusi dengan fidelitas tinggi—rekaman langkah demi langkah dari penalaran dan panggilan alat agen. Hal ini mengekspos seluruh lintasan keputusan, sehingga tim Anda dapat menjawab “Mengapa?” jika terjadi kegagalan yang tidak terduga. Untuk pengawasan tingkat tinggi, sistem harus menyertakan metrik untuk penyelesaian tugas dan masukan pengguna. Otomatisasi dengan simulasi dan evaluasi memungkinkan keyakinan sebelum dan sesudah di-deploy ke produksi.

Pelajari cara membangun, menskalakan, dan mengatur agen AI.

Panduan perusahaan kami untuk sistem multi-agen menunjukkan cara membangun solusi berbasis AI yang efisien, skalabel, dan aman tanpa mengorbankan ketangguhan perusahaan.