多代理系統 (MAS) 指南

想像一個極為複雜的問題，沒有任何個人或大型單體程式能有效解決。現在想像有一支由高度專業的專家組成的團隊，每個人都擁有獨特的技能，他們流暢地協作、溝通意圖，並共同應對挑戰。這就是人工智慧中多代理系統 (MAS) 的本質。MAS 代表強大的典範轉移，從單一、全方位的 AI 解決方案，轉變為分散式、協作式智慧型代理網路。

什麼是多代理系統？

多代理系統由多個自主運作的互動式運算實體 (稱為代理) 組成，這些代理位於共用環境中。這些代理會合作、協調，有時甚至會競爭，以達成個別或集體目標。與傳統的集中控制應用程式不同，MAS 通常具有分散式控制和決策機制。MAS 的集體行為可提升準確率、適應性和擴充性，因此能處理大規模複雜工作，這類工作可能需要數百甚至數千個代理。

比較多代理系統與單一代理系統

多代理系統與單一代理系統的根本差異，在於解決問題的方法和互動範圍。

單一代理系統只有一個自主運作的實體，會在環境中獨立作業，達成特定目標，不會與其他代理直接互動。以獨立運作的西洋棋 AI 為例，這類 AI 會分析棋盤，並根據預先定義的規則或學到的策略做出決策。這類系統擅長處理定義明確的問題，且外部互動極少，集中控制效率高，例如推薦引擎或詐欺偵測。這類模型通常較容易開發，維護成本較低，且結果可預測。

相較之下，多代理系統的特徵是多個代理存在於共用環境中。這些代理會經常合作、競爭或協商，以達成個別或集體目標。這就像一個高效團隊，每個代理負責處理問題的一部分，並與其他代理溝通以達成共同目標。透過分散工作負載和專業性角色，MAS 可以處理複雜、動態或大規模的挑戰，這些挑戰會讓單一代理不堪重負。雖然需要完善的通訊和協調通訊協定，因此設計上較為複雜，但 MAS 具有更出色的彈性、穩定性和擴充性。

多代理系統的運作方式

多代理系統會將工作和通訊分配給各個代理，讓它們在共用環境中合作達成目標。這個程序通常包括：

感知：代理觀察周遭環境並收集資料。這類行為包括直接發出信號，或是注意到共用環境的變化 (也稱為共識主動性)。
推論與決策：在現代多代理系統中，推論作業主要由大型語言模型 (LLM) 執行，LLM 就像代理的「大腦」。這類 LLM 擅長理解複雜的使用者意圖、執行多步驟推論，以及制定計畫來達成目標。LLM 輔助代理會根據感知資料，決定最符合邏輯的行動。
行動：代理在環境中執行計畫的行動。
互動：代理不會單獨運作，而是會彼此溝通、協調、談判及合作。例如直接傳遞訊息、分享資訊，或是修改其他代理之後可觀察的環境。
自動化調度管理：現代 MAS 遵循自動化調度管理原則，將複雜工作分解為結構化的代理功能工作流程。您可以將其視為專案計畫，為不同代理指派特定角色和職責。「自動調度管理工具」或預先定義的圖表結構，可確保以正確順序呼叫代理、資訊在代理之間流動，以及實現最終目標。不僅能進行簡單的溝通，還能管理以目標為導向的程序，CrewAI 和 LangGraph 等現代化框架即著重於此。

這種團隊合作讓多代理系統能夠適應並解決複雜問題。

多代理系統的核心元件

多代理系統包含三個基本要素：代理、環境和互動機制。

代理程式

這些是系統中主動做出決策的實體。每個代理都具備一定程度的自主性，也就是說，代理可以獨立運作、感知周遭環境，並根據目標和可用資訊做出選擇。代理可以是軟體程式、機器人、實體機器人、無人機、感應器，甚至是人類。這些是獨立的實體，各有特定角色和功能。

環境

這是代理工作、感知和互動的共用空間。環境可以是虛擬的，例如模擬世界或網路，也可以是實體的，例如機器人代理的工廠。環境提供資源、設定限制，並做為間接溝通的媒介。

通訊協定和語言

如要讓代理協同運作，必須讓它們彼此溝通。通訊協定是如何交換資訊的規則。包括訊息格式 (例如 JSON 或 XML) 和傳送方式 (例如 HTTP 或 MQTT)。代理通訊語言 (ACL)，例如 FIPA ACL 和 KQML，提供代理互動和分享詳細資訊的標準方式。

FIPA ACL (智慧型實體代理基金會 - 代理通訊語言) 是一種廣泛使用的語言，可協助智慧型軟體代理相互溝通。這類模型以人類溝通方式為基礎，其中特定「動作」(例如「要求」或「告知」) 具有明確的意義。FIPA ACL 訊息包含傳送者、接收者、動作和實際訊息內容等欄位，因此溝通清楚明瞭。
協調機制是指代理用來解決意見分歧、達成目標共識，以及有效團隊合作的方法。例如：代理出價工作 (如競價)、投票決定，或使用「合約網」系統。

多代理系統的應用實例

多代理系統在各種領域都很有價值，因為解決複雜問題需要合作、適應性和韌性。

自動化處理複雜的多步驟工作流程

MAS 擅長將複雜的程序分解為較小的可管理工作，再將這些工作分配給專門的代理，並協調執行作業。

供應鏈管理：從製造到消費者購買，多代理系統可連結供應鏈的不同環節。虛擬代理可以彼此協商，預測庫存需求、管理資源，並即時調整營運作業。
客戶服務：在客戶支援方面，AI 代理可共同追蹤問題、建議修正方式、提報解決方案，甚至處理帳單調整或退款事宜。一位代理負責處理初步詢問，另一位則提取相關文件，第三位則生成個人化回覆。
軟體開發：您可以設計一組代理，用來回覆錯誤要求、分析過去的錯誤是否相似、建立新支援單，甚至提供工程協助，例如生成程式碼建議或安排程式碼審查。

因應多變且難以預測的環境

代理的分散式特性和自主性，讓多代理系統即使在不斷變化的環境中，也能運作良好。

交通運輸管理：MAS 可處理複雜的運輸系統，例如火車網路、卡車指派或船舶。代理可以分享即時交通和路線資訊，協助疏導交通，避免在繁忙的市區塞車。
機器人與自治系統：在倉庫中，許多機器人會一起工作，在完成訂單的同時避免相互碰撞。同樣地，自動駕駛送貨機器人小組也能分享即時路況和路線資訊，有效率地完成配送任務。
防禦系統：MAS 可模擬網路攻擊或海事狀況等潛在威脅，協助強化防禦系統，讓相關人員能更主動地規劃應對措施。

模擬複雜情境並建立模型

MAS 是強大的工具，可模擬互動並瞭解複雜系統中產生的行為。

金融交易：多個代理可分析市場資料、評估風險，並在各種資產類別中執行交易。部分代理專注於特定市場，其他則尋找更廣泛的模式。協助公司即時處理及運用大量資料。
醫療照護與公共衛生：透過基因分析，以代理為基礎的系統可協助預測及預防疾病，並管理醫院資源，例如床位分配、員工排班和醫療設備配置。
社會模擬：MAS 可針對模擬群體的社會互動和自發行為建立模型，有助於研究各種複雜的社會現象。

多代理系統的優點

與單一代理或傳統系統相比，多代理系統具備多項潛在優勢：

更有效率地解決問題

MAS 可讓多個專精不同領域的代理協同合作，解決更困難的問題。每個代理都擁有獨特技能和觀點。

可擴充

您可以新增更多代理至 MAS，不會影響運作速度。這麼做有助於有效處理更多工作和大量資料。就像用樂高積木蓋房子，可以隨時新增積木，不必擔心破壞整體結構。

強大又可靠

如果其中一個代理停止運作，其他代理會接手，確保系統持續運作。因此 MAS 非常可靠，尤其是在重要時刻。

彈性且可調整

MAS 可根據新資訊或意外問題調整工作方式，無需人類持續協助。代理可根據新需求調整。

速度更快、效能更佳

MAS 可讓多個代理同時處理問題的不同部分，因此能更快解決問題，並更有效運用電腦資源。

團隊合作提升效能

代理可以分享所學、改進方法，並以團隊形式更有效地解決問題。這種團隊學習方式對需要不斷變更和改進的 AI 系統非常有幫助。

多代理系統的難題

雖然多代理系統很有幫助，但也可能帶來一些潛在問題：

難以管理：讓多個獨立的代理協同運作而不發生衝突，可能是一項挑戰，尤其是當代理數量增加時。
通訊超載：代理數增加，訊息量也會隨之增加，可能導致處理速度變慢。通訊必須清楚快速。
意想不到的行動：多個代理的互動可能產生意想不到的結果，難以測試所有可能發生的情況。
安全疑慮：在分享私密資訊的系統中，強大的安全性至關重要。惡意代理可能會提供錯誤資訊、拒絕合作或分享私密資訊，進而造成問題。
建構和使用方式複雜：建構這類系統需要仔細規劃，並充分瞭解代理之間的對話方式。團隊必須瞭解分散式 AI 和嚴謹的溝通規則。
運作成本：由於高度仰賴強大的 LLM (通常透過 API 呼叫)，因此運算成本可能相當高。如果沒有妥善管理，擴充多代理系統的成本可能會高到令人卻步。
事實根據和幻覺：由 LLM 驅動的代理可能會「產生幻覺」，也就是生成看似合理，但事實上不正確的資訊。確保代理輸出內容可靠地以事實資料來源為依據，是主要的技術難題。
複雜的偵錯和評估作業：互動式代理的非確定性和自發行為，使偵錯作業變得極為困難。在複雜的多步驟工作流程中，如要追蹤錯誤來源，必須使用精密的記錄和評估工具。

多代理系統的熱門框架

為了協助開發人員建構及管理多代理系統，許多框架提供工具，用於設計、協調及部署自動化代理。以下列舉一些熱門選項

框架名稱	框架總覽	應用實例範例
JADE (Java Agent Development Framework)	Java 程式，用於建構符合 FIPA 標準的代理系統。雖然這項技術是瞭解 LLM 時代前 MAS 核心概念的基礎，但較少用於現代生成式 AI 應用程式。	為企業打造智慧系統 (例如管理供應鏈或分配資源) 模擬多個智慧型代理如何協同運作教學與研究智慧系統
Mesa (Python)	用於以代理為基礎的模型建立與模擬的 Python 程式庫。擅長建立複雜系統模型，主要目標是瞭解許多簡單代理 (在網格或網路中) 的湧現行為。	建立人在群體中的行為模型 (例如：群眾行為或假新聞散播方式) 模擬動物群體或經濟等複雜系統查看代理的長期互動情形
Ray (Python)	開放原始碼的整合式運算框架，可擴充 AI 和 Python 應用程式。在 MAS 中，Ray 可將多個代理的工作負載分散至叢集，實現大規模平行處理，用於訓練或即時推論。	訓練需要大量運算資源的複雜 AI 模型控制需要快速做出決策的自動駕駛汽車或無人機群體建構可擴充的機器學習服務，同時處理多項工作
AutoGen (Microsoft)	開放原始碼框架，可建構含多個「可對話」的 LLM 代理的應用程式，讓這些代理相互溝通以解決工作。擅長自動處理複雜的工作流程，包括生成程式碼、執行程式碼及收集人類意見回饋。	自動執行困難的軟體工作 (例如編寫程式碼、找出錯誤、測試或檢查程式碼) 打造聊天 AI，讓多個智慧型代理使用自然語言協同運作開發能使用其他工具並即時執行程式碼的 AI 代理
CrewAI	這個框架旨在自動化調度管理角色扮演的自動化 AI 代理。可簡化協作代理團隊的建立作業 (例如「研究人員」、「作家」和「編輯」)，讓團隊成員共同達成目標，且通常會與 LangChain 整合。	將 AI 代理組成團隊，負責特定工作，例如行銷團隊包含研究人員、寫手和編輯自動化處理業務步驟，指派角色在這裡相當實用打造能像人類團隊一樣運作的專業 AI 系統
LangGraph	LangChain 的擴充功能，可讓您使用「圖表」結構，建構代理系統。這項功能非常適合建立週期性和有狀態的工作流程，讓代理能循環執行、自我修正，並根據程序目前的狀態做出決策，進而實現比簡單鏈結更複雜且穩健的互動。	建構複雜的智慧型代理系統，需要精確控制系統在各步驟間的移動方式，以及重複執行動作的方式開發聊天 AI，讓 AI 記住長篇對話的內容，並能根據不同路徑進行對話建立系統，其中代理的行為很大程度取決於先前發生的事件
LangChain	這項基礎的開放原始碼框架可建構採用 LLM 的應用程式。它提供龐大的整合與元件生態系統，可建立內容認知應用程式，從簡單的檢索增強生成 (RAG) 管道，到做為核心工具包，用於建構 CrewAI 和 LangGraph 等更進階框架中使用的個別代理。	快速建立使用大型語言模型，且具備基本智慧型代理行為的 AI 應用程式建立可根據您的要求，尋找資訊、使用線上工具或撰寫文字的代理將 LLM 連結至外部資訊和工具，打造簡單的 AI 代理
LlamaIndex	開放原始碼資料框架，可將大型語言模型連結至自訂資料來源。雖然提供代理功能，但其核心優勢在於建構強大的 RAG 應用程式。其代理通常專門處理複雜的資料查詢和彙整工作。	將 LLM 與不同類型的資料 (例如文件或資料庫) 連結，建構生成式 AI 應用程式使用現成可用的代理，開發可尋找資訊並生成文字的系統管理複雜 AI 解決方案的資料，這類解決方案需要智慧方法來擷取資料並提出相關問題

框架名稱

框架總覽

應用實例範例

JADE (Java Agent Development Framework)

Java 程式，用於建構符合 FIPA 標準的代理系統。雖然這項技術是瞭解 LLM 時代前 MAS 核心概念的基礎，但較少用於現代生成式 AI 應用程式。

為企業打造智慧系統 (例如管理供應鏈或分配資源)
模擬多個智慧型代理如何協同運作
教學與研究智慧系統

Mesa (Python)

用於以代理為基礎的模型建立與模擬的 Python 程式庫。擅長建立複雜系統模型，主要目標是瞭解許多簡單代理 (在網格或網路中) 的湧現行為。

建立人在群體中的行為模型 (例如：群眾行為或假新聞散播方式)
模擬動物群體或經濟等複雜系統
查看代理的長期互動情形

Ray (Python)

開放原始碼的整合式運算框架，可擴充 AI 和 Python 應用程式。在 MAS 中，Ray 可將多個代理的工作負載分散至叢集，實現大規模平行處理，用於訓練或即時推論。

訓練需要大量運算資源的複雜 AI 模型
控制需要快速做出決策的自動駕駛汽車或無人機群體
建構可擴充的機器學習服務，同時處理多項工作

AutoGen (Microsoft)

開放原始碼框架，可建構含多個「可對話」的 LLM 代理的應用程式，讓這些代理相互溝通以解決工作。擅長自動處理複雜的工作流程，包括生成程式碼、執行程式碼及收集人類意見回饋。

自動執行困難的軟體工作 (例如編寫程式碼、找出錯誤、測試或檢查程式碼)
打造聊天 AI，讓多個智慧型代理使用自然語言協同運作
開發能使用其他工具並即時執行程式碼的 AI 代理

CrewAI

這個框架旨在自動化調度管理角色扮演的自動化 AI 代理。可簡化協作代理團隊的建立作業 (例如「研究人員」、「作家」和「編輯」)，讓團隊成員共同達成目標，且通常會與 LangChain 整合。

將 AI 代理組成團隊，負責特定工作，例如行銷團隊包含研究人員、寫手和編輯
自動化處理業務步驟，指派角色在這裡相當實用
打造能像人類團隊一樣運作的專業 AI 系統

LangGraph

LangChain 的擴充功能，可讓您使用「圖表」結構，建構代理系統。這項功能非常適合建立週期性和有狀態的工作流程，讓代理能循環執行、自我修正，並根據程序目前的狀態做出決策，進而實現比簡單鏈結更複雜且穩健的互動。

建構複雜的智慧型代理系統，需要精確控制系統在各步驟間的移動方式，以及重複執行動作的方式
開發聊天 AI，讓 AI 記住長篇對話的內容，並能根據不同路徑進行對話
建立系統，其中代理的行為很大程度取決於先前發生的事件

LangChain

這項基礎的開放原始碼框架可建構採用 LLM 的應用程式。它提供龐大的整合與元件生態系統，可建立內容認知應用程式，從簡單的檢索增強生成 (RAG) 管道，到做為核心工具包，用於建構 CrewAI 和 LangGraph 等更進階框架中使用的個別代理。

快速建立使用大型語言模型，且具備基本智慧型代理行為的 AI 應用程式
建立可根據您的要求，尋找資訊、使用線上工具或撰寫文字的代理
將 LLM 連結至外部資訊和工具，打造簡單的 AI 代理

LlamaIndex

開放原始碼資料框架，可將大型語言模型連結至自訂資料來源。雖然提供代理功能，但其核心優勢在於建構強大的 RAG 應用程式。其代理通常專門處理複雜的資料查詢和彙整工作。

將 LLM 與不同類型的資料 (例如文件或資料庫) 連結，建構生成式 AI 應用程式
使用現成可用的代理，開發可尋找資訊並生成文字的系統
管理複雜 AI 解決方案的資料，這類解決方案需要智慧方法來擷取資料並提出相關問題

如何導入多代理系統

實作多代理系統，從設計到部署需要完成多項重要步驟：

1. 定義問題和目標：清楚說明系統需要解決的問題，以及您希望整個系統和每個個別代理達成的目標。

2. 決定代理設計：

確定代理角色：找出各類代理將執行的特定工作類型
定義代理能力：指明每個代理能感知什麼、能做什麼，以及如何做出決策
決定代理的獨立性：決定每個代理在做出選擇時的自由度

3. 模擬環境：建立代理將在其中運作的共用空間。包括功能、資源和規則。

4. 決定通訊方式：

選擇語言：選取代理彼此溝通時使用的語言 (例如 FIPA ACL)，以及訊息的顯示方式
制定規則：設計規則，說明代理如何通訊、協同合作及解決歧見，例如傳送即時訊息、共用記憶體或透過環境對話

5. 協調策略：制定方法，確保代理能順暢合作並解決衝突。這可能涉及一個主要控制代理、代理協商規則或自然協作。

6. 整合工具：讓代理存取執行任務所需的外部工具或程式，例如資料庫、其他服務或其他 AI 模型。

7. 程式碼：選擇程式設計語言 (例如 Python 或 Java) 和多代理框架 (例如 JADE、Mesa、Ray、AutoGen 或 CrewAI)，建構代理並設定互動方式。

8. 測試及驗證：徹底測試系統，確保代理的行為符合預期、能順暢協同運作，並達成整體目標。由於代理可能出現非預期行為，這項工作會更加困難。

9. 部署及監控：將系統部署至合適的基礎架構，並設定監控機制，追蹤系統運作狀況、找出問題，確保系統持續正常運作。

使用 Google Cloud 開發、部署及管理多代理系統

Google Cloud 提供強大且可擴充的基礎架構，是開發、部署及管理多代理系統的理想平台。全套服務相當完整，可支援 MAS 中的各種元件和互動：

運算資源：部署大量代理 (尤其是採用 LLM 等密集型 AI 模型的代理) 需要大量運算能力
Google Kubernetes Engine (GKE)：GKE 提供代管環境，可部署、調度資源及管理容器化應用程式，非常適合用於自動化調度管理許多個別代理
Compute Engine：如要更精細地控管虛擬機器 (VM)，Compute Engine 提供彈性且可自訂的 VM 執行個體，來託管代理程序
資料處理與儲存：代理通常需要儲存及擷取大量資料，才能進行感知、學習和決策
Cloud Storage：提供高度可擴充且耐用的物件儲存空間，可存放代理資料、記錄和模型
BigQuery：全代管的無伺服器資料倉儲，可儲存及分析龐大的資料集，適合執行資料密集型任務的代理，或用來分析集體代理行為
Cloud SQL 或 Cloud Firestore：分別為代管的關聯式資料庫和 NoSQL 資料庫，適合代理儲存狀態、個別知識庫或互動記錄
代理間的溝通：有效率的訊息傳遞是代理協調和分享資訊的關鍵
Pub/Sub：這項即時訊息服務可讓代理之間進行非同步通訊，非常適合分離式架構和事件導向互動。代理可將訊息發布至主題，並訂閱相關主題，在沒有直接瞭解端點的情況下促進通訊
A2A 通訊協定：這個開放標準最初由 Google 開發，可讓不同的 AI 代理安全地通訊及協作，就像共通的翻譯工具，協助不同架構和供應商的代理互相探索、交換資訊 (包括文字、音訊和影片)，以及協調行動。A2A 著重於代理間的互動，可與處理代理與工具之間通訊的 Model Context Protocol (MCP) 相輔相成。
AI 和機器學習功能：許多代理會納入 AI 模型，以提升智慧化和決策能力
Vertex AI：Google 的統合式機器學習平台，是建構智慧型代理的核心。這個平台提供 Gemini 等強大的基礎模型，可進行推論，最重要的是，還包含 Vertex AI Agent Builder。這項代管服務提供多種工具，可以公司資料做為生成式 AI 代理回覆基準、將代理連結至外部 API，以及建構以目標為導向的對話式體驗，加速開發企業級生成式 AI 代理
預先訓練的 API：代理可運用 Google Cloud 的預先訓練 AI API (例如 Vision AI、Natural Language API)，加強對各種資料類型的感知和理解
網路與安全：確保 MAS 內部的通訊安全、有效率。
虛擬私有雲 (VPC)：為您的代理和服務建立獨立安全的網路環境
Identity and Access Management (IAM)：管理與 Google Cloud 資源互動的代理的權限和存取控管機制

開發人員可運用這些 Google Cloud 服務，建構強大、可擴充的智慧型多代理系統，打造精密的 AI 應用程式，解決全球一些最複雜的難題。

展開下一步行動

運用價值 $300 美元的免費抵免額和超過 20 項一律免費的產品，開始在 Google Cloud 中建構產品與服務。

需要入門協助嗎？
聯絡銷售人員
與值得信賴的夥伴合作
尋找合作夥伴
繼續瀏覽
查看所有產品