Google Cloud Next Tokyo:7/30、31 東京ビッグサイトにて開催!

AI エージェントの基本コンセプト

AI エージェントは、受動的なチャットボットから、推論、社内ツールの使用、複雑なワークフローの実行が可能な自律型システムへと進化しました。

AI エージェントの大きな可能性を最大限に引き出し、実験的なユースケースやプロトタイプから、測定可能な ROI を実現する堅牢なエンタープライズ グレードのシステムに移行するには、構成要素を理解することが重要です。ここでは、AI エージェントの基本コンセプトを以下のように分解して説明します。

  • モデル: エージェントが思考に使用する推論エンジン
  • グラウンディング: 事実の正確性と知識の検索のメカニズムとなるナレッジベース
  • ツール: タスクを実行するための定義された機能であり、エージェントが何を実行できるかを決定する要素
  • データ アーキテクチャ: エージェントがメモリとデータを保存する場所
  • オーケストレーション: エージェントが複数ステップのタスクのすべての部分を計画して接続する方法
  • ランタイム: エージェントが稼働し、大規模に実行される場所

モデル

モデルはエージェントの脳のようなものです。モデルはリクエストを読み取って理解し、必要な処理を把握して、スマートな回答を生成します。

適切なモデルを選択するには、ユースケースに応じて、性能、速度、コストのバランスを取ることが重要です。目指すべきは単に性能を最大化することではなく、効率性を最適化することです。最もよくある間違いは、ユースケースで必要とされない性能に過剰に投資してしまい、その結果、コストの無駄やパフォーマンスの低下を招くことです。

堅牢な認知アーキテクチャでは、複数の専門エージェントが採用されており、それぞれが特定のサブタスクに対して最も軽量なモデルを動的に選択します。これは、タスクに応じて適切な専門家に仕事を最適に振り分けるチームを持つようなものです。たとえば、複雑な計画立案や推論といった高度な処理には高性能なモデルを割り当てる一方で、ユーザー意図の分類のようなシンプルで大量処理が必要なタスクには、より高速で費用対効果の高いモデルを使用します。このような動的なモデル ルーティングは、パフォーマンスとコストの両方を最適化するうえで重要です。

幅広いモデル群と設定可能な推論モードを提供することで、デベロッパーは高度な最適化を実現するための柔軟な調整手段を得ることができます。これにより、マルチエージェント システム全体のコストとパフォーマンスを、特定のビジネス要件および技術要件に合わせて調整できるようになります。

コスト、レイテンシ、品質の要件に適したモデルを選択した後、ファインチューニングを行える場合があります。ファインチューニングでは、自社の高品質なサンプルデータを厳選して使用することで、モデルの知識やスタイルを特定のビジネスニーズに合わせて特化させます。モデルがファインチューニングに対応しているかどうかは、該当するドキュメントやライセンス契約を確認してください。

詳細: エンタープライズ エージェントの構築

モデル選定を実践に移す準備はできましたか?堅牢な認知アーキテクチャの中で、セキュリティ、信頼性、効率性のバランスをどのように取るかをご紹介します。

エンタープライズ向けのマルチエージェント システムの構築に関する技術ガイドをご覧ください。


ヒント

基盤モデルの検索、カスタマイズ、デプロイするには、一元化されたプラットフォームを活用しましょう。世界最高水準のモデルを厳選して提供し、ワンクリックでデプロイでき、導入当初からエンタープライズ グレードのセキュリティを提供するものを選ぶことが重要です。

グラウンディング

エージェントの信頼性と有用性は、検証可能な事実に基づいて正確で信頼できる回答を提供する能力によって決まります。ここで重要になるのがグラウンディングです。グラウンディングは、エージェントを自社のビジネスデータに深くかつ正確に根ざした、真のワークフロー自動化ツールへと変革します。

グラウンディングには、考慮すべきレイヤが 3 つあります。

1. RAG: 最初の基礎ステップ

エージェントの信頼性は、検証可能な事実に基づいて回答を提供できる能力に左右されます。検索拡張生成(RAG)は、エージェントを検証可能なリアルタイムのデータソースに接続し、エージェントがハルシネーションではなく事実に基づいて動作することを保証します。

この検索してから生成するというシンプルなプロセスは、テキスト、画像、その他のさまざまなデータの種類に適用できます。これにより、膨大なデータセットを瞬時に検索できるため、迅速かつタイムリーな意思決定が可能になります。

しかし、RAG は質問への回答には有効である一方で、データポイント間の関係をより深く理解する必要がある複雑なクエリに対しては限界があります。

2. GraphRAG: よりスマートなグラウンディング

GraphRAG は、ナレッジグラフ内のデータポイント間の明示的な関係を理解し、他のデータソースとの相互接続性をより適切に反映するコンテキスト データを取得することで、グラウンディングを強化します。そのため、類似するフレーズを照合するだけでなく、エージェントがコンセプトの関連性を理解します。

重要な点として、ナレッジグラフではビジネス ロジックを直接制御できます。標準の RAG はモデルが生成したパターンに依存しますが、ナレッジグラフではエンティティ間の特定の関係を定義して管理できるため、エージェントが組織固有の分類法とルールを尊重します。信頼性を最大限に高めるために、大手組織はハイブリッド アプローチを採用しています。これは、標準的な RAG の幅広い検索と、GraphRAG の精度と制御を組み合わせたものです。

ユースケース

さまざまなソースからのデータを構造化して表示

金融サービス企業は、ナレッジグラフを使用して、アナリスト レポート、収益報告、リスク評価などのデータを統合されたビューでアナリストに提供します。この豊富で相互接続されたデータのウェブにより、アナリストは、複雑なサプライ チェーンの依存関係、競合他社間で重複する取締役会のメンバーシップ、複雑な地政学的リスクへの露出など、これまで隠されていた分析情報を発見できるようになります。

3. エージェント RAG: 動的な推論と検索

グラウンディングの最も強力なアプローチは、エージェント RAG です。これは、エージェントがもはや受動的に情報を受け取る存在ではなく、検索プロセスそのものにおいて能動的に推論を行う参加者となる仕組みです。エージェント RAG を使用すると、エージェントは複雑なクエリを分析し、複数ステップの計画を策定し、複数のツール呼び出しを順番に実行して、可能な限り最適な情報を見つけることができます。これは従来の検索に代わるものではなく、既存の RAG とナレッジグラフのインフラストラクチャの上に高度な推論を重ねて、マルチホップ クエリを解決するアプローチです。

さまざまなデータの種類を認識して推論できるこの能力により、エージェントは単なるデータ処理者から、より包括的な形で世界を理解し相互作用できる問題解決ツールへと進化します。エージェントを能動的かつ推論的な参加者として機能させることで、デベロッパーは、次世代のエージェント機能を特徴づける複雑な複数ステップのクエリや長期的タスクを実行できるシステムを構築できるようになります。

ヒント

retrieve and re-rank(検索 + 再ランク付け)アプローチを使用する

リコール(関連するすべてのドキュメントを見つけること)と適合率(取得されたドキュメントが実際に関連していることを保証すること)とのトレードオフに対処するには、「retrieve and re-rank」アプローチを活用します。この手法では、必要以上に広い範囲からドキュメントを取得することでリコールの幅を広げます。取得された大きなドキュメント セットは LLM または専門の再ランキング サービスに渡され、そこで最も関連性の高いドキュメントが特定され、関連性のないドキュメントや意味的に逆の内容を含むものは破棄されます。

ファインチューニングはグラウンディングではありません。ファインチューニングは、特定のタスクに合わせてモデルのスタイルを適応させ、その知識を洗練させるものです。一方、グラウンディングは、モデルをリアルタイムで検証可能なデータソースに接続し、回答が事実に基づいて正確であることを保証するものです。

ツール

ツールとは、エージェントが中核となる推論モデルのネイティブ機能を超えた処理を実行できるようにする、定義された機能のことです。単純な内部計算の実行から、API 呼び出しを通じた外部システムとの連携まで、ツールはエージェントの推論能力と実際の行動能力とのギャップを橋渡しします。グラウンディングは、エージェントが新しい情報を取得するための主要な手段であるため、技術的にはエージェントのツールキットの中で最も基盤となるツールです。

検索ツールには、次のようなものがある。

  • 内部関数とサービス: ビジネス固有の問題を解決するために、自社チームが作成した独自のロジックまたは特殊なコード。
  • 外部 API: エージェントが実世界でタスクを実行できるようにする、サードパーティ サービスへの安全な接続。
  • データ取得とグラウンディング: データベースの動的なクエリ(自然言語から SQL への変換を含む)、ベクトルストアの検索、エンタープライズ ナレッジベースへのアクセスなどの機能。シンプルな検索でも複雑なデータベース クエリでも、これらのツールを使用することで、エージェントのアクションが検証可能なデータに基づいていることを保証できます。
  • エージェントのコラボレーション: より高度なシステムでは、1 つのエージェントが別の専門エージェントと連携して問題を解決できます。エージェントは特定のタスクの「ツール」として使用できますが、最も強力なエンタープライズ システムでは、エージェントをさまざまなドメインにわたってアクションを安全に調整するコラボレーターとして扱います。

データ アーキテクチャ

エージェントは、タスクに応じて異なる種類のメモリを使用します。堅牢なエンタープライズ データ アーキテクチャは、長期的な知識検索のための永続ストレージ、短期的な会話コンテキストのための低レイテンシ アクセス、トランザクション監査のための耐久性のある台帳という 3 つの明確なニーズに対応する必要があります。

1. 長期ナレッジベース(グラウンディングとメモリ)

長期メモリは、エージェントのインテリジェンス、グラウンディング、パーソナライズの基盤であり、ライブ会話の高速な短期コンテキストとは異なります。そのアーキテクチャには、次の 3 つのコア コンポーネントがあります。

  • 事実に基づいた検索拡張生成(RAG)のための構造化されたナレッジベース
  • ユーザーの記憶を抽出した永続的なストア。エージェントは、過去のすべてのやり取りを保存するのではなく、ユーザー、チーム、タスクに関する重要な事実を生成して保存し、継続的でパーソナライズされたエクスペリエンスを実現します
  • 会話の文字起こしやワークフローの状態などの生データを格納する運用データレイク。より複雑な認知プロセスと将来的な分析を可能にします

ユースケース

関連するすべての情報へのアクセスを確保

法律エージェントが判例、社内ポリシー文書、トレーニング マニュアルを即座に取得し、法的に準拠した契約書の初稿を生成します。

2. ワーキング メモリ(会話のコンテキストと短期的な状態)

このレイヤは、進行中のタスクや会話に必要な一時的な情報(LLM コンテキスト ウィンドウ)を管理します。レスポンシブなユーザー エクスペリエンスを維持するには、一連の操作と観測の反復処理に対して、極めて低いレイテンシで提供する必要があります。

ユースケース

役立つ会話を行う

カスタマー サポート エージェントは、複数ステップにわたるトラブルシューティングの進行状況を維持し、ユーザーが以前に提供したシリアル番号や実施済みの診断手順を記憶することで、同じやり取りを繰り返さないようにします。

3. トランザクション メモリ(状態管理とアクションの監査)

このレイヤは、強整合性と完全性を維持しながら、アクションと状態の変化を記録する役割を担います。これは、セキュリティの観点から不可欠であり、エージェント主導のすべてのアクションに対して否認できない監査証跡を提供する、永続的な記録システムとして機能します。

ユースケース

耐久性に優れた台帳の維持

サプライ チェーン エージェントは、複数の当事者が関与する複雑な発注処理の正常な実行を記録し、その取引が財務システム全体にわたって永続的に追跡可能かつ検証可能であることを保証します。

オーケストレーション

オーケストレーションは、エージェントを複数ステップのタスクへと導く運用上の中核です。単一のアクションでは完了しないプロセスにおいて、どのツールが必要か、それらをどの順序で使用するか、そして最終的な目標を達成するために各ツールの出力をどのように組み合わせるかを決定します。

エージェントの実行機能として、オーケストレーションは複雑なビジネス プロセスを自動化する高度なシステムを構築するための鍵となります。これにより、以前は技術的に不可能だった問題に取り組むことができ、最終的には新しいクラスのアプリケーションとユーザー エクスペリエンスが実現します。

一般的かつ効果的なオーケストレーション パターンの 1 つが、ReAct(Reason + Action)です。このフレームワークは、大規模言語モデルの推論能力と実行能力を相乗的に組み合わせ、モデルが推論トレース(思考)とタスク固有のアクションを交互に生成する動的なマルチターン ループを確立します。

ReAct では、推論によってモデルがアクション プランを追跡して更新し、アクションによって外部ツールから情報を収集して推論プロセスに反映させます。仕組みは次のとおりです。

  1. 推論: エージェントは目標と現状を評価し、次に取るべき最適なステップについて仮説を立て、ツールが必要かどうかを判断します。
  2. アクション: エージェントは適切なツールを選択して呼び出します。
  3. 観察: エージェントがツールから出力を受け取ります。この新しい情報はエージェントのコンテキストに統合され、サイクルの次の「推論」ステップへと引き継がれます。

ユースケース

部門横断的な人事業務の自動化

新しい従業員をオンボーディングするために、エージェントは複数のシステムにわたって順次処理を実行します。まず、システムに従業員レコードを作成し、次に IT エージェントへの API 呼び出しをトリガーしてハードウェアとネットワーク認証情報をプロビジョニングします。最後に、従業員を対象地域で必須となるコンプライアンス トレーニング モジュールに登録します。

サプライ チェーンの予防的な是正対応

配送の中断を自動的に検出して解決するために、エージェントは主要な手順に従ってオーケストレーションされます。まず、モニタリング アラートによって、代替サプライヤーを照会するツールがトリガーされます。その後、シミュレーション ツールを実行して、サプライヤーの切り替えと配送遅延の費用対効果を計算します。最後に、人間による承認が得られれば、新しい注文書を物流エージェントに送信するアクションを実行します。

ランタイム

機能的なエージェントのプロトタイプを本番環境に大規模にデプロイするには、グラウンディング、ツール、メモリ、セッションなどを含む統合されたサービス群と連携する、堅牢なランタイム インフラストラクチャが必要です。これにより、エージェントは、グローバル企業の成長に伴う複雑な要件に対応できる、安全で高性能なエコシステム内で運用できるようになります。

本番環境グレードのランタイム環境には、次の要素が求められます。

スケーラビリティ: インフラストラクチャは、0 から数百万のリクエストまで、変動する負荷を処理するために自動的にスケーリングできる必要があります。これには、コンピューティング需要を効率的に管理するための、リクエストベースのロード バランシングとリソースベースの自動スケーリングの両方が含まれます。

セキュリティと制御: プラットフォームは、安全な実行環境を提供し、ユーザーとエージェントの ID、組織ポリシー、ツールとエージェントの登録、ネットワーク アクセス制御、安全な通信チャネル(TLS など)を管理する必要があります。これにより、エージェントとエージェントがアクセスするデータを保護します。

信頼性とオブザーバビリティ: システムには、エラー処理と継続的なモニタリングのためのメカニズムが含まれている必要があります。複雑なデバッグに対応するため、ランタイムは、エージェントの推論とツール呼び出しをステップごとに記録した、高忠実度の実行トレースをキャプチャできる必要があります。これにより、意思決定の全過程が可視化され、予期しない障害が発生した場合でも、チームが「なぜ起きたのか」を明確に説明することができます。また、高位レベルでの監視のために、システムにはタスク完了率やユーザー フィードバックなどのメトリクスも必要です。シミュレーションと評価による自動化により、本番環境へのデプロイ前後の信頼性を確保できます。

AI エージェントの構築、スケーリング、管理方法を学びましょう。

マルチエージェント システムに関するエンタープライズ向けガイドでは、企業の堅牢性を損なうことなく、効率的でスケーラブルかつ安全な AI 主導のソリューションを構築する方法をご紹介します。

  • Google Cloud プロダクト
  • 100 種類を超えるプロダクトをご用意しています。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。また、すべてのお客様に 25 以上のプロダクトを無料でご利用いただけます(毎月の使用量上限があります)。
Google Cloud