エージェント型 AI で経費報告を自動化した SAP Concur
Matt Wilkerson
Google AI Specialist
Jaime Serra
Google Key Account Executive
※この投稿は米国時間 2026 年 4 月 11 日に、Google Cloud blog に投稿されたものの抄訳です。
経費の自動化は、数十年にわたって「機械がテキストを読み取ることができれば、経費精算は可能である」というシンプルな前提に基づいていました。しかし、ポケットの中で丸まったレシートや、汚れがあったり、日焼けしたりしているレシートのスキャンを試みたことがある人は、情報の読み取りだけでは不十分であることがおわかりでしょう。都市名や明確な日付などの重要データが読み取れないと、機械は停止し、ユーザーが手動で入力しなければならないからです。
こうした従来の光学式文字認識(OCR)では対応できない課題を解決しようと、SAP Concur のエンジニアリング チームが取り組みを開始しました。業界の多くの企業がまだ会話型インターフェースの設計に注力していた頃、SAP Concur はより大きな変化を予見していました。同社は、効率性を飛躍的に高めるには、スキャン技術の改善ではなく、インテリジェントな推論が必要であることを早い段階で認識していたのです。
その結果、ExpenseIt のエージェント型 AI がアップグレードされ、テキストの読み取りだけでなく、一筋縄ではいかない複雑な推論も自動化されました。これにより、手動入力の手間が大幅に削減されました。出張中の社員は、受け取った領収書を写真撮影、デジタル スキャンのアップロード、またはメールでの転送を行うだけで、ExpenseIt によって内容が経費項目に正確かつ瞬時に変換されるため、日付の入力や明細の作成が不要になります。
このような次世代システムの実現に至るには、イノベーションの限界を超え、大胆な目標を短期間で実現したいという意欲を持つパートナーが必要でした。SAP Concur は、カスタム シリコンやデータ プラットフォームから世界水準のモデルやエージェントに至るまで、あらゆるレイヤを共同設計できる唯一のプロバイダである Google Cloud と提携し、SAP Concur の先見的なロードマップと Google Cloud のフルスタック AI の力を融合させました。両社のチームは協力して、費用管理における真のブレークスルーを実現しました。つまり、領収書を読み取るだけでなく、出張者の状況を直感的に把握する AI エージェントです。
スピード、スケーラビリティ、創意工夫
標準的な経費の自動化は、領収書の記載内容を把握するのに優れていますが、記載されていない情報は把握できません。SAP Concur は、AI エージェントの登場を、自ら推論、判断、アクションを実施できるシステムを構築する好機と捉えました。
たとえば、「メイン ストリート カフェ」というレストランで昼食をとったときの領収書をアップロードした場合を考えてみましょう。この領収書には住所が記載されていません。以前は、こうした不足情報によって自動化が完全に中断され、続行するにはこのデータをユーザーが手動入力する必要がありました。
エージェント機能があれば、ベンダー名、経費の種類、出張日程データなどのコンテキスト上の手がかりの分析を通して、不足情報が補われます。SAP Concur は、人間のアシスタントのように考えられる AI エージェントを構築したいと考えていました。たとえば、「『メイン ストリート カフェ』と記載されています。このベンダーはダラス行きのフライトとテキサス州グリーンビルのホテルを予約しているため、この取引は同ベンダーの出張日程と一致しています。したがって、このベンダーはフランスのパリではなく、テキサス州パリのホテルの近くにあるレストランを利用した可能性が高いです」のように考えるエージェントです。
これを実現するために、チームはスタートアップのようなダイナミックなマインドセットで問題に取り組みました。長い開発サイクルではなく、迅速なプロトタイピングと大胆な問題解決に基づくコラボレーションを推進しました。
両チームは Google の Gemini モデルを活用して、認知アーキテクチャを基盤とする Receipt Analysis Agent を構築しました。
仕組みは次のとおりです。
-
取り込み: ユーザーは SAP Concur モバイルアプリで写真を撮影するか、デジタル スキャンをアップロードするか、デジタル領収書をメールとして転送します。
-
決定論的なコア: SAP の基盤となるテクノロジーは、何十年にもわたる世界のさまざまな経費処理を通して改良されてきました。このテクノロジーは、細かく調整されたロジックを適用して、領収書に記載された情報を高精度で抽出します。
-
インテリジェントなルーティング レイヤ: スキャンされた領収書のデータが明確な場合、追加のアクションをトリガーする必要はありません。データに不足がある場合(例:「場所が不明」)、ルーティング ロジックによって、そのタスクが Receipt Analysis Agent に動的に転送されます。
-
コンテキストに沿った推論: Gemini モデルで構築された AI エージェントは、単に推測するだけでなく、ツールやグラウンディングを使用して不足している情報を推論します。ExpenseIt は、ユーザーの出張日程やビジネス カレンダーなどのグラウンディング データとともに、領収書のデータの一部を AI エージェントにフィードします。
-
ReAct(推論とアクションのフレームワーク): Receipt Analysis Agent は、ロケーション履歴と照らし合わせてベンダーを検証するなど、複数の情報を結び付けてから、経費の入力を完了します。


エージェント型 AI を搭載した ExpenseIt(Receipt Analysis Agent)
上の例に基づき、ExpenseIt は領収書の画像に場所が記載されていないことを特定すると、インテリジェント ルーティング レイヤが Receipt Analysis Agentを トリガーします。エージェントは Gemini を使用して、不足している情報を特定し、コンテキスト上の関連する手がかりとユーザー固有のデータを分析し、出張関連の予約やカレンダーの予定などの情報に基づいて判断を下します。
AI エージェントを成功させるための主な設計パターン
Receipt Analysis Agent は、Google のシニア エンジニアである Antonio Gulli が執筆した実践的なガイド『Agentic Design Patterns』の基本原則に基づいて設計されています。この重要なガイダンスにより、SAP Concur は ExpenseIt を、領収書の記載データと、領収書に記載されていないデータを推論したものを正確に経費入力できるシステムに見事に変換しました。
まず、チームはルーティング パターンを実装し、すべての領収書が AI エージェントによって処理されないようにすることで、費用とインテリジェンスの両方を最適化しました。ルーティング アーキテクチャでは、受信するタスクが分類されます。具体的には、OCR の信頼スコアが高い領収書は標準の決定論的パスにルーティングされ、スコアが低い領収書(例:「場所が不明」)は Receipt Analysis Agent に動的にルーティングされます。
次に、自己検証パターンを適用して、エージェントが基本的な chatbot のように単に回答を生成するのではなく、パリをフランスではなく米国テキサス州の街だと特定した複雑な例で見られるように、複数の情報を照合して正確な判断を下します。このパターンでは、ジェネレーターと批判者による内部ループが使用されます。つまり、モデルが仮説(「ここはフランスのパリだと思います」)を生成し、次に批判者として、その内容を確立されている事実に照らし合わせて確認します(「出張日程にはテキサス州ダラスと記載されています。したがって、この仮説は間違っている可能性が高いです」)。
最後に、エージェントはツール使用パターンに従い、Concur Travel から得られる出張日程などのグラウンディング ソースへの明示的な API アクセスを提供します。このアプローチにより、エージェントはハルシネーションを起こすことなく、正しい情報を取得できるため、システムはテキスト生成ツールではなく事実確認ツールとして機能することになります。
曖昧さに対応するアーキテクチャ: Google Cloud のエコシステムの優位性
このプロジェクトは、インテリジェント システム設計における重要な転換点を示しています。SAP Concur は、決定論的なコアとエージェントによる推論レイヤを組み合わせることで、AI の最大の価値が多くの場合、手元にあるデータの処理ではなく、不足データの推論による取得であることを証明しました。このエンジニアリングの過程でもたらされた重要な変化は、モデルの活用方法の転換でした。チームは Gemini を生成インターフェースとして活用するだけでなく、ロジック エンジンとしてデプロイするようになったからです。
SAP Concur がこうした未来を構築するために、Google Cloud との連携を選んだ理由は何でしょうか?なぜなら、エージェントの真価が、世界をどれだけ深く理解しているかに左右されるのと同様に、デジタル世界を深く理解している企業は Google の他にはないからです。
今回のリリースでは Gemini の推論能力が活用されていますが、このパートナーシップにより、市場で他に類を見ないマルチモーダルかつフルスタックのインテリジェンスの未来が実現されるでしょう。たとえば、次のようなことが可能になります。
-
実世界でのグラウンディング: エージェントが領収書と Google マップのデータを照合して、ビジネスが実際にその場所に存在することを確認できるようになります。
-
スムーズなフロー: 将来的に Google ウォレットとのインテグレーションにより取引のタイムスタンプを瞬時に照合したり、Gmail とのインテグレーションによりホテルの明細書を自動的に表示したりできるようになります。
-
エッジ インテリジェンス: Gemini Nano やサービス システム Android AICore などのモバイルの進化により、最終的には機密性の高い処理がデバイス上で直接可能になり、ユーザーはデータをスマートフォン以外に送信することなく、プライバシーを確保しながら迅速に操作できるようになります。
SAP Concur は、世界の金融取引を支える専門分野の知識を持っています。Google Cloud は、トレーニングに最適化されたカスタム設計チップ(TPU)から、ユーザーが携帯するモバイル OS まで、AI スタック全体を提供しています。
次世代エージェントを構築する準備はできていますか?
ExpenseIt のような推論エンジンを構築するために、一から作り直す必要はありません。ここで説明するアーキテクチャ パターン(ルーティング、自己検証、ツール使用)は、Google Agent Development Kit(ADK)にすでに組み込まれています。ADK は、ユーザーの皆様が「プロンプト エンジニアリング」から「システム エンジニアリング」に移行するのを支援するフレームワークとベスト プラクティスを提供します。これらは、信頼性とスケーラビリティに優れ、企業に適したエージェントを構築するためのブループリントとしてご利用いただけます。
- Google AI スペシャリスト、Matt Wilkerson
- Google 主要アカウント エグゼクティブ、Jaime Serra



