Next ‘26 でのストリーミング AI に関する発表
Jagdeep Singh
Director Product Management
Prateek Duble
Group Product Manager
※この投稿は米国時間 2026 年 5 月 19 日に、Google Cloud blog に投稿されたものの抄訳です。
データは、ありとあらゆるデバイス、ユーザー、マイクロサービスで生成されます。このデータを取り込み、意味とインサイトを抽出し、リアルタイムでビジネス上の意思決定を推進することで、変革的なビジネス価値を生む可能性が高まります。リアルタイム分析に内在する課題も、エージェント型 AI の急発展で克服のチャンスが現実のものとなっています。エージェント型 AI は導入加速の大きな可能性を秘めていますが、ユーザーはリアルタイム データを効果的に活用するうえで、以下の新しい課題に直面しています。
-
コンテキストのリアルタイム実装が困難。開発チームは通常、データベースの定期的な同期やスケジュールされた更新など、バッチ処理的アプローチでデータを取り込みます。このため、エージェントは、古いデータに依存するか、メモリを大量に消費するコンテキスト ウィンドウを必要とします。この「コンテキストの時差」は、不正行為の検出、e コマースの動的なおすすめ表示、サプライ チェーンの自律的な調整など、せっかくのリアルタイム エージェント タスクの効果を帳消しにしてしまいます。
-
リアルタイム システムは柔軟性に欠ける。エージェント ツールには、お客様固有の要件に適応するためのモジュール性が欠けており、組織は難しいアーキテクチャの選択を迫られます。データ実務者は、レイテンシ、精度、費用のトレードオフを自由に選択できるプラットフォームを必要としています。
これらの課題に対応するために Google Cloud は、緊密に統合された統一ストリーミング データ プラットフォームを提供しています。このプラットフォームは、フルマネージドの Google Cloud ネイティブ サービスとオープンソース互換サービスの両方を提供し、大規模な AI トレーニングと推論をサポートします。このプラットフォームを構成する 5 つの主要サービスは以下のとおりです。
-
Pub/Sub: メッセージングとイベント ストリーミングのための、信頼性の高いサーバーレスなフルマネージド サービスで、BigQuery、Dataflow、Cloud Storage と統合されています。Pub/Sub は Anthropic をはじめとする多くの組織で利用されています。
-
Dataflow: バッチ、ストリーミングのための、そして今やエージェント型 AI を支えるサーバーレス エンジンです。Waymo や Google マップなどの Google サービス同様、Palo Alto Networks などの大手企業にも採用されています。たとえば、Waymo 車両は Dataflow を使用して周囲の状況を「把握」し、ルートを計画したり、障害物を予測したりします。自動車が実際に道路を走行する前に、シミュレータで数百万マイルを「走行」し、Dataflow でトレーニング データセットを生成して自動運転に使用されるモデルを検証します。
-
Managed Service for Apache Kafka: 信頼性、安全性、費用対効果に優れたオープンソースのストリーミング ストレージ兼データ統合システム Apache Kafka を、Google Cloud 上で実行するためのフルマネージド サービスです。大企業からスタートアップまで、Apache Kafka は重要なトレーニング データと AI エージェント コンテキストのリアルタイム更新のステージング ロケーションとして利用されています。
-
BigQuery: リアルタイムの取り込みと分析のための統合プラットフォーム。Storage Write API が、1 回限りの配信セマンティクスとストリームレベルのトランザクションで、BigQuery と Lakehouse for Apache Iceberg のテーブルに高スループット ストリーミングを提供します。さらに、BigQuery の継続的クエリでは、AI.GENERATE_TEXT などの生成関数を呼び出すことで、データ パイプライン内で直接リアルタイムの AI 推論が可能になり、データが取り込まれると同時に分析情報を得ることができます。
-
Bigtable: Google の NoSQL リアルタイム データベース。継続的なマテリアライズド ビューを使用して Pub/Sub と Dataflow からのストリーミング データを自動的に処理し、結果を数秒で提供します。Bigtable のインメモリ階層を使用して低レイテンシでサービス提供できるようにします。
インサイトから自律的アクションへと進化
Google Cloud Next '26 では、ストリーミング AI 機能セットの Agentic Data Cloud への追加が発表されました。これにより、自律型エージェントに即座にコンテキストが提供され、リアルタイムのアクションが可能になります。つまり、組織は AI エージェントにリアルタイムのコンテキストをフィードできるようになります。
たとえば、サプライ チェーン エージェントは、IoT データをモニタリングするだけでなく、悪天候を避けてルートを自律的に変更したり、配送先の倉庫と納期の許容範囲を再調整して顧客のポータルを更新したりできます。しかも、これらすべてが、人間の監督者が問題に気づく前に実行されるのです。また、金融サービス エージェントは、不正なトランザクション パターンを特定し、即座にアカウントを凍結して、お客様が希望する手段で連絡を取ってから新しいカードの発送を手配してくれます。これらすべてが、不審なアクティビティが発生してから数秒以内に遂行されます。これらの機能は、検索を強化するためにストリーミング データのエンベディングを作成する場合でも、マルチエージェントによる高度な不正行為検出システムを構築する場合でも、強力な新しい武器となります。
これらの新機能について詳しく見ていきましょう。
新しいストリーミング AI 機能
Next ‘26 で発表された新機能は、Google Cloud のストリーミング データ プラットフォームに 3 つの主要分野にわたって緊密に統合されています。


1. エージェントにリアルタイムで豊富なコンテキストを提供
1.1. Pub/Sub AI 推論 SMT(一般提供): Pub/Sub を介してストリーミングされたメッセージに対して推論を実行できるようになりました。データ実務者は、Gemini Enterprise Agent Platform で利用可能なモデルを自由に選択できます。Pub/Sub が推論を呼び出し、各メッセージに結果を追加してダウンストリームへと送ります。Pub/Sub のシンプルさと Gemini Enterprise のフルマネージド ツールとが効果的に融合します。
1.2. Pub/Sub Bigtable サブスクリプション (プレビュー版): Pub/Sub データを Bigtable に直接ストリーミングします。Pub/Sub Bigtable サブスクリプションは、Pub/Sub トピックからイベントデータを直接 Bigtable テーブルにマテリアライズするため、カスタム パイプラインが不要になり、ストリーミング アーキテクチャを大幅に簡素化します。たとえば、ベクトル エンベディングを Bigtable に簡単に取り込み、セマンティック検索ワークロードを強化できます。
1.3. BigQuery 継続的クエリのステートフル データ処理(プレビュー版): BigQuery の継続的クエリで JOIN を使用して複数のデータ ストリーム間の複雑な相関関係を特定し、タンブリング ウィンドウ集計を使用して一定の時間間隔で指標を計算できるようになりました。たとえば、30 分間の平均値の計算や、異なるストリーム間のイベントの関係付けなどの高度な分析を、データが BigQuery に取り込まれると同時に直接行うことができます。さらに、AI.GENERATE_TEXT などの生成関数を呼び出すことで、AI をデータ パイプラインに直接統合できます。また、継続的クエリの SQL 結果を BigQuery テーブルにマテリアライズしたり、リアルタイムのリバース ETL のために Bigtable、Spanner、Pub/Sub などの運用シンクにエクスポートしたりできます。
2. エージェントに指示してリソースを管理
2.1. Pub/Sub、Managed service for Apache Kafka、Bigtable、BigQuery の Model Context Protocol(MCP)サポート(一般提供): エージェントが、フルマネージドの MCP エンドポイントを使用して、Pub/Sub、Managed service for Apache Kafka サービス、BigQuery を管理できるようになりました。エージェントは Pub/Sub にメッセージをパブリッシュすることもできます。
2.2. ADK インテグレーション(一般提供): エージェントが、事前構築された ADK インテグレーションを通じて、Pub/Sub、Bigtable、BigQuery、その他の Google Cloud サービスに保存されたリアルタイム データとやり取りできるようになりました。このため、デベロッパーはリアルタイムのコンテキストに基づいて動作するエージェントを、複雑な構成やパイプライン調整の作業なしで構築できます。
3. マルチエージェント システムとデータ処理の統合
3.1. イベント ドリブンな自律エージェント: ワークフローの中核をエージェントが担うようになると、リアルタイムのデータ パイプラインを進化させてエージェントをストリームに直接組み込む必要が生じます。Google Cloud では、エージェント ロジックを Dataflow パイプライン内で第一級の対象として扱うことで、これを実現しました。これにより、Agent Development Kit(ADK)を使用してエージェント コードを組み込み、RunInference 変換と新しい ADKAgentModelHandler を使用して、特別ノードとしてデプロイできるようになりました。このアプローチには主に次のメリットがあります。
-
優れたスケーラビリティ: Dataflow のアーキテクチャを活用して、アップストリームで高速のイベントを処理し、数百のエージェント セッションを同時にアクティブに保ちます。各セッションは個々に特定の受信イベントによって起動されます。
-
事前処理の効果: Dataflow が複雑なデータ拡充の作業を一手に引き受け、エージェントに「すぐに行動可能」のコンテキストを受け渡して、エージェントが推論に集中できるようにします。
3.2. Dataflow 統合エンベディング シンク: 統合エンベディングの生成プロセスをデータストリーム内に直接組み込み、「コンテキストのタイムラグ」を解消しました。これにより、Dataflow を使用して、受信データを高次元ベクトルに低レイテンシで変換できるようになりました。さらに、このリアルタイム エンベディングは、Cloud Spanner(組み込みベクトル検索の新機能を搭載)と AlloyDB を含む、拡張された高スループットのベクトル シンク スイートにシームレスにマテリアライズされます。これにより、セマンティック検索のニーズに対応する最新のベクトル データベースが利用可能になります。また、RAG 呼び出しを行う自律エージェントは、即座に検索可能で完全に同期された長期記憶を利用できるようになります。この機能は、リモートモデルとローカルモデルの両方で動作します(例: Gemma)。
Google Cloud は今後もプラットフォームを拡充し続け、より緊密な統合とより強力な機能をお客様にお届けしてまいります。皆様がこれらの新機能を活用して次に何を生み出すのか、楽しみにしております。
- プロダクト管理担当ディレクター、Jagdeep Singh
- グループ プロダクト マネージャー、Prateek Duble


