エージェント時代におけるリアルタイム データ イノベーションの認識
Chai Pydimukkala
Product Lead, Dataplex, Data Sharing and Data Integration
Shan Kulandaivel
Product Lead, Streaming
※この投稿は米国時間 2025 年 12 月 13 日に、Google Cloud blog に投稿されたものの抄訳です。
今日、多くの組織が業務に使用しているデータは、サイロ化された接続性のない以前のシステムに閉じ込められ、数日または数時間が経過したデータです。しかし、AI の台頭により、これらの環境を統合し、音声、動画、テキスト ファイルの非構造化データを利用する必要性と機会が生まれています。これらの非構造化データは、合わせて企業データの 80% 以上を占め、リアルタイムのデータに基づいたビジネス上の意思決定を可能にします。AI を活用するデータチームは、複雑なワークフローやアプリの自動化、企業データへのグラウンディング、マルチモーダル データに関するリアルタイムの分析情報の活用、AI に対する信頼を醸成する基盤の構築など、新たな課題にも直面しています。
Google のデータクラウドは、組織のデータ基盤全体を統合し、インテリジェントなアプリケーションとエージェント機能を実現するように設計された、AI ネイティブのプラットフォームです。データクラウドは、Google のインフラストラクチャ、インテリジェンス、データ プラットフォームを、データ処理用の Gemini、メタデータ管理とガバナンスの自動化、開発者向けの柔軟なワークフローといった先駆的な AI 技術と統合することで、お客様が統合の課題ではなく、イノベーションとビジネス成果に集中できるようにしています。
このたび、Google は 2025 年 Gartner® Magic Quadrant™ データ統合ツール部門でリーダーに選出されました。これは、データクラウドがデータ統合ツールと緊密に連携し、AI に対するビジョン、特にマルチモーダル データ処理やスケーラブルで効率的なベクトル化といった顧客ユースケースに対応していることを実証するものだと考えています。また、「The Forrester Wave™: Streaming Data Platforms, Q4 2025」でもリーダーに選出されました。このブログ投稿では、この大手アナリスト企業 2 社から評価される要因になったと思われる、最新のアップデートとイノベーションについてご紹介します。
Gemini を活用したインテリジェンスで生産性を向上
データ エージェントは、自動化機能、インテリジェンス機能、自然言語機能を日常のワークフローに取り入れることで、さまざまなデータロールの業務に革命をもたらしています。たとえば、データのクエリと可視化を効率化したいデータ アナリストも、よりスマートなアプリケーションを構築したいデベロッパーも、モデル開発を加速させたいデータ サイエンティストも、エージェントを活用することで、反復作業を合理化し、生産性を向上させることができます。データ エンジニアは自動化されたデータ準備とパイプライン管理の恩恵を受け、ML エンジニアはモデルのデプロイやモニタリングの効果を高められます。分析情報を得るためにこれまで技術チームに頼っていたビジネス ユーザーも、自然言語を使用してデータを直接操作できるようになります。
データ エンジニアリング向けの BigQuery で使用する Gemini の最新のイノベーションでは、データの取り込み、変換、検証を行うデータ パイプラインの構築が自動化されています。これには、データ クリーニング、重複除去、フォーマット、標準化、結合、集計などのデータ変換や、ルールと標準を適用するためのデータ品質管理が含まれます。これらの機能を基に、データ エンジニアリング エージェントは、標準的な統合パターンをインテリジェントに自動化し、パイプラインの健全性をプロアクティブにモニタリングして、生産性をさらに向上させています。
マルチモーダルな自動化とガバナンスで効率を向上
マルチモーダル データの自律型ベクトル エンベディングを使用することで、AI アプリケーションを構築する際の摩擦を解消します。BigQuery ベクトル検索の機能を利用すれば、データチームはベクトル エンベディングを更新する必要なく、複雑なデータ パイプラインを構築、管理、維持できます。BigQuery では、ユーザーの意図を企業データに結び付けるエージェント向けの機能が追加され、この処理が自動的に行われるようになりました。この機能はすでに、Morrisons の店舗内商品検索システムなどの顧客システムを強化しており、忙しい日には 50,000 件の顧客検索を処理しています。
また、Google は、オーケストレーションや AI を活用したサービスなど、データ プラットフォームが AI のリアルタイムの頭脳として機能するよう、組織を支援しています。ガバナンスは、データや AI における成功の基盤となるものです。レイク、ウェアハウス、運用システムにまたがる分散データが当たり前の昨今、統合ガバナンスなしにインテリジェンスを実現することは不可能です。
新しい自動カタログ化機能 Dataplex Universal Catalog を使用すると、データチームは幅広いソースからメタデータの検出、取り込み、インデックス登録を行えるため、データのカタログ化にかかる労力を最小限に抑え、データと AI の状況をほぼリアルタイムで把握できます。Dataplex は、ユニバーサル カタログの通常の範囲を超えて、データチームとエージェントにコンテキストを提供します。Gemini を活用して、関係性を継続的に導き出し、ビジネス セマンティクスを自動生成することで、AI エージェントに信頼できるリアルタイムのコンテキストを提供できるようにしています。
Ericsson は Dataplex を使用して、データの分類、所有権、保持ポリシー、機密性ラベルなど、統一されたビジネス用語をユーザーに提供しています。これにより、さまざまなデータペルソナがデータの出所を即座に把握できるため、信頼性が向上し、調査時間が短縮されます。
ワークロードを最適化して幅広いユーザビリティを実現
クラウド環境とハイブリッド環境にまたがるデータの管理は断片的になりがちで、費用のかかる非効率性、冗長なストレージ、複雑なデータ移動につながる可能性があります。
そこで、ビジュアル パイプラインは、デベロッパーの生産性を向上させるメタデータ駆動型のアプローチを採用し、パイプラインの設計、デプロイ、管理、モニタリングをユーザーがコードなしで行えるようにしています。また、BigQuery のデータ準備機能が強化されたことで、データ パイプラインのクリーニング、構造化、拡充、構築を単一のプラットフォームで行えるようになっています。
検索拡張生成(RAG)ユースケースをサポートする ML 変換では、最新のイノベーションにより、ML モデルへのモデル推論がリアルタイムまたはバッチで強化されています。また、マルチモーダル データのライブラリとフレームワークがサポートされているため、データチームは単一のパイプラインで複数のモデルを活用して、精度と再現率を向上させることができます。
AI のためにリアルタイムのデータとコンテキストを統合
エージェントが効果的に機能するにはコンテキストが必要であり、静的または古い情報に依存している場合、その効果は著しく制限されます。ユーザーとビジネスに真に役立つ正確な意思決定を行うには、システムとユーザーの現在の状態にリアルタイムでアクセスすることが必要です。昨年、Google は Managed Service for Apache Kafka をリリースしました。これは、運用データとトランザクション データを AI およびデータ プラットフォームに統合し、AI エージェントを強化できるようにするサービスです。今年は、Apache Kafka Connect、VPC Service Controls、相互 TLS 認証、Kafka アクセス制御といった重要なエンタープライズ機能を導入しました。これにより、MadHive などのお客様はわずか数か月で本番環境にデプロイできるようになりました。また、新しいストリーミング アーキテクチャを可能にするため、Pub/Sub にユーザー定義関数(UDF)のサポートを追加しました。これにより、メッセージ(JSON など)を BigQuery などの宛先に送信する前に変換し、ストリーミング データに対してカスタム ロジック、検証、エンリッチメントを実行できるようになったため、Pub/Sub パイプラインがより強力で柔軟になります。さらに、並列更新、マネージド I/O、Google Cloud TPU サポート、投機的実行などの重要な機能を追加することで、高度な統合ストリーミングおよびバッチ処理エンジンである Dataflow を強化しました。これにより、AI 対応のデータ処理のパワーを、継続的な ML 特徴抽出やリアルタイムでの不正検出といった高度なストリーム処理のユースケースに活用できるようになります。
データ統合とストリーミングの勢い
Google データクラウド チームにとって多忙な 1 年でしたが、Gartner と Forrester の最近のレポートで評価されたことを光栄に思います。Google は、今後も革新を続け、お客様のデータ変換の取り組みに協力できることを楽しみにしています。
Forrester がリサーチに関する発行物に掲載されている特定の企業、製品、ブランド、サービスを推奨することはありません。また、当該発行物に記載されている評価に基づいて、特定の企業またはブランドの製品またはサービスを選択するよう個人に助言することもありません。情報は、利用可能な最適なリソースに基づいて示されます。内容はその時点での判断によるものであり、変更される可能性があります。詳しくは、Forrester の客観性に関するこちらの説明をご覧ください。
Gartner、Magic Quadrant for Data Integration Tools、Michele Launi、Nina Showell、Robert Thanaraj、Sharat Menon、2025 年 12 月 8 日。
Gartner は、リサーチに関する発行物に掲載されている特定のベンダー、製品、サービスを推奨することはありません。また、最高の格付けまたはその他の評価を得たベンダーのみを選択するように助言することもありません。Gartner のリサーチに関する発行物は、Gartner のリサーチ&アドバイザリ組織の見解を表したものであり、事実を表現したものではありません。Gartner は、明示または黙示を問わず、本リサーチの商品性や特定の目的への適合性を含め、いかなる保証も行いません。
GARTNER は、米国およびその他の国における Gartner, Inc. またはその関連会社の登録商標およびサービスマークであり、MAGIC QUADRANT は、Gartner, Inc. またはその関連会社の登録商標であり、許可を得て使用しています。著作権はすべて同社に帰属します。
-Dataplex、データ共有およびデータ統合担当プロダクト リード Chai Pydimukkala
-ストリーミング担当プロダクト リード Shan Kulandaivel



