Google Cloud Next Tokyo:7/30、31 東京ビッグサイトにて開催!

AI データ分析エージェント

エージェント型 AI でデータ分析ワークフローを強化

インテリジェント データ分析エージェントは、ワークフローの簡素化、チームの力を引き出し、インサイトの迅速な取得を可能にします。

概要

AI エージェントとは

AI エージェントは、AI を使用してユーザーの代わりに目標を追求し、タスクを完了させるソフトウェア システムです。推論、計画、メモリーが可能であることが示されており、意思決定、学習、適応を行うレベルの自律性を備えています。 詳しくは、AI エージェントをご覧ください。

AI エージェントはデータ分析にどのように活用できますか?

AI エージェントは、データチームがデータのクリーニングやラベル付けなどの反復タスクを自動化するのに役立つほか、ビジネス ユーザーが自然言語を使用してデータを分析し、結果を予測することを可能にします。これにより、さまざまなチームが単純作業から解放され、より価値の高い戦略的イニシアチブに集中できるようになります。その結果、組織全体で分析情報を迅速に得られるようになり、イノベーションが加速され、AI をより効率的にスケーリングできるようになります。

データ分析に AI エージェントを活用できるユーザー

AI エージェントは、データ組織全体にわたって強力な味方として機能します。

  • データ エンジニア: 自然言語プロンプトを使用してパイプラインの作成とメンテナンスを自動化
  • データ サイエンティスト: データ ラングリング、モデル評価、特徴量エンジニアリングを効率化
  • アナリストとビジネス ユーザー: 平易な英語で質問するだけで、専門的なコーディングを必要とせずに、インサイトを即座に取得して可視化を生成

Google Cloud で AI データ分析エージェントを構築する理由

  • 統合された AI ネイティブの基盤: Google Cloud のプラットフォームは、サイロ化されたツールの集合体ではなく、分析データと運用データの間の隔たりを取り除く単一の統合環境です。
  • リアルタイムのビジネス コンテキスト: この統合により、エージェントはビジネスを包括的かつリアルタイムに把握できるようになり、エージェントの有効性を高めるうえで必要不可欠です。
  • コンテキスト グラウンディング: エージェントは、メタデータ、スキーマ、リネージを使用して、特定のデータ環境にグラウンディングされ、精度とビジネス定義との整合性を確保します。

仕組み

Google Cloud は、データ エンジニアリング、データ サイエンス、分析のワークフローを自動化するために設計された、ファーストパーティの専用エージェントを提供します。さらに、柔軟な API を使用して、これらのエージェントを既存のプラットフォームに直接埋め込んだり、独自のデータの課題に対処するカスタム エージェントを開発したりできます。

データ分析用 AI エージェント
一般的な使用例

自動化されたデータ エンジニアリング

複雑で時間のかかるデータ エンジニアリング タスクを自動化

BigQuery のデータ エンジニアリング エージェントは、Gemini を活用したインテリジェントなアシスタントであり、単純なコード補完を超えて、エンドツーエンドのタスク自動化を実現します。これは、ユーザーの特定のデータ環境に基づいており、Knowledge Catalog(旧 Dataplex)のメタデータを使用して、スキーマ、リネージ、ビジネス定義を把握します。関連するデータセットの検出、複雑な SQL 生成や PySpark 変換、Dataform や Cloud Composer を介したジョブのオーケストレーションなど、データ ライフサイクル全体を自律的に処理できます。破損したパイプラインの修復、レガシーコードのドキュメント化、古いデータ ウェアハウスからのクエリの移行など、データ エンジニアリングの「トイル」が自動化されることで、データ エンジニアの役割は「手作業でコーディングする人」から「AI を活用したワークフローを監督するアーキテクト」へと変わります。

データ エンジニアリング エージェントの概要
複雑で時間のかかるデータ エンジニアリング タスクを自動化

BigQuery のデータ エンジニアリング エージェントは、Gemini を活用したインテリジェントなアシスタントであり、単純なコード補完を超えて、エンドツーエンドのタスク自動化を実現します。これは、ユーザーの特定のデータ環境に基づいており、Knowledge Catalog(旧 Dataplex)のメタデータを使用して、スキーマ、リネージ、ビジネス定義を把握します。関連するデータセットの検出、複雑な SQL 生成や PySpark 変換、Dataform や Cloud Composer を介したジョブのオーケストレーションなど、データ ライフサイクル全体を自律的に処理できます。破損したパイプラインの修復、レガシーコードのドキュメント化、古いデータ ウェアハウスからのクエリの移行など、データ エンジニアリングの「トイル」が自動化されることで、データ エンジニアの役割は「手作業でコーディングする人」から「AI を活用したワークフローを監督するアーキテクト」へと変わります。

データ エンジニアリング エージェントの概要

「このエージェントは、新しい開発アプローチを模索できるソリューションを提供し、複雑なデータ エンジニアリング タスクに対応できる大きな可能性を示しています。SCD Type 2 ディメンションの作成といった高度なデータ モデリング タスクでも、要件を正確に解釈する優れた能力を発揮します。現時点でも、メンテナンスや小規模な最適化の自動化によってすでに価値をもたらしており、将来的には真に際立ったツールへと進化するための基盤が整っていると考えています。」- スペイン語のニュースとエンターテイメント グループ PRISA リードデータ エンジニア Fernando Calo 氏

「Dataform 環境への移行の過程で、データ エンジニア エージェントは既存のすべてのデータと変換スクリプトを 100% 自動的に複製し、手作業による介入なしで処理することに成功しました。この取り組みにより、手作業による ETL 移行に通常かかる時間を 90% 短縮し、移行プロセスを大幅に加速させることができました。」- Vodafone、エンジニアリング責任者 Chris Benfield 氏

プロセスのドキュメント化は、デベロッパーにとって負担の大きい作業であることが多いですが、Dataform Data Engineering Agent を使用すると、この作業が完全に自動化されます。このエージェントは、当社が定義した基準とスタイルに従って、直接 Dataform プロジェクト ファイルから正確にドキュメントを生成できました。これにより、変更が加えられてもドキュメントを常に最新の状態に保つことができ、ドキュメント ワークフローでの手動作業は不要になりました。大きな可能性を秘めたツールであることがわかりました。」 - アルゼンチンの大手通信会社、データ エンジニア、Maximiliano Morales 氏

    データ サイエンスの加速

    データ探索、モデル評価、MLOps を加速

    BigQuery のデータ サイエンス エージェントは、データの探索、変換、ML モデリングを容易にするエージェント機能を備えており、データ サイエンス開発を加速します。

    エージェントは、簡単なプロンプトだけで、データの読み込み、探索、クリーニング、可視化、特徴量エンジニアリング、データの分割、モデルのトレーニングや最適化、評価など、データ サイエンス モデリングのあらゆる要素を網羅する詳細なプランを生成します。エージェントでエラーが発生した場合も、自動修正を行い、それを修正するための新しいコードを生成することが可能です。ユーザーは完全な制御を維持できるため、ステップごとに承認を行ったり、必要に応じて手動で編集したりできます。

    また、エージェントはユーザーのノートブックのコンテキストを完全に認識し、既存のコード、出力、変数を理解したうえで、計画の各ステップに合わせてカスタマイズされたコードを提供するため、ユーザーは既存のコードに対して反復的な変更を加えることができます。

    データ サイエンス エージェントの GIF
    AI でデータ サイエンス ワークフローを簡素化
    データ探索、モデル評価、MLOps を加速

    BigQuery のデータ サイエンス エージェントは、データの探索、変換、ML モデリングを容易にするエージェント機能を備えており、データ サイエンス開発を加速します。

    エージェントは、簡単なプロンプトだけで、データの読み込み、探索、クリーニング、可視化、特徴量エンジニアリング、データの分割、モデルのトレーニングや最適化、評価など、データ サイエンス モデリングのあらゆる要素を網羅する詳細なプランを生成します。エージェントでエラーが発生した場合も、自動修正を行い、それを修正するための新しいコードを生成することが可能です。ユーザーは完全な制御を維持できるため、ステップごとに承認を行ったり、必要に応じて手動で編集したりできます。

    また、エージェントはユーザーのノートブックのコンテキストを完全に認識し、既存のコード、出力、変数を理解したうえで、計画の各ステップに合わせてカスタマイズされたコードを提供するため、ユーザーは既存のコードに対して反復的な変更を加えることができます。

    データ サイエンス エージェントの GIF
    AI でデータ サイエンス ワークフローを簡素化

    「データ サイエンス エージェントは、当社のデータ サイエンス チームにとって画期的なツールです。シンプルな自然言語の指示を受け取り、それを複数ステップのデータ サイエンス コードに変換して実行することで、ワークフローを効率化します。コードをゼロから記述する必要はなくなりました。コード補完、エラー修正、自然言語ベースのビジュアリゼーションなどの機能により、AI がデータ サイエンティストの生産性を高める存在であることを実感しています。」- Snap Inc. データ サイエンティスト Lorraine Zheng 氏

      BigQuery の会話型分析

      BigQuery の分析情報をデータチームが利用できるようにする

      BigQuery の会話型分析は、高度な AI 搭載の推論エンジンです。データチームが、直感的な自然言語のやり取りを通じてビジネス上の質問と信頼できる回答のギャップを埋められるようにすることで、「分析のボトルネック」を解消します。

      最新の Gemini モデルを搭載したこのエージェントは、単純な翻訳を超えて、生成されたすべての結果が社内のビジネス定義と完全に一致するようにします。これは、組織の既存のデータアセット(具体的には、メタデータ、テーブルと列の説明、ビジネス用語集、ユーザー定義関数など)にロジックをグラウンディングすることで行います。エージェントは、単純なレポート作成にとどまらず、BigQuery AI を使用して将来の結果を予測し、オブジェクト テーブル内の画像などの非構造化データを解釈して、隠れた情報を実用的なインテリジェンスに変えます。

      BigQuery の会話型分析の GIF
      データ アナリストが分析情報を引き出す方法を簡素化

        ヒント: AI エージェントは、分析データと運用データの隔たりを解消し、ビジネスをリアルタイムで統合的に把握できる場合に最も効果を発揮します。

        BigQuery の分析情報をデータチームが利用できるようにする

        BigQuery の会話型分析は、高度な AI 搭載の推論エンジンです。データチームが、直感的な自然言語のやり取りを通じてビジネス上の質問と信頼できる回答のギャップを埋められるようにすることで、「分析のボトルネック」を解消します。

        最新の Gemini モデルを搭載したこのエージェントは、単純な翻訳を超えて、生成されたすべての結果が社内のビジネス定義と完全に一致するようにします。これは、組織の既存のデータアセット(具体的には、メタデータ、テーブルと列の説明、ビジネス用語集、ユーザー定義関数など)にロジックをグラウンディングすることで行います。エージェントは、単純なレポート作成にとどまらず、BigQuery AI を使用して将来の結果を予測し、オブジェクト テーブル内の画像などの非構造化データを解釈して、隠れた情報を実用的なインテリジェンスに変えます。

        BigQuery の会話型分析の GIF
        データ アナリストが分析情報を引き出す方法を簡素化

          ヒント: AI エージェントは、分析データと運用データの隔たりを解消し、ビジネスをリアルタイムで統合的に把握できる場合に最も効果を発揮します。

          「BigQuery の会話型分析により、Pet Circle のチームがデータとやり取りする方法がさらに加速しました。チームが複雑なデータに関する質問を自然言語で行えるようになったことで、分析情報を得るまでの時間が大幅に短縮されました。当社のデータチームは、非技術系チームのためにエージェントを作成できるようになり、非技術系チームはデータドリブンな意思決定をより迅速に行えるようになりました。最終的には、ペットの飼い主により良いエクスペリエンスを提供できるようになります。」 - Pet Circle CEO、Alistair Venn 氏

            Looker の会話型分析

            データとチャットする

            Looker の会話型分析は、ビジネス ユーザーが自然言語を使用して回答を見つけられるようにすることで、ビジネス インテリジェンスを簡素化します。これにより、データ アナリストの負担が軽減され、より迅速かつ自信を持って意思決定を行えるようになります。ビジネス ユーザーは、複雑なフィールド名を理解する必要なく、プロダクトのパフォーマンスやトラフィックの傾向について直接質問できます。

            単純なクエリ処理を超え、包括的なライフサイクル管理フレームワークを提供するほか、エンタープライズ レベルのセキュリティとユーザー管理機能を利用レイヤに直接組み込んでいます。Looker のユニバーサル セマンティック レイヤは、データのコンテキスト、定義、関係性のための一元的なハブを作成することで、収益や顧客離れなどの指標について社内で一貫性を保つことができます。

            Looker の会話型分析の概要
            データとチャットする

            Looker の会話型分析は、ビジネス ユーザーが自然言語を使用して回答を見つけられるようにすることで、ビジネス インテリジェンスを簡素化します。これにより、データ アナリストの負担が軽減され、より迅速かつ自信を持って意思決定を行えるようになります。ビジネス ユーザーは、複雑なフィールド名を理解する必要なく、プロダクトのパフォーマンスやトラフィックの傾向について直接質問できます。

            単純なクエリ処理を超え、包括的なライフサイクル管理フレームワークを提供するほか、エンタープライズ レベルのセキュリティとユーザー管理機能を利用レイヤに直接組み込んでいます。Looker のユニバーサル セマンティック レイヤは、データのコンテキスト、定義、関係性のための一元的なハブを作成することで、収益や顧客離れなどの指標について社内で一貫性を保つことができます。

            Looker の会話型分析の概要

            「効果的な会話型分析は、監査済みの統合データレイヤーから始まります。チームが同じデータ言語を使用していない場合、AI システムはクエリを正確に解釈したり、的確な分析情報を提示したりできません。」- Promevo、最高技術責任者 John Pettit 氏

            「私たちのビジョンは、何が起こったかをお客様が確認できるようにするだけでなく、データと対話して、IRIS Fleet やその他の製品内でインテリジェントな推奨事項を受け取れるようにすることです。真のチャンスは始まったばかりです。」 - Métrica Móvil、プロダクトおよびデジタル トランスフォーメーション責任者 Gerardo Ortiz 氏

              Conversational Analytics(会話分析)API

              エージェント ワークフローをアプリケーションに統合する

              Conversational Analytics API により、信頼できるデータアクセスとスケーラブルで信頼性の高いデータ モデリングに支えられた自然言語のクエリ機能を、カスタム アプリケーション、社内ツール、ワークフローに埋め込めるようになります。これは、Looker と BigQuery のすぐに使える会話型エクスペリエンスを支える API と同じものです。

              Conversational Analytics API を使用すると、Looker の信頼できるセマンティック モデルによる正確性の確保、BigQuery のエージェントへの重要なビジネスおよびデータ コンテキストの提供が可能となり、これらを活用してデータ、グラフ、テキストの形式の回答を提供するカスタム データ エクスペリエンスを構築できます。この機能を埋め込むことにより、直感的なデータ エクスペリエンスを創出し、自然言語による複雑な分析を実現できます。また、Agent Development Kit を使用して、オーケストレーター エージェントの「ツール」として会話分析エージェントをオーケストレートすることもできます。

              会話型分析 API の概要
              エージェント ワークフローをアプリケーションに統合する

              Conversational Analytics API により、信頼できるデータアクセスとスケーラブルで信頼性の高いデータ モデリングに支えられた自然言語のクエリ機能を、カスタム アプリケーション、社内ツール、ワークフローに埋め込めるようになります。これは、Looker と BigQuery のすぐに使える会話型エクスペリエンスを支える API と同じものです。

              Conversational Analytics API を使用すると、Looker の信頼できるセマンティック モデルによる正確性の確保、BigQuery のエージェントへの重要なビジネスおよびデータ コンテキストの提供が可能となり、これらを活用してデータ、グラフ、テキストの形式の回答を提供するカスタム データ エクスペリエンスを構築できます。この機能を埋め込むことにより、直感的なデータ エクスペリエンスを創出し、自然言語による複雑な分析を実現できます。また、Agent Development Kit を使用して、オーケストレーター エージェントの「ツール」として会話分析エージェントをオーケストレートすることもできます。

              会話型分析 API の概要

              エージェント開発ツール

              AI エージェントがデータを操作する方法を合理化

              Google Cloud のエージェント開発ツールにより、ADK と MCP の統合手法を通じて、デベロッパーがカスタム データベース コネクタを構築する必要性を減らします。

              BigQuery 用 MCP サーバーにより、AI エージェントと MCP クライアントがスキーマを解釈し、BigQuery データに対してクエリを実行できるようになります。また、データをコンテキスト ウィンドウに移動する際のセキュリティやガバナンスのリスク、レイテンシを軽減できます。

              柔軟性と制御性を高めるには、MCP ツールボックスを使用します。これは、ツールセットのホスティングと管理を一元化するオープンソース サーバーであり、エージェント アプリケーションをデータベースとの直接的なやり取りから切り離します。また、Gemini CLIAntigravity などのさまざまな IDE やデベロッパー ツールでも利用できるため、AlloyDBBigQuerySpannerLooker などのサービスに AI エージェントを安全に接続できます。

              さらに、BigQuery ADK 統合ツールセットには、エージェントの自律的な操作を可能にする、すぐに使用可能な関数が含まれており、自然言語を使用して、データの探索、スキーマの理解、クエリと予測の実行、分析情報の取得などを行うことができます。

              データとエージェントの統合ツール
              エージェントをエンタープライズ データに接続
              AI エージェントがデータを操作する方法を合理化

              Google Cloud のエージェント開発ツールにより、ADK と MCP の統合手法を通じて、デベロッパーがカスタム データベース コネクタを構築する必要性を減らします。

              BigQuery 用 MCP サーバーにより、AI エージェントと MCP クライアントがスキーマを解釈し、BigQuery データに対してクエリを実行できるようになります。また、データをコンテキスト ウィンドウに移動する際のセキュリティやガバナンスのリスク、レイテンシを軽減できます。

              柔軟性と制御性を高めるには、MCP ツールボックスを使用します。これは、ツールセットのホスティングと管理を一元化するオープンソース サーバーであり、エージェント アプリケーションをデータベースとの直接的なやり取りから切り離します。また、Gemini CLIAntigravity などのさまざまな IDE やデベロッパー ツールでも利用できるため、AlloyDBBigQuerySpannerLooker などのサービスに AI エージェントを安全に接続できます。

              さらに、BigQuery ADK 統合ツールセットには、エージェントの自律的な操作を可能にする、すぐに使用可能な関数が含まれており、自然言語を使用して、データの探索、スキーマの理解、クエリと予測の実行、分析情報の取得などを行うことができます。

              データとエージェントの統合ツール
              エージェントをエンタープライズ データに接続

              概念実証を開始する

              新規のお客様には、BigQuery で使用できる無料クレジット $300 分を差し上げます

              BigQuery の詳細

              データ分析設計パターン

              BigQuery サンドボックスでは、クレジット カードなしでデータをクエリできます

              データ分析技術ガイド

              よくある質問

              データ分析の 4 つのタイプとは何ですか。

              AI エージェントは、データ分析の 4 つの従来の柱を強化します。

              • 記述的: 何が起こったかを説明する(CSV を要約する例)
              • 診断的: なぜそれが起こったのかを説明する(例: トラフィック減少の根本原因を特定する)
              • 予測的: 何が起こるかを予測する(例: トレンドの予測)
              • 処方的: 次に何をすべきかを提案する(例: 予算配分の見直しを提案する)

              定義はさまざまですが、AI エージェントは一般的に複雑さと動作によって分類されます。

              1. 単純な反射エージェント
              2. モデルベースの反射エージェント
              3. 目標ベースのエージェント
              4. 効用ベースのエージェント
              5. 学習エージェント
              6. 階層エージェント
              7. マルチエージェント システム(複数の特化型エージェントが連携して機能)

              エージェントは、元データの取り込み、クリーンアップ、分析計画の生成、処理に必要なスクリプトの作成、最終レポートや可視化の作成など、プロセス全体を処理することで「ループを閉じる」ことができます。手動での介入は不要です。

              通常、デベロッパーは LangChainGoogle Cloud の Agent Development Kit(ADK)といったフレームワークを使用します。このプロセスでは、LLM をデータソースに接続し、「ツール」(Python インタープリタや SQL エグゼキュータなど)を与え、推論を導くシステム プロンプトを定義します。

              • Google Cloud プロダクト
              • 100 種類を超えるプロダクトをご用意しています。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。また、すべてのお客様に 25 以上のプロダクトを無料でご利用いただけます(毎月の使用量上限があります)。
              Google Cloud