デベロッパー

Agent Factory のハイライト: データエンジニアリングとデータサイエンスのための AI エージェント

2025年11月19日

https://storage.googleapis.com/gweb-cloudblog-publish/images/ai-agents-for-data-engineering-data-scienc.max-2500x2500.png

Lucia Subatin

Developer Advocate

Smitha Kolan

Senior Developer Relations

※この投稿は米国時間 2025 年 10 月 29 日に、Google Cloud blog に投稿されたものの抄訳です。

The Agent Factory の最新のエピソードへようこそ。このポッドキャストでは、話題の AI を実際に使ったプロダクションレディな AI エージェントの構築について取り上げます。今回のエピソードでは、データエージェント全般について、そしてそれがデータエンジニアやデータサイエンティストにもたらす変革の力について Lucia Subatin が解説しました。また、ナレッジへのアクセスを改善するグラフデータベースと AI の革新的な用途も紹介しました。

この投稿では、今回の話題から主なアイデアをいくつか紹介します。トピックの要点をつかんだり、リンクやタイムスタンプを利用して特定の部分を詳しく調べたりするためにご活用ください。

エージェントにまつわる業界の動向

タイムスタンプ: [01:45]

今週、エージェント業界では画期的なリリースが話題になっています。

Gemini API の Computer Use モデル: AI エージェントがコンピュータ画面を「見て」操作できるようにするこの新しいモデルは、スクリーンショットを撮影し、UI 操作（クリック、スクロール、入力、ウェブページのオープン）を決定して実行します。これにより、AI エージェントはフォームの入力やユーザーフローのテストといった実際のブラウザタスクを自動化できます。堅牢な安全レイヤが組み込まれており、すべての操作で安全チェックが行われるとともに、危険な操作には人間の確認が必須となっています。ポッドキャストでは、ドキュメントページで料金情報を検索するデモも行いました。

https://storage.googleapis.com/gweb-cloudblog-publish/images/computer-use-model-demo.max-2200x2200.png

CodeMender - コードセキュリティのための AI エージェント: この AI エージェントは、新しい脆弱性が発生したときに自律的にパッチを適用（事後対応）し、既存のコードを書き換えて欠陥のあるクラス全体を保護（事前対応）するように設計されています。Gemini Deep Think の推論能力が活用され、静的分析やファジングなどの自己修正ツールを備えた CodeMender は、高品質のセキュリティパッチの作成と検証を大規模に自動化します。すでに 72 件のセキュリティ修正をオープンソースプロジェクトに反映しており、ソフトウェアセキュリティの大きなブレークスルーとなっています。

The Factory Floor

「The Factory Floor」は、このポッドキャストの実践演習コーナーです。ここでは、概念的な内容からライブのデモに移り、実用的なコードを紹介しました。

BigQuery データエンジニアリングエージェント

https://storage.googleapis.com/gweb-cloudblog-publish/images/data-engineering-agent.max-2200x2200.png

タイムスタンプ: [06:44]

BigQuery データエンジニアリングエージェントは、BigQuery 内で直接データパイプラインの作成と管理を自動化する強力なツールです。

販売地域の生成: エージェントを使用して、billing_country に基づいて accounts テーブルに新しい sales_region フィールドを追加する方法をデモしました。この方法では、BigQuery の AI_GENERATE 関数を利用して、SQL ステートメントから Gemini 2.5 Flash を呼び出します。
時間ディメンションテーブルの作成: 次に、エージェントに包括的な time_dimension テーブルを生成するように指示しました。これは、すぐに利用できる日付要素（年、四半期、月名）を提供して分析を容易にするためのもので、自然言語から SQL クエリへの変換に不可欠です。
データ品質アサーションの自動化: 最後に、エージェントアプリケーションのデータのクリーンさと信頼性を維持するために、すべてのテーブルのデータ品質アサーション（検証ルール）を自動的に生成して、ID が null でないことやアカウント名が一意であることを保証する機能を紹介しました。

データサイエンスエージェント

https://storage.googleapis.com/gweb-cloudblog-publish/images/data-science-agent.max-2200x2200.png

タイムスタンプ: [07:24]

次に、Colab Enterprise 内で動作するデータサイエンスエージェントを使って、分析情報を抽出してエージェントアプリケーション用のデータを準備しました。

異常検出: 「Case」テーブルの異常を検出するようエージェントに指示しました。エージェントは、データの読み込みと説明、異常検出のための前処理、分離フォレストモデルのトレーニング、可視化からなる一連の計画を立てました。
異常なレコードの特定: エージェントは計画を実行した後、異常なレコードを特定し、調査結果の概要を提示しました。さらに、正常なデータポイントと異常なデータポイントの分離を視覚的に示しました。また、エージェントは異常の根本原因を理解するための分析情報と次のステップも提供し、これらはデータ収集プロセスの改善に非常に役立ちました。

ADK を使用して Spanner のコンセプトから漫画を作成する

タイムスタンプ: [26:01]

非常にユニークなデモを行い、グラフデータベースと AI を組み合わせてクリエイティブコンテンツを生成する方法を紹介しました。

Spanner Graph Database: グラフ機能を備えたグローバルに分散された強整合性データベースとして Spanner を取り上げ、Spanner のドキュメントから構築される、GQL でトラバース（走査）可能なグラフデータベースを紹介しました。
ナレッジトラバーサルと漫画の生成: 「リージョンとは何ですか？」という質問に答えるために、ナレッジエージェントが ADK アプリケーションを使用して Spanner グラフデータベースをトラバースしました。取得した情報に基づいて別のエージェントが画像生成モデル Nano Banana 用の詳細なプロンプトを生成し、Spanner リージョンについて説明する 6 コマの漫画を生き生きとした技術イラストスタイルで作成しました。この漫画では、リージョン、デュアルリージョン、マルチリージョンの各構成を視覚的に説明しています。

以下は、「インターリーブとは何ですか？」という質問に答える、エージェントが生成した別の漫画の例です。

https://storage.googleapis.com/gweb-cloudblog-publish/images/blog_post_image.max-600x600.png

正確な情報を取得するだけでなく、魅力的なビジュアルコンテンツに変換できるエージェントの能力は驚くべきものでした。プロセスを繰り返して、生成画像のテキストのわかりやすさを改善することも可能でした。

デベロッパー向け Q＆A

タイムスタンプ: [38:49]

最後に、デベロッパーコミュニティから寄せられた素晴らしい質問をいくつか紹介しました。

データサイエンスエージェントとデータエンジニアリングエージェントの提供状況について

タイムスタンプ: [38:53]

データサイエンスエージェントとデータエンジニアリングエージェントはどちらも現在プレビュー版です。データサイエンスエージェントは公開プレビュー版で、データエンジニアリングエージェントには特別なリンクからアクセスできます（説明欄に記載）。今すぐご利用いただけますので、ぜひお試しください。

データエンジニアリングエージェントのスケーラビリティとデプロイについて

タイムスタンプ: [39:33]

データエンジニアリングエージェントは、スケーラビリティの高いプラットフォームである BigQuery と Dataform を活用します。実行のベースとなるパイプラインに必要な権限があれば、複数のテーブル、データセット、プロジェクトにわたって分析を実行できます。より上位の環境（ステージング、本番）へのデプロイでは、Dataform がさまざまなプロジェクトとデータセットの組み合わせにわたってリリースおよび構成できる宣言型アーティファクトを生成することで、データパイプラインのライフサイクルを支援します。これにより、堅牢なソフトウェアデリバリーライフサイクルが確保されます。

データエージェントとクリエイティブ AI の世界に触れた、大変興味深いエピソードでした。このエピソードが、これらの革新的なツールを活用したデータワークフローの強化と魅力的なコンテンツ生成の可能性を探るきっかけになれば幸いです。よりクリーンなデータパイプラインの構築、より深い分析情報の抽出、複雑なコンセプトの表現を AI を活用して実現する力が、まさにあなたの手の中にあります。