コンテンツに移動
デベロッパー

Agent Factory のハイライト: データ エンジニアリングとデータ サイエンスのための AI エージェント

2025年11月19日
https://storage.googleapis.com/gweb-cloudblog-publish/images/ai-agents-for-data-engineering-data-scienc.max-2500x2500.png
Lucia Subatin

Developer Advocate

Smitha Kolan

Senior Developer Relations

※この投稿は米国時間 2025 年 10 月 29 日に、Google Cloud blog に投稿されたものの抄訳です。

The Agent Factory の最新のエピソードへようこそ。このポッドキャストでは、話題の AI を実際に使ったプロダクション レディな AI エージェントの構築について取り上げます。今回のエピソードでは、データ エージェント全般について、そしてそれがデータ エンジニアやデータ サイエンティストにもたらす変革の力について Lucia Subatin が解説しました。また、ナレッジへのアクセスを改善するグラフ データベースと AI の革新的な用途も紹介しました。

Video Thumbnail

この投稿では、今回の話題から主なアイデアをいくつか紹介します。トピックの要点をつかんだり、リンクやタイムスタンプを利用して特定の部分を詳しく調べたりするためにご活用ください。

エージェントにまつわる業界の動向

タイムスタンプ: [01:45]

今週、エージェント業界では画期的なリリースが話題になっています。

  • Gemini API の Computer Use モデル: AI エージェントがコンピュータ画面を「見て」操作できるようにするこの新しいモデルは、スクリーンショットを撮影し、UI 操作(クリック、スクロール、入力、ウェブページのオープン)を決定して実行します。これにより、AI エージェントはフォームの入力やユーザーフローのテストといった実際のブラウザタスクを自動化できます。堅牢な安全レイヤが組み込まれており、すべての操作で安全チェックが行われるとともに、危険な操作には人間の確認が必須となっています。ポッドキャストでは、ドキュメント ページで料金情報を検索するデモも行いました。
https://storage.googleapis.com/gweb-cloudblog-publish/images/computer-use-model-demo.max-2200x2200.png
  • CodeMender - コードセキュリティのための AI エージェント: この AI エージェントは、新しい脆弱性が発生したときに自律的にパッチを適用(事後対応)し、既存のコードを書き換えて欠陥のあるクラス全体を保護(事前対応)するように設計されています。Gemini Deep Think の推論能力が活用され、静的分析やファジングなどの自己修正ツールを備えた CodeMender は、高品質のセキュリティ パッチの作成と検証を大規模に自動化します。すでに 72 件のセキュリティ修正をオープンソース プロジェクトに反映しており、ソフトウェア セキュリティの大きなブレークスルーとなっています。

The Factory Floor

「The Factory Floor」は、このポッドキャストの実践演習コーナーです。ここでは、概念的な内容からライブのデモに移り、実用的なコードを紹介しました。

BigQuery データ エンジニアリング エージェント

https://storage.googleapis.com/gweb-cloudblog-publish/images/data-engineering-agent.max-2200x2200.png

タイムスタンプ: [06:44]

BigQuery データ エンジニアリング エージェントは、BigQuery 内で直接データ パイプラインの作成と管理を自動化する強力なツールです。

  • 販売地域の生成: エージェントを使用して、billing_country に基づいて accounts テーブルに新しい sales_region フィールドを追加する方法をデモしました。この方法では、BigQuery の AI_GENERATE 関数を利用して、SQL ステートメントから Gemini 2.5 Flash を呼び出します。

  • 時間ディメンション テーブルの作成: 次に、エージェントに包括的な time_dimension テーブルを生成するように指示しました。これは、すぐに利用できる日付要素(年、四半期、月名)を提供して分析を容易にするためのもので、自然言語から SQL クエリへの変換に不可欠です。

  • データ品質アサーションの自動化: 最後に、エージェント アプリケーションのデータのクリーンさと信頼性を維持するために、すべてのテーブルのデータ品質アサーション(検証ルール)を自動的に生成して、ID が null でないことやアカウント名が一意であることを保証する機能を紹介しました。

データ サイエンス エージェント

https://storage.googleapis.com/gweb-cloudblog-publish/images/data-science-agent.max-2200x2200.png

タイムスタンプ: [07:24]

次に、Colab Enterprise 内で動作するデータ サイエンス エージェントを使って、分析情報を抽出してエージェント アプリケーション用のデータを準備しました。

  • 異常検出: 「Case」テーブルの異常を検出するようエージェントに指示しました。エージェントは、データの読み込みと説明、異常検出のための前処理、分離フォレスト モデルのトレーニング、可視化からなる一連の計画を立てました。

  • 異常なレコードの特定: エージェントは計画を実行した後、異常なレコードを特定し、調査結果の概要を提示しました。さらに、正常なデータポイントと異常なデータポイントの分離を視覚的に示しました。また、エージェントは異常の根本原因を理解するための分析情報と次のステップも提供し、これらはデータ収集プロセスの改善に非常に役立ちました。

ADK を使用して Spanner のコンセプトから漫画を作成する

タイムスタンプ: [26:01]

非常にユニークなデモを行い、グラフ データベースと AI を組み合わせてクリエイティブ コンテンツを生成する方法を紹介しました。

  • Spanner Graph Database: グラフ機能を備えたグローバルに分散された強整合性データベースとして Spanner を取り上げ、Spanner のドキュメントから構築される、GQL でトラバース(走査)可能なグラフ データベースを紹介しました。

  • ナレッジ トラバーサルと漫画の生成: 「リージョンとは何ですか?」という質問に答えるために、ナレッジ エージェントが ADK アプリケーションを使用して Spanner グラフ データベースをトラバースしました。取得した情報に基づいて 別のエージェントが画像生成モデル Nano Banana 用の詳細なプロンプトを生成し、Spanner リージョンについて説明する 6 コマの漫画を生き生きとした技術イラスト スタイルで作成しました。この漫画では、リージョン、デュアル リージョン、マルチ リージョンの各構成を視覚的に説明しています。

以下は、「インターリーブとは何ですか?」という質問に答える、エージェントが生成した別の漫画の例です。

https://storage.googleapis.com/gweb-cloudblog-publish/images/blog_post_image.max-600x600.png

正確な情報を取得するだけでなく、魅力的なビジュアル コンテンツに変換できるエージェントの能力は驚くべきものでした。プロセスを繰り返して、生成画像のテキストのわかりやすさを改善することも可能でした。

デベロッパー向け Q&A 

タイムスタンプ: [38:49]

最後に、デベロッパー コミュニティから寄せられた素晴らしい質問をいくつか紹介しました。

データ サイエンス エージェントとデータ エンジニアリング エージェントの提供状況について

タイムスタンプ: [38:53]

データ サイエンス エージェントとデータ エンジニアリング エージェントはどちらも現在プレビュー版です。データ サイエンス エージェントは公開プレビュー版で、データ エンジニアリング エージェントには特別なリンクからアクセスできます(説明欄に記載)。今すぐご利用いただけますので、ぜひお試しください。

データ エンジニアリング エージェントのスケーラビリティとデプロイについて

タイムスタンプ: [39:33]

データ エンジニアリング エージェントは、スケーラビリティの高いプラットフォームである BigQuery と Dataform を活用します。実行のベースとなるパイプラインに必要な権限があれば、複数のテーブル、データセット、プロジェクトにわたって分析を実行できます。より上位の環境(ステージング、本番)へのデプロイでは、Dataform がさまざまなプロジェクトとデータセットの組み合わせにわたってリリースおよび構成できる宣言型アーティファクトを生成することで、データ パイプラインのライフサイクルを支援します。これにより、堅牢なソフトウェア デリバリー ライフサイクルが確保されます。

データエージェントとクリエイティブ AI の世界に触れた、大変興味深いエピソードでした。このエピソードが、これらの革新的なツールを活用したデータ ワークフローの強化と魅力的なコンテンツ生成の可能性を探るきっかけになれば幸いです。よりクリーンなデータ パイプラインの構築、より深い分析情報の抽出、複雑なコンセプトの表現を AI を活用して実現する力が、まさにあなたの手の中にあります。

構築してみる

実際に使ってみる準備はできましたか?以下のリンクからリソースにアクセスして、独自のデータエージェントと AI 搭載アプリケーションの構築を始めましょう。実践的なデモをすべて確認するには、エピソード全体をご覧ください。

担当者のソーシャル メディア

 

Lucia Subatin デベロッパー アドボケイト

Smitha Kolan シニア デベロッパー リレーションズ

投稿先