BigQuery AI: データと AI の融合が実現
Suda Srinivasan
Group Outbound Product Manager
Vaibhav Sethi
Senior Product Manager
※この投稿は米国時間 2025 年 11 月 22 日に、Google Cloud blog に投稿されたものの抄訳です。
マルチモーダル データにおける新たな分析情報の発見から、カスタマー エクスペリエンスのパーソナライズまで、AI は現代のイノベーションのエンジンとして台頭しています。AI の導入が爆発的に増加したことで、AI のライフサイクルを合理化するだけでなく、AI 主導の分析情報とワークフローの自動化を組織内のすべてのユーザーに提供するために、データと AI をより緊密に連携させる必要性が生じました。
Google は、AI をデータに導入するために BigQuery ML を開発しました。これにより、データ サイエンティストやデータ アナリストは、BigQuery 内で直接 ML モデルを構築してデプロイできます。長年にわたり、Google は AI を活用した検索、SQL を使用した生成 AI などの機能を導入することで、この基盤を強化してきました。
このたび、Google は BigQuery AI を導入します。これは、BigQuery の組み込み ML 機能、生成 AI 関数、ベクトル検索、インテリジェント エージェント、エージェント ツールを統合したものです。BigQuery AI を使用すると、次のことが可能になります。
-
生成 AI をデータに適用: シンプルな SQL 関数を使用して、Google とパートナーの AI モデルを BigQuery のマルチモーダル データに直接適用できます。
-
データを ML に取り込むプロセスを簡素化: 特徴量エンジニアリングからモデルのトレーニング、チューニング、推論、モニタリングまで、ML のライフサイクル全体を BigQuery で管理できます。データを移動する必要はありません。
-
ワークフローとアプリを迅速に作成: データ エンジニア、データ サイエンティスト、ビジネス ユーザーのいずれであっても、BigQuery に組み込まれた扱いやすいロール固有のエージェントを使用してワークフローを加速できます。
BigQuery AI の傘下にあるツールとテクノロジーについて詳しく見ていきましょう。
生成 AI でマルチモーダル データから分析情報を引き出す
最先端の AI モデルをシンプルな SQL コマンドでデータに直接適用することで、生成 AI タスクを実行できるだけでなく、マルチモーダル データからより深いセマンティック理解を得ることができます。
-
AI 関数は、LLM とエンベディング モデルを SQL クエリに直接統合し、コンテンツ生成、分析、要約、構造化データ抽出、分類、エンベディングの生成、データ拡充などのタスクを実行できるようにします。また、フィルタリング、評価、分類などのルーティン タスクに AI 関数を使用することもできます。マネージド AI 関数を使用すると、費用と品質が最適化されたモデルが BigQuery によって自動的に選択されます。
-
エンベディングと検索に関する関数や機能により、よりインテリジェントに情報を検索できます。従来のテキスト検索では、データ内の特定のキーワードをすばやく見つけることができますが、ベクトル検索では、厳密な単語だけでなく、意味やコンテキストでも検索できます。これにより、概念的に関連するアイテムを特定し、単純なキーワード検索では見逃してしまう関連情報を見つけることができます。BigQuery のエンベディングとベクトル検索は、RAG、マルチモーダル検索、データの重複排除、クラスタリング、レコメンデーション エンジンなどのユースケースを強化します。
データ処理から AI 推論までを 1 つのプラットフォームで
BigQuery ML を初めてリリースしたとき、私たちの目標は AI と ML をデータに近づけ、SQL ユーザーが BigQuery のデータに対して BigQuery で直接 ML タスクを実行できるようにすることでした。長年にわたり、Google は ML ライフサイクル全体を加速する完全なエンドツーエンド プラットフォームを提供するために、機能を拡充してきました。
企業はこれらの機能を効果的に活用しています。たとえば、PUMA は BigQuery の統合 ML 機能を使用して、手動でのセグメンテーションから手法を進化させ、購入意向に基づく高度なオーディエンス セグメントを作成しました。その結果、ML によって導き出された上位のオーディエンス セグメントでは、クリック率が 149.8% も上昇し、コンバージョン率は 4.6% 増加、平均注文額は 6% 増加するという驚くべき成果を達成しました。


BigQuery でのデータ処理から AI 推論までのワークフロー
BigQuery AI は、コードをデータに適用することで、ML ライフサイクル全体を合理化します。
-
データの移動が不要: SQL または Python を使用して、BigQuery で直接モデルをトレーニングして実行します。データの移動やインフラストラクチャの管理は不要です。
-
エンドツーエンドのライフサイクル: 特徴量エンジニアリングからモデルのトレーニング、評価、チューニング、デプロイ、推論まで、すべてを BigQuery で処理できます。専門的な ML フレームワークの知識は必要ありません。
-
モデルの柔軟性: 組み込みモデルから選択したり、AI でトレーニングしたカスタムモデルをインポートしたり、事前トレーニング済みモデル(TimesFM など)を使用してゼロショット推論を行ったりできます。
-
統合型推論: バッチ処理、リアルタイム ストリーミング、リモート推論を介して予測をシームレスに実行します。
もちろん BigQuery AI では、BigQuery Studio、AI を活用した統合 Colab Enterprise ノートブック、任意の IDE など、好みの開発環境を使用できます。
すべてのデータユーザーにエージェント エクスペリエンスを提供
BigQuery AI の傘下では、さまざまなデータ専門家のワークフローを合理化および自動化するように設計されたデータ エージェントと支援型 AI 機能も統合しています。
-
データ エンジニアリング エージェントを使用すると、要件を自然言語で記述することで、データ パイプラインを構築、変更、管理できます。平易な言葉でリクエストすると、本番環境で使用できる SQL コードに変換され、データのクリーニング、変換、スキーマ モデリングなどの複雑なタスクが自動化されます。
-
データ サイエンス エージェントは、エンドツーエンドのデータ サイエンス ワークフローの自動化を支援します。このエージェントは、複数ステップのプランを作成、コードを生成して実行し、結果について推論して、その結果を提示します。また、簡単なプロンプトで可視化データを生成したり、コードの説明や変換を行ったり、エラーの説明や自動修正を行ったりすることもできます。
-
会話型分析エージェントを使用すると、ビジネス ユーザーは技術的な障壁を回避し、自然言語で質問して、明確で実用的なインテリジェンスを得ることができます。これにより、すべてのユーザーがデータを活用できるようになります。
BigQuery は、ファーストパーティのエージェントと支援型 AI 機能に加えて、カスタム エージェントを構築し、エージェント AI をアプリケーションに統合するための強力なツールスイートも提供します。会話型分析 API は、自然言語処理機能を自社のプロダクトに組み込んで、カスタマイズされたデータ エクスペリエンスを実現するための基本要素になります。より高度なユースケースに関しては、Agent Development Kit(ADK)が複雑なマルチエージェント システムを構築してデプロイするためのフルスタック フレームワークを提供します。また、Model Context Protocol(MCP)は、AI モデルがデータベースやその他のツールと通信する方法を標準化します。
AI は私たちの生活や働き方を変えつつあり、その影響が最も顕著に表れているのが、データ プロフェッショナルが仕事に取り組む方法です。BigQuery AI は、データを AI に接続する方法を大きく前進させるものです。BigQuery AI の詳細と使用方法については、こちらのガイドをご覧ください。皆様が次に構築されるサービスを楽しみにしております。
-グループ アウトバウンド プロダクト マネージャー Suda Srinivasan
-シニア プロダクト マネージャー Vaibhav Sethi

