エージェンティック時代を支える BigQuery の新機能

Neeraja Rentachintala
Sr. Director, Product Management, Google Cloud
Tomas Talius
VP, Engineering, Google Cloud
※この投稿は米国時間 2026 年 4 月 22 日に、Google Cloud blog に投稿されたものの抄訳です。
エージェンティック時代において成功を収めるには、データ戦略の抜本的な変革が不可欠です。それは、人間が処理できる規模から、エージェント ファーストのワークロードへと移行することを意味します。また、受動的なインテリジェンスから能動的なアクションへと進化させ、生のデータをエージェントが正確に推論するためのセマンティックな知識へと昇華させなければなりません。
10 年以上にわたり、 BigQuery の継続的なイノベーションは、数万におよぶ組織がスケーラブルなデータと AI の基盤を築き、業界や技術の革新の波を乗り越えるための支援をしてきました。 現在、BigQuery は自律型のデータ & AI プラットフォームへとさらなる進化を遂げています。 Gemini によるデータ処理量は 30 倍以上に拡大し、非構造化データを処理する AI 関数は 25 倍、さらに Model Context Protocol (MCP) を活用したエージェント構築ツールは 20 倍もの成長を記録しています。
Definity のような先進的な企業は、顧客体験の向上、バックオフィス業務の効率化、そしてデータ チームの生産性向上を目指し、データ プラットフォームを構築しています。
「当社は Google Cloud 上にデータ プラットフォームを構築し、わずか 10 か月ですべての重要な保険データを取り込みました。これは業界平均の約半分という驚異的なスピードです。BigQuery の大規模データを極めて迅速に処理する技術は、実務担当者やエンジニアに高度なツールをもたらし、AI / ML が統合された先進的なプラットフォームを実現しています。その結果、短期間でユーザー数を 2 倍に増やすことができました 」 — Definity、チーフ テクノロジー オフィサー、Tatjana Lalkovic 氏
本日、 Google Cloud はレイクハウス、組み込み型 AI 処理と推論、エージェンティックな体験の 3 つの軸において、BigQuery の新機能を発表します。これらはすべて、業界をリードする価格パフォーマンスとエンタープライズ対応の信頼性へのコミットメントに基づいています。
オープンかつ境界なきクロス クラウドレイクハウスの実現
企業のデータは多くの場合、アプリケーションや複数のクラウド、オンプレミスに分散しています。初期のレイクハウス ソリューションはデータの重複を削減しましたが、エージェンティック時代には、ネイティブにマルチモーダルかつクロス クラウドで、AI に最適化された基盤が求められます。 Google Cloud は、 Apache Iceberg の相互運用性と Google 独自のインフラストラクチャを融合させ、以下の新機能を提供します。
-
Managed Iceberg tables in Lakehouse(一般提供、旧称 BigLake): Iceberg のオープン性に、自動テーブル管理、Iceberg パーティショニング、マルチテーブル・トランザクション、CDC(変更データキャプチャ)、高度なベクトル化、履歴ベースの最適化といった BigQuery の高度な機能を融合させます。
-
Iceberg REST Catalog: BigQuery、Spark、その他 OSS やサードパーティ エンジン間において、Iceberg テーブルの読み書きの相互運用性(プレビュー)を実現します。これにより、複雑なエンジンに伴う複雑なトレードオフに悩まされることはありません。
-
Cross-cloud Lakehouse(プレビュー): BigQuery の AI と分析機能を、AWS や Azure をはじめとする他のクラウドへ拡張します。Iceberg REST Catalog などのオープン スタンダード、 Cross-Cloud Interconnect による広帯域ネットワーク、透過的なキャッシュ技術を活用することで、他社ネイティブのデータウェアハウスと同等のパフォーマンスと TCO(総保有コスト)を実現。真のクロスクラウド体験を提供します。
-
カタログ フェデレーション(プレビュー): AWS Glue、Databricks、SAP、Salesforce、Snowflake、Confluent Tableflow(年内公開予定)にわたるデータの探索、分析、ゼロコピー共有を容易にします。
-
リアルタイム データ レプリケーション:Spanner 、AlloyDB 、Cloud SQL から BigQuery テーブル(一般提供)および Iceberg(プレビュー)へデータを即座に複製可能にすることで、ローデータの取り込みからビジネス アクションまでのサイクルを迅速化します。


SQL または自然言語を使用して、BigQuery と AWS 上の Iceberg テーブルにまたがるデータを分析
レイクハウスに関する最新のイノベーションの詳細はこちらをご参照ください。
エンタープライズ エージェントのためのグラフベースの推論
AI が複雑で多段階の運用課題を解決するには、ビジネス ロジックがデータ プラットフォーム層まで深く浸透している必要があります。このレイヤーでロジックを定義することで、データの取り込みから消費に至るまで、定義の一貫性とガバナンスが担保されます。BigQuery Graph(プレビュー)は、こうしたコンテキストを活性化させる基盤を提供し、データ実務者がエンティティ、リレーションシップ、およびビジネス ロジックをデータ プラットフォーム内に直接マッピングできるようにします。これにより、 AI エージェントを統制された現実に即した形で定着させ、高度な課題を大規模かつ一貫した精度で解決できるようになります。
AI 推論を強化する新しいグラフ機能を発表します。
-
BigQuery Graph における指標(メジャー)のネイティブ サポート(プレビュー): 分析指標(メジャー)とデータ間のリレーションシップを、統制された一つのエンティティとして統合できます。これにより、データを「ビジネスマップ」へと変換し、マルチホップな構造的推論を可能にします。エージェントは単なる検索を超えて、あるビジネスイベントが他にどのような波及効果(リップルエフェクト)をもたらすかまでを追跡できるようになります。
-
BigQuery Conversational Analytics におけるグラフ サポート(プレビュー): 対話型分析エージェントが生のテーブルではなく、確定的なビジネス マップを参照することで、回答精度が飛躍的に向上します。エージェントは指標を用いて正確な KPI を即座に算出すると同時に、複雑な関係性をたどって数値の背景にある理由を明らかにできます。
-
BigQuery Graph と Looker の統合(プレビュー): グラフを Looker ビューとして公開することで、BigQuery で定義した指標をデータ スタック全体で再利用できます。また、ソース管理と検証機能を備えた Looker を使用して BigQuery Graph を定義することも可能です。この相互運用性により、解約率などの重要指標がダッシュボードと AI エージェントの両方で一致することを保証します。
-
BigQuery Studio におけるビジュアル モデリング体験(プレビュー): エージェントのコンテキストを支えるエンティティ、リレーションシップ、ビジネス ロジックを直感的に構築および管理できるインターフェースを提供します。


BigQuery Graph を活用した Conversational Analytics Agents による、自然言語でのデータ分析
構造化、非構造化データの価値を引き出すネイティブな AI 処理
データはもはや行と列に限定されません。エージェントが求めているのは、データのコピーや移動を強いることなく、構造化データと非構造化データの双方を大規模に処理できるプラットフォームです。BigQuery AI は、 170 以上の基盤モデルへの組み込みアクセスにより、予測 ML タスク(需要予測、異常検知、レコメンデーションなど)や生成 AI タスク(画像やテキストからのエンティティ抽出、コンテンツ生成、データ拡張など)を容易に実行します。
-
AI.PARSE_DOCUMENT(プレビュー): OCR(光学文字認識)、レイアウト解析、チャンク分割を自動化する単一の SQL 関数により、複雑なドキュメント処理ワークフローを簡素化します。
-
TabularFM モデル(プレビュー): 大規模な特徴量選択、チューニング、トレーニング、モデル管理を必要とせず、高品質な回帰および分類機能を BigQuery にもたらします。
-
ObjectRef(一般提供): SQL および Python を使用して、構造化データとともに非構造化データを処理できます。これにより、ナレッジ カタログ上に直接、リッチでマルチモーダルなコンテキストを構築する基盤が整います。
-
最適化モード(プレビュー): AI.CLASSIFY や AI.IF などの SQL 優先の AI 共同処理マネージド関数において、タスク固有のモデルをオンザフライでトレーニングし、従来の生成 AI の行単位の処理と比較して、トークン消費量を 230 分の 1 に削減します。
-
BigQuery ネイティブの Gemma エンベディング(プレビュー): 標準的な CPU 上で高品質なエンベディングを大規模に生成できます。
-
自律的なエンベディング生成(一般提供): 非構造化データのパイプラインをフルマネージド化し、新しいデータが取り込まれる度にベクトル インデックスを自動的に同期します。
-
BigQuery ハイブリッド検索(プレビュー): セマンティック検索と全文検索を単一の関数に統合し、 RAG や複雑な探索において極めて高い精度を実現します。
-
Python UDF(一般提供): フルマネージドな Python スカラー関数により、データの拡張、変換、クリーニングが可能になります。独自のコードやライブラリを持ち込むことができ、サーバーレスな実行環境によって数百万行規模まで自動スケールします(今後数週間にわたって段階的に展開予定)。
-
Connected Sheets: BigQuery のスケールを Google スプレッドシート上で利用可能にします。新たに TimesFM モデルによる予測(一般提供)と異常検知(プレビュー)に対応しています。
-
地理空間分析データセット(プレビュー): インフラ資産や道路管理のインサイトなどの地理空間データに BigQuery から直接アクセス可能になりました。複雑なデータ加工なしに、エンタープライズ データと組み合わせて深い分析が行えます。


BigQuery における非構造化データへのアクセス、処理および活用
エージェンティックな体験
AI は、定型的で時間のかかるタスクを肩代わりすることで、高度なスキルを持つデータ チームがインパクトの大きい戦略的イニシアチブに集中できる環境を整えます。 Google Cloud は、 Google の基盤研究、高性能なモデル、専用ツールを BigQuery に直接統合し、データ ライフサイクルのあらゆる段階で自動化と支援を提供します。
-
Conversational Analytics in BigQuery(一般提供): 自然言語を用いて複雑なデータセットへのクエリが可能になります。安全かつ透明性の高い形でインサイトを得られるだけでなく、予測分析や構造化および非構造化データを横断した推論もサポートします。BigQuery Studio に加え、 Data Studio(プレビュー)、 Gemini Enterprise(プレビュー)、またはカスタム アプリケーション用 API(一般提供)から利用可能です。


Conversational Analytics in BigQuery により、自然言語を用いてデータからインサイトを取得
- プロアクティブなエージェンティック ワークフロー(プレビュー): 単なる質問への回答を超えて、指標の変化を検知し、根本原因分析を行って理由を説明し、定期的な調査レポートをメールで直接配信します。


BigQuery におけるプロアクティブなエージェント ワークフロー
-
BigQuery Agent Analytics: ADK(一般提供)および LangGraph(プレビュー)フレームワーク用のプラグインを提供し、エージェントのアクティビティを BigQuery に記録して、トラブルシューティング、最適化、評価に役立てることができます。
-
BigQuery Studio: リソース探索やトラブルシューティングをサポートするコンテキスト認識型アシスタント(プレビュー)をはじめ、SQL と DataFrames を統合する SQL Cells(一般提供)、ノートブック内で直接ビジュアルを作成する Visualization Cells(一般提供)など、新しい生産性向上のためのツールを追加しました。Files Explorer(一般提供)により、開発者はフォルダ形式でコード資産を整理、共有、管理することが可能になります。さらに、 BigQuery Notebooks における Git 連携とワークフロー(プレビュー)を導入し、データサイエンスのワークフローにおいて GitHub、GitLab、Bitbucket、Azure DevOps を網羅する包括的な SCM カバレッジを提供します。
-
Data Science Agent(一般提供): BigQuery ノートブックにおいて、目標を自然言語で入力するだけで、 BigQuery ML 、 DataFrames 、または Spark を使用したデータのロード、クリーニング、視覚化の計画を自動実行します。
-
Colab Data Apps(プレビュー): ノートブックでの分析を、共有可能なフルマネージドのインタラクティブ Python アプリケーションに変換します。
-
BigQuery remote MCP server(一般提供)および BigQuery ADK toolset(一般提供)は、エージェントのための手動によるデータベース コネクタ作成の手間を大幅に軽減します。
-
Google Cloud Data Agent Kit(プレビュー): 環境を問わず利用可能な一連のスキル、 Model Context Protocol(MCP)ツール、環境固有の拡張機能、およびネイティブ プラグインを統合したスイートを提供します。VS Code、Gemini CLI、Codex、Claude Code など、開発者が普段利用している環境に寄り添うことで、Data Agent Kit は IDE、ノートブック、あるいはターミナルをネイティブなデータ環境へと変貌させます。これにより、使用している環境から広範なデータ ワークフローのオーケストレーションが可能になり、BigQuery、dbt、Apache Spark、Apache Airflow などの適切なフレームワークを自動的に選択して、本番環境に対応したコードを生成します。
圧倒的なパフォーマンスとスケール
現代の分析ワークロードは予測が難しく、分散化が進んでいます。Google Cloud は、データの増大がコストや運用のオーバーヘッドに直結しないよう、BigQuery のコア エンジンの強化に投資を続けています。
-
Fluid scaling(一般提供): コストとパフォーマンスをトレードオフを必要としない、高度なオートスケーリング モデルです。変動の激しいワークロードでも秒単位の課金を実現し、最大 34% のコスト削減を可能にします。
-
高度なランタイム、小規模クエリ、履歴ベースの最適化(一般提供): コードやスキーマの変更なしに、ネイティブおよび Iceberg ワークロードを加速させます。BigQuery は、クエリ処理コストを前年比で 40% 削減しつつ、クエリ速度を 35% 向上させました。
-
新しいワークロード管理機能: 予約グループ(一般提供)、柔軟な動的割り当て(プレビュー)などにより、詳細なコスト配分と価格パフォーマンスの制御を簡素化します。
-
可観測性の向上(一般提供): ミッション クリティカルなワークロードに対して柔軟なディザスタ リカバリ機能を提供します。エージェントによる可観測性(プレビュー)やセキュリティ センター(プレビュー)により、運用とアクセス制御をさらに簡素化します。


予測困難なワークロードに対応する BigQuery の Fluid scaling
エージェンティック時代において、 BigQuery は単にデータが存在する場所ではありません。データが考え、推論し、行動するための場所です。よりオープンで自律的、そしてパワフルなデータの未来が今ここにあります。
BigQuery へのデータ移行特典を活用して、データと AI ジャーニーを今すぐ始めましょう。皆様のイノベーションの成果を伺えることを楽しみにしています。

