コンテンツに移動
データ分析

BigQuery の自律型エンべディング生成で AI ワークフローを簡素化

2026年3月5日
Andong Li

Software Engineer

Brian Seung

Software Engineer

Try Gemini Enterprise Business Edition today

The front door to AI in the workplace

Try now

※この投稿は米国時間 2026 年 2 月 20 日に、Google Cloud blog に投稿されたものの抄訳です。

生成 AI や検索拡張生成(RAG)の世界において、エンべディングは、マシンや AI エージェントがデータのセマンティックな意味を理解できるようにするための「秘訣」です。BigQuery がデータを AI につなげる自律型プラットフォームの能力を拡張する中で、エンべディングによって価値の高いマルチモーダル ユースケースが実現します。しかし、多くのデータエンジニアにとって、エンベディングの管理は頭痛の種です。従来、ユーザーはソース コンテンツの更新、エンベディングの生成、保存の伝播のために、エンベディング生成パイプラインを自身で設定する必要がありました。

このたび、BigQuery ユーザーの AI ワークロードを支援するために、自律型エンベディング生成機能を発表しました。この機能により、BigQuery ではソース列に基づいてテーブルのエンベディング列を自動的に維持できます。手動パイプラインの必要性や同期の問題もなくなり、AI 対応のデータを簡単に活用できるようになります。

エンベディングの管理(従来の方法)

自律型の生成ではない従来の方法では、ベクトル検索データベースを更新するプロセスは通常、以下のような流れでした。

  1. ソーステーブルの新しい行を検出する。

  2. AI.EMBED などの関数を使用してエンベディングを生成する。

  3. レート制限と再試行を処理する。

  4. 新しいベクトルで宛先テーブルを更新する。

  5. エンベディング生成の進行状況をモニタリングする。

データが頻繁に変更される場合、これらのベクトルを同期し続けることは、ユーザーや管理者にとって大きな負担になる場合があります。このような背景を踏まえ、以下の機能によって BigQuery を強化することを検討しました。

1. ユーザーがデータを直接操作できるようにする

ユーザーの検索エクスペリエンスを簡素化し、AI.SEARCH(TABLE mydataset.products, 'product_description', "A really fun toy") のような簡単な操作を、エンべディングを理解したり操作したりすることなく実行できるようする。

2. 自動同期

BigQuery がユーザーに代わってエンベディングの生成を管理し、生成されたエンベディングをソースデータと同期させる。

3. ベクトル インデックスとの緊密な統合

BigQuery の VECTOR_SEARCH は多くのユーザーに利用されているため、マネージド エンベディングがこの機能に統合されることを保証する。

解決策: 自律的に生成されるエンベディング列

エンべディングをテーブルの管理対象の一部として扱うことで、この問題を解決しました。これにより、使い慣れた SQL 構文を使用して、BigQuery が管理する自律型エンべディング列を定義できるようになりました。

読み込んでいます...

 詳細については、こちらのガイドをご覧ください。

ベクトル インデックスやベクトル検索との統合

さらに、BigQuery のベクトル インデックスベクトル検索も、生成されたエンベディング列と統合されます。ソースデータ列に関連付けられたベクトル インデックスを直接作成でき、エンべディングを手動で管理することなくデータをクエリできます。BigQuery は、ベーステーブルのモデルを自動的に適用して、クエリと互換性のあるエンべディングを生成します。

AI.SEARCH の導入

また、データ中心の検索エクスペリエンスを簡単に開始できるように、新たに AI.SEARCH 関数をリリースしました。AI.SEARCH は、ベーステーブルから生成されたエンベディング列に関連付けられたエンベディング モデルを自動的に使用するため、AI.SEARCH や VECTOR_SEARCH を使用する際にエンベディング構成を操作する必要がありません。

読み込んでいます...

シンプルな管理

自律型エンベディング生成は、現在プレビュー版を提供しています。データ分析パイプラインの一部として今すぐご利用いただけます。また、プロセスをエンドツーエンドで簡単に管理できるようにする以下のような機能も導入しています。

  • エンベディング ステータス メタデータ: テーブル内の null 以外のエンベディングの割合をクエリすることで、エンベディング生成の進行状況を追跡できます。

読み込んでいます...

ベクトル インデックスの作成はいつでも開始できますが、インデックス モデルの生成は、パフォーマンス向上が見込まれる規模に達した場合にのみ実行されます。

  • Vertex AI モデルへのネイティブ アクセス: BigQuery 接続に Vertex AI ユーザーのロールを付与することで、エンベディング生成が、ユーザーの代わりにリモートの最先端の Vertex AI エンベディング モデルと安全に「通信」できるようになります。

  • ネイティブ エラー モニタリング: エンべディング生成パイプラインのいずれかのステップが失敗した場合、INFORMATION_SCHEMA ジョブビュー()で最近のバックグラウンド ジョブのステータスを確認できます。このビューには、問題を解決するのに役立つ詳細なエラー情報が表示されます。

今後の予定

自律型エンベディング生成の取り組みは、あらゆる種類のデータの処理や有効化に対応した AI ネイティブのマルチモーダル データ基盤への移行を表すものです。データ プラットフォーム内でエンベディング生成を自動化して結合することで、実装作業に費やすデベロッパーの負担を減らし、インテリジェントなアプリケーション構築に注力できるよう支援します。また、現在も以下のような機能の開発に取り組んでいます。

  • データ定義ライブラリ(DDL)とデータ制御言語(DCL)による接続作成の簡素化

  • 生成されたエンベディング列を既存のテーブルに追加する機能(ALTER TABLE ADD COLUMN DDL 経由)

  • 生成されたエンべディング列を管理する API と UI のサポート

  • ObjectRef を使用したマルチモーダル データの直接サポート

準備はよろしいですか?BigQuery の公式ドキュメントをご参照ください。マネージド エンべディング テーブルのセットアップを今すぐ始めましょう。

- ソフトウェア エンジニア、Andong Li

- ソフトウェア エンジニア、Brian Seung

投稿先