このページは Cloud Translation API によって翻訳されました。

Vertex AI Feature Store について

Vertex AI Feature Store は、Vertex AI に不可欠なクラウドネイティブのマネージド Feature Store サービスです。このサービスでは、ML の特徴管理とオンラインサービングプロセスが合理化されます。特徴データを BigQuery のテーブルまたはビューで管理し、BigQuery データソースから直接オンラインで提供することができます。

Vertex AI Feature Store は、特徴データソースを指定してオンラインサービングを設定できるリソースをプロビジョニングします。その後、BigQuery データソースとやり取りするメタデータレイヤとして機能します。最新の特徴値を BigQuery から直接提供し、低レイテンシでオンライン予測を実現します。

Vertex AI Feature Store では、特徴データを含む BigQuery テーブルまたはビューがまとまってオフラインストアを形成します。過去の特徴データを含む特徴値をオフラインストアで維持できます。すべての特徴データが BigQuery で保持されるため、Vertex AI Feature Store で Vertex AI 内に別のオフラインストアをプロビジョニングする必要はありません。また、オフラインストアのデータを使用して ML モデルをトレーニングする場合は、BigQuery の API と機能を使用して、データをエクスポートまたは取得できます。

Vertex AI Feature Store を使用してオンラインサービングを設定し、開始するワークフローは次のようになります。

BigQuery でデータソースを準備します。
省略可: 特徴グループと特徴を作成してデータソースを登録します。
オンラインストアリソースと特徴ビューのリソースを設定して、特徴データソースをオンラインサービングクラスタに接続します。
特徴ビューから最新の特徴値をオンラインで提供します。

Vertex AI Feature Store のデータモデルとリソース

このセクションでは、Vertex AI Feature Store の次の側面に関連するデータモデルとリソースについて説明します。

BigQuery でのデータソースの準備
特徴レジストリの設定
オンラインサービングの設定
オンラインサービング

BigQuery でのデータソースの準備

Vertex AI Feature Store は、オンラインサービング中に BigQuery データソースの特徴データを使用します。特徴レジストリまたはオンラインサービングリソースを設定する前に、特徴データが 1 つ以上の BigQuery テーブルまたはビューに保存されている必要があります。

BigQuery のテーブルまたはビュー内の各列は 1 つの特徴を表します。各行には一意の ID に対応する特徴値が含まれます。BigQuery で特徴データを準備する詳しい方法については、データソースを準備するをご覧ください。

たとえば、図 1 の BigQuery テーブルには次の列があります。

f1 と f2: 特徴列
entity_id: 特徴レコードを識別する一意の ID を含む ID 列。
feature_timestamp: タイムスタンプ列。

特徴 f1 と f2 を時系列形式で含む特徴ビュー。 — **図 1.** BigQuery データソースの例。

データソースは Vertex AI ではなく BigQuery で準備します。この段階で Vertex AI リソースを作成する必要はありません。

特徴レジストリの設定

BigQuery でデータソースを準備したら、それらのデータソース（特定の特徴列を含む）を特徴レジストリに登録できます。

特徴の登録は任意です。BigQuery データソースを特徴レジストリに追加しなくても、オンラインで特徴を提供できます。ただし、次のような場合は、特徴を登録したほうが便利です。

データに同じエンティティ ID のインスタンスが複数含まれている可能性がある。この場合は、タイムスタンプ列を含む時系列形式でデータを準備する必要があります。特徴を登録すると、Vertex AI Feature Store がタイムスタンプを検索し、最新の特徴値のみを提供します。
データソースから特定の特徴列を登録したい。
複数のデータソースから特定の列を集計して、特徴ビューのインスタンスを定義したい。
特徴統計情報をモニタリングして特徴ドリフトを検出したい。

特徴レジストリには、次の 2 種類の Vertex AI Feature Store リソースがあります。

特徴データの特徴レジストリリソース
特徴量モニタリング用の特徴レジストリリソース

特徴データの特徴レジストリリソース

特徴データを特徴レジストリに登録するには、次の Vertex AI Feature Store リソースを作成する必要があります。

特徴グループ（FeatureGroup）: FeatureGroup リソースが特定の BigQuery ソーステーブルまたはビューに関連付けられます。これは、特徴列の論理グループで、Feature リソースで表されます。特徴グループには、特徴レコードを識別する 1 つ以上のエンティティ ID 列も含まれています。特徴データが時系列形式の場合は、特徴グループにタイムスタンプ列も含める必要があります。特徴グループの作成方法については、特徴グループを作成するをご覧ください。
特徴（Feature）: Feature リソースは、親の FeatureGroup リソースに関連付けられている特徴データソースの特徴値を含む特定の列を表します。特徴グループ内で特徴を作成する方法については、特徴を作成するをご覧ください。

たとえば、図 2 は特徴列 f1 と f2 を含む特徴グループを表しています。特徴グループに関連付けられた BigQuery テーブルがソースになっています。BigQuery データソースに 4 つの特徴列があり、2 つの列を集計して特徴グループを形成しています。特徴グループには、エンティティ ID 列と特徴のタイムスタンプ列も含まれています。

特徴 f1 と f2 を時系列形式で含む特徴グループ。 — **図 2.** BigQuery データソースをソースとする 2 つの `Feature` 列を含む `FeatureGroup` の例。

特徴量モニタリング用の特徴レジストリリソース

特徴量モニタリングリソースを使用すると、FeatureGroup リソースと Feature リソースを使用して登録された特徴データをモニタリングできます。特徴量モニタリングに関連する次のリソースを作成できます。

特徴モニター（FeatureMonitor）: FeatureMonitor リソースは、FeatureGroup リソースとその特徴グループ内の 1 つ以上の特徴に関連付けられます。モニタリングのスケジュールを指定します。複数の特徴モニターリソースを作成して、特徴グループ内の同じ特徴セットに異なるモニタリングスケジュールを設定できます。たとえば、特徴 f1 と f2 が 1 時間ごとに更新され、特徴 f3 と f4 が毎日更新される場合、2 つの特徴モニターリソースを作成して、これらの特徴を効率的にモニタリングできます。
- 特徴モニター fm1。特徴 f1 と f2 に対して 1 時間ごとにモニタリングジョブを実行します。
- 特徴モニター fm2。特徴 f3 と f4 に対して 1 日ごとにモニタリングジョブを実行します。
特徴モニタージョブ（FeatureMonitorJob）: FeatureMonitorJob リソースには、特徴量モニタリングジョブの実行時に取得された特徴統計情報と情報が含まれます。また、特徴データで検出された異常（特徴ドリフトなど）に関する情報も含まれます。

特徴量モニタリングリソースの作成方法の詳細については、特徴の異常をモニタリングするをご覧ください。

オンラインサービングの設定

オンライン予測に特徴を提供するには、少なくとも 1 つのオンラインサービングクラスタを定義して構成し、特徴データソースまたは特徴レジストリリソースに関連付ける必要があります。Vertex AI Feature Store では、オンラインサービングクラスタをオンラインストアインスタンスと呼んでいます。オンラインストアインスタンスには複数の特徴ビューが含まれている場合があります。その場合、それぞれの特徴ビューが特徴データソースと関連付けられています。

オンラインサービングリソース

オンラインサービングを設定するには、次の Vertex AI Feature Store リソースを作成する必要があります。

オンラインストア（FeatureOnlineStore）: FeatureOnlineStore リソースはオンラインサービングクラスタインスタンスを表します。ここには、オンラインサービングノードの数など、オンラインサービスの構成が含まれます。オンラインストアインスタンスには特徴データのソースが指定されていませんが、BigQuery または特徴レジストリのいずれかで特徴データソースを特定できる FeatureView リソースが含まれている必要があります。オンラインストアインスタンスの作成方法については、オンラインストアインスタンスを作成するをご覧ください。
特徴ビュー（FeatureView）: FeatureView リソースは、オンラインストアインスタンスにある特徴の論理的なコレクションです。特徴ビューを作成するときに、次のいずれかの方法で特徴データソースの場所を指定できます。
- 特徴レジストリから 1 つ以上の特徴グループと特徴を関連付けます。特徴グループは、BigQuery データソースのロケーションを示しています。特徴グループ内の特徴は、そのデータソース内の特定の特徴列を指しています。
- または、BigQuery のソーステーブルまたはビューを関連付けます。
オンラインストア内で特徴ビューインスタンスを作成する方法については、特徴ビューを作成するをご覧ください。

たとえば、図 3 は特徴列 f2 と f4 を含む特徴ビューを示しています。これらの特徴列は、BigQuery テーブルに関連付けられた 2 つの別々の特徴グループをソースとしています。

2 つの特徴グループをソースとする特徴 f2 と f4 を含む特徴ビュー。 — **図 3.** 2 つの個別の機能グループの特徴を含む `FeatureView` の例。

オンラインサービング

Vertex AI Feature Store は、リアルタイムのオンライン予測に次のタイプのオンラインサービングを行います。

Bigtable オンラインサービングは、大量のデータ（数テラバイトのデータ）を提供する場合に便利です。これは Vertex AI Feature Store（従来版）のオンラインサービングと似ていますが、キャッシュ機能が改善されています。Bigtable オンラインサービングはエンベディングをサポートしていません。頻繁に更新される大量のデータを提供する必要があっても、エンベディングを提供する必要がない場合は、Bigtable オンラインサービングを使用してください。
最適化されたオンラインサービングでは、非常に低いレイテンシで特徴のオンラインサービングを行います。オンラインサービングのレイテンシはワークロードによって異なりますが、最適化されたオンラインサービングでは Bigtable オンラインサービングよりもレイテンシが低くなるため、ほとんどのシナリオで推奨されます。最適化されたオンラインサービングは、エンベディング管理もサポートしています。

最適化されたオンラインサービングを使用するには、パブリックエンドポイントまたは専用の Private Service Connect エンドポイントを構成する必要があります。

特徴の設定後に Vertex AI Feature Store でオンラインサービングを設定する方法については、オンラインサービングのタイプをご覧ください。

バッチ予測またはモデルトレーニングのオフラインサービング

BigQuery から Vertex AI の別のオフラインストアに特徴データをコピーまたはインポートする必要がないため、BigQuery のデータマネジメント機能とエクスポート機能を使用して次のことができます。

特定の時点の過去のデータなどの特徴データをクエリします。
モデルトレーニングとバッチ予測の特徴データを前処理してエクスポートします。

BigQuery を使用した ML の詳細については、BigQuery ML の概要をご覧ください。

Vertex AI Feature Store の用語

特徴量エンジニアリングに関連する用語

特徴量エンジニアリング

特徴量エンジニアリングとは、機械学習（ML）の元データを ML モデルのトレーニングや推論に使用できる特徴量に変換するプロセスです。

特徴

機械学習（ML）において、特徴とは、ML モデルのトレーニングや推論の入力として使用されるインスタンスまたはエンティティの特性（属性）のことです。

特徴値

特徴値は、インスタンスまたはエンティティの特徴（属性）の実際の測定可能な値に対応します。一意のエンティティの特徴値のコレクションが、エンティティに対応する特徴レコードを表します。

特徴のタイムスタンプ

特徴のタイムスタンプは、エンティティの特定の特徴レコードから特徴値のセットが生成された時刻を示します。

特徴レコード

特徴レコードは、特定の時点での一意のエンティティの属性を表すすべての特徴値を集約したものです。

特徴レジストリに関連する用語

特徴レジストリ

特徴レジストリは、オンライン推論に使用する特徴データソースを記録するための中心的なインターフェースです。詳細については、特徴レジストリの設定をご覧ください。

特徴グループ

特徴グループは、BigQuery のソーステーブルまたは特徴データを含むビューに対応する特徴レジストリリソースです。特徴ビューには特徴が含まれることがあり、データソース内の特徴列の論理グループと考えることができます。

特徴のサービングに関連する用語

特徴のサービング

特徴のサービングは、トレーニングまたは推論のために保存されている特徴値をエクスポートまたは取得するプロセスです。Vertex AI には、オンラインサービングとオフラインサービングの 2 種類の特徴のサービングがあります。オンラインサービングでは、オンライン推論用に特徴データソースのサブセットの最新の特徴値を取得します。オフラインまたはバッチサービングでは、ML モデルのトレーニングなどのオフライン処理用に大量の特徴データ（履歴データを含む）をエクスポートします。

オフラインストア

オフラインストアは、最近と過去の特徴データを保存するストレージ設備で、通常は ML モデルのトレーニングに使用されます。オフラインストアには最新の特徴値も含まれており、オンライン推論にも使用できます。

オンラインストア

特徴管理において、オンラインストアはオンライン推論のために提供される最新の特徴値を保存するストレージ設備です。

特徴ビュー

特徴ビューは、BigQuery データソースからオンラインストアインスタンスに具体化された特徴の論理的なコレクションです。特徴ビューは、顧客の特徴データを保存し、定期的に更新します。この特徴データは、BigQuery ソースから定期的に更新されます。特徴ビューは、直接、または特徴レジストリリソースとの関連付けを通じて特徴データストレージに関連付けられます。

ロケーションの制約

Vertex AI Feature Store のすべてのリソースは、BigQuery データソースと同じリージョンまたは同じマルチリージョンロケーションに配置する必要があります。たとえば、特徴データソースが us-central1 にある場合、FeatureOnlineStore インスタンスは us-central1 または US マルチリージョンロケーションにのみ作成する必要があります。

特徴メタデータ

Vertex AI Feature Store は Dataplex Universal Catalog と統合され、特徴メタデータなど、特徴のガバナンス機能を提供します。オンラインストアインスタンス、特徴ビュー、特徴グループは Data Catalog にデータアセットとして自動的に登録されます。Data Catalog は、これらのリソースからメタデータをカタログ化する機能です。登録後、Dataplex Universal Catalog のメタデータ検索機能を使用して、これらのリソースのメタデータの検索、表示、管理を行うことができます。Vertex AI Feature Store リソースを検索する方法については、Data Catalog でリソースメタデータを検索するをご覧ください。

特徴ラベル

リソースの作成中または作成後に、リソースにラベルを追加できます。既存の Vertex AI Feature Store リソースにラベルを追加する方法については、ラベルを更新するをご覧ください。

リソースバージョンメタデータ

Vertex AI Feature Store では、特徴のバージョン 0 のみがサポートされます。

特徴量モニタリング

Vertex AI Feature Store では、特徴量モニタリングを設定して特徴統計情報を取得し、特徴データの異常を検出できます。モニタリングジョブを定期的に実行するようにモニタリングスケジュールを設定するか、モニタリングジョブを手動で実行できます。特徴量モニタリングの設定と特徴量モニタリングジョブの実行の詳細については、特徴の異常をモニタリングするをご覧ください。

エンベディングの管理とベクトル検索

Vertex AI Feature Store の最適化されたオンラインサービングでは、エンベディング管理がサポートされています。エンベディングは通常の double 配列として BigQuery に保存できます。Vertex AI Feature Store のエンベディング管理機能を使用してベクトル類似度検索を行い、指定したエンティティまたはエンベディング値に対して近似最近傍のエンティティを取得できます。

Vertex AI Feature Store でエンベディング管理を使用するには、次の操作を行う必要があります。

embedding 列を追加して、エンベディングをサポートするように BigQuery データソースを設定します。必要に応じて、フィルタリング列とクラウディング列を追加します。詳細については、データソースの準備のガイドラインをご覧ください。
最適化されたオンラインサービング用のオンラインストアインスタンスを作成します。
特徴ビューの作成時に embedding 列を指定します。エンベディングをサポートする特徴ビューを作成する方法については、特徴ビューのベクトル取得を構成するをご覧ください。

Vertex AI Feature Store でベクトル類似性検索を行う方法については、エンティティのベクトル検索を行うをご覧ください。

データの保持

Vertex AI Feature Store は、データソース内の特徴値に関連付けられているタイムスタンプに基づいて、一意の ID に対して最新の特徴値を保持します。オンラインストアにデータ保持の上限はありません。

オフラインストアは BigQuery によってプロビジョニングされるため、履歴の特徴値など、BigQuery のデータ保持期間や割り当てが特徴データソースに適用される場合があります。BigQuery の割り当てと上限の詳細

割り当てと上限

Vertex AI Feature Store では割り当てと上限が適用されます。使用量の上限を設定すること、リソースを管理するだけでなく、予期しない使用量の急増からGoogle Cloud ユーザーのコミュニティを保護できます。これらの制約に達しないように Vertex AI Feature Store リソースを効率的に使用するには、Vertex AI Feature Store の割り当てと上限をご覧ください。

料金

Vertex AI Feature Store のリソース使用料金については、Vertex AI Feature Store の料金をご覧ください。

ノートブックチュートリアル

次のサンプルとチュートリアルを使用して、Vertex AI Feature Store の詳細をご覧ください。

Vertex AI Feature Store Bigtable オンラインサービングを使用した、BigQuery データのオンライン特徴サービングと取得

このチュートリアルでは、Vertex AI Feature Store で Bigtable オンラインサービングを使用して、BigQuery で特徴値のオンラインサービングと取得を行う方法について説明します。

Colab で開く | Colab Enterprise で開く | GitHub で表示する

Vertex AI Feature Store Optimized オンラインサービングを使用した、BigQuery データのオンライン特徴サービングと取得

このチュートリアルでは、Vertex AI Feature Store で最適化されたオンラインサービングを使用して、BigQuery からの特徴値のサービングと取得を行う方法について説明します。

Colab で開く | Colab Enterprise で開く | GitHub で表示する

Vertex AI Feature Store を使用した、BigQuery データのオンライン特徴サービングとベクトル取得

このチュートリアルでは、Vertex AI Feature Store を使用して BigQuery で特徴値のオンラインサービングとベクトル取得を行う方法を学習します。

Colab で開く | Colab Enterprise で開く | GitHub で表示する

Vertex AI Feature Store 特徴ビューサービスエージェント

このチュートリアルでは、特徴ビューのサービスエージェントを有効にして、特定のソースデータへのアクセス権を各特徴ビューに付与する方法について説明します。

Colab で開く | Colab Enterprise で開く | GitHub で表示する

Vertex AI Feature Store ベースの LLM グラウンディングのチュートリアル。

このチュートリアルでは、ユーザー提供データをチャンクに分割し、エンベディング生成機能を持つ大規模言語モデル（LLM）を使用して各チャンクのエンベディングベクトルを生成する方法を学習します。生成されたエンベディングベクトルデータセットは Vertex AI Feature Store に読み込むことができ、高速な特徴量取得と効率的なオンラインサービングが可能になります。

Colab で開く | Colab Enterprise で開く | GitHub で表示する

Vertex AI Feature Store と BigQuery を使用して生成 AI RAG アプリケーションを作成する

このチュートリアルでは、BigQuery ベクトル検索と Vertex AI Feature Store を使用して、生成 AI アプリケーション用の低レイテンシのベクトル検索システムを構築する方法について説明します。

Colab で開く | Colab Enterprise で開く | GitHub で表示する

Vertex AI Feature Store で IAM ポリシーを構成する

このチュートリアルでは、Vertex AI Feature Store 内に保存されているリソースとデータへのアクセスを制御する IAM ポリシーの構成方法について説明します。

Colab で開く | Colab Enterprise で開く | GitHub で表示する

次のステップ

BigQuery でデータを設定する方法を学習する。
特徴グループと特徴の作成方法を確認する
オンラインストアインスタンスの作成方法を学習する。

Vertex AI Feature Store について

Vertex AI Feature Store のデータモデルとリソース

BigQuery でのデータソースの準備

特徴レジストリの設定

特徴データの特徴レジストリ リソース

特徴量モニタリング用の特徴レジストリ リソース

オンライン サービングの設定

オンライン サービング リソース

オンライン サービング

バッチ予測またはモデル トレーニングのオフライン サービング

Vertex AI Feature Store の用語

特徴量エンジニアリングに関連する用語

特徴量エンジニアリング

特徴

特徴値

特徴のタイムスタンプ

特徴レコード

特徴レジストリに関連する用語

特徴レジストリ

特徴グループ

特徴のサービングに関連する用語

特徴のサービング

オフライン ストア

オンライン ストア

特徴ビュー

ロケーションの制約

特徴メタデータ

特徴ラベル

リソース バージョン メタデータ

特徴量モニタリング

エンベディングの管理とベクトル検索

データの保持

割り当てと上限

料金

ノートブック チュートリアル

Vertex AI Feature Store Bigtable オンライン サービングを使用した、BigQuery データのオンライン特徴サービングと取得

Vertex AI Feature Store Optimized オンライン サービングを使用した、BigQuery データのオンライン特徴サービングと取得

Vertex AI Feature Store を使用した、BigQuery データのオンライン特徴サービングとベクトル取得

Vertex AI Feature Store 特徴ビュー サービス エージェント

Vertex AI Feature Store ベースの LLM グラウンディングのチュートリアル。

Vertex AI Feature Store と BigQuery を使用して生成 AI RAG アプリケーションを作成する

Vertex AI Feature Store で IAM ポリシーを構成する

次のステップ

特徴データの特徴レジストリリソース

特徴量モニタリング用の特徴レジストリリソース

オンラインサービングの設定

オンラインサービングリソース

オンラインサービング

バッチ予測またはモデルトレーニングのオフラインサービング

オフラインストア

オンラインストア

リソースバージョンメタデータ

ノートブックチュートリアル

Vertex AI Feature Store Bigtable オンラインサービングを使用した、BigQuery データのオンライン特徴サービングと取得

Vertex AI Feature Store Optimized オンラインサービングを使用した、BigQuery データのオンライン特徴サービングと取得

Vertex AI Feature Store 特徴ビューサービスエージェント