Vertex AI Feature Store の概要(レガシー)

Vertex AI Feature Store(レガシー)は、機械学習で使用する特徴量を整理、保存、提供するための一元化されたリポジトリです。一元的な featurestore を使用することで、組織で大規模な ML 特徴を効率的に共有、発見、再利用でき、新しい ML アプリケーションの開発とデプロイにかかる時間を短縮できます。

Vertex AI Feature Store(レガシー)はフルマネージド ソリューションで、ストレージやコンピューティング リソースなどの基盤となるインフラストラクチャの管理とスケーリングを行います。このソリューションを使用すると、データ サイエンティストは、本番環境に特徴をデプロイする際の課題を気にすることなく、特徴計算のロジックに集中できます。

Vertex AI Feature Store(レガシー)は Vertex AI の統合コンポーネントです。Vertex AI Feature Store(レガシー)は個別に使用することも、Vertex AI ワークフローの一部として使用することもできます。たとえば、Vertex AI Feature Store(レガシー)からデータを取得し、Vertex AI でカスタムモデルや AutoML モデルをトレーニングできます。

Vertex AI Feature Store(レガシー)は、Vertex AI Feature Store の前身です。Vertex AI Feature Store の詳細については、Vertex AI Feature Store のドキュメントをご覧ください。

概要

Vertex AI Feature Store(レガシー)を使用して、featurestoreエンティティ タイプ特徴を作成および管理します。featurestore は、特徴とその値を格納する最上位のコンテナです。featurestore を設定すると、エンジニアリングのサポートなしで特徴の追加や共有ができるようになります。ユーザーは特徴を定義し、さまざまなデータソースから特徴値をインポートする(取り込む)ことができます。Vertex AI Feature Store(従来版)のデータモデルとリソースの詳細をご覧ください

許可されたユーザーは、featurestore から値を検索し、取得できます。たとえば、特徴を検索して、ML モデルの作成に必要なトレーニング データをバッチ エクスポートで取得できます。特徴値をリアルタイムで取得して、迅速なオンライン予測を行うこともできます。

利点

Vertex AI Feature Store(レガシー)を使用する前に、特徴値を計算し、その値を BigQuery のテーブルや Cloud Storage のファイルなど、さまざまな場所に保存できます。さらに、ストレージと特徴値の使用量を別々のソリューションで構築し、管理することもできます。Vertex AI Feature Store(レガシー)は ML 特徴のサービングだけでなく、バッチとオンライン用のストレージに対して統合されたソリューションを提供します。以下では、Vertex AI Feature Stores(レガシー)の利点について詳しく説明します。

組織全体で特徴を共有する

featurestore で特徴を作成すると、それをトレーニングまたはサービング タスクを行う他のユーザーとすばやく共有できます。異なるプロジェクトやユースケース用に特徴を再設計する必要はありません。また、中央のリポジトリから特徴の管理と提供を行えるため、組織全体で一貫性のある操作が可能になり、重複排除の労力を軽減できます(ます。特に、価値の高い特徴の場合)。

Vertex AI Feature Store(従来版)には、検索機能とフィルタ機能が用意されており、他のユーザーが既存の特徴を見つけて再利用できます。特徴ごとに関連するメタデータを表示し、特徴の品質と使用パターンを確認できます。たとえば、特徴の有効な値(特徴カバレッジとも呼ばれます)を持つエンティティの割合や特徴値の統計的分布を確認できます。

大規模なオンライン サービングのマネージド ソリューション

Vertex AI Feature Store(レガシー)は、オンライン特徴サービング(低レイテンシ サービング)のマネージド ソリューションを提供します。これは、オンライン予測をタイムリーに行うために欠かせない機能です。低レイテンシのデータ サービング インフラストラクチャを構築して運用する必要はありません。Vertex AI Feature Store(レガシー)がこの処理を行い、必要に応じてスケーリングします。特徴の生成ロジックを作成し、特徴のサービング タスクをオフロードします。これにより、新しい特徴を構築する際の煩雑さが解消され、データ サイエンティストはデプロイを気にせずに作業に集中できるようになります。

トレーニング / サービング スキューの回避

トレーニング / サービング スキューは、本番環境で使用する特徴データの分布が、モデルのトレーニングに使用された特徴データの分布と異なる場合に発生します。このスキューにより、トレーニング中のモデルのパフォーマンスと本番環境のパフォーマンスとの間に矛盾が生じることがよくあります。次の例は、トレーニング / サービング スキューが発生する可能性のあるソースに対して Vertex AI Feature Store(レガシー)がどのように対処するのかを示しています。

  • Vertex AI Feature Store(レガシー)は、特徴値を featurestore に 1 回取り込み、トレーニングとサービングの両方に同じ値を再利用します。featurestore がない場合、トレーニングからサービングまでの間に特徴を生成するために、別のコードパスを使用する場合があります。そのため、トレーニングとサービング時で特徴値が異なることがあります。
  • Vertex AI Feature Store(レガシー)は、トレーニングの履歴データを取得するポイントインタイム ルックアップを提供します。このようなルックアップにより、予測の前後ではなく、事前に取得した特徴値のみを取得することで、データ漏洩のリスクを軽減できます。

トレーニング サービング スキューを検出する方法の詳細については、特徴値の異常を表示するをご覧ください。

ブレの検出

Vertex AI Feature Store(レガシー)は、特徴データの分布の経時的な変化(ブレ)を検出するのに役立ちます。 Vertex AI Feature Store(レガシー)は、featurestore に取り込まれた特徴値の分布を常に追跡します。特徴のブレが増加すると、影響を受ける特徴を使用しているモデルの再トレーニングが必要になる場合があります。ブレを検出する方法については、特徴値の異常を表示するをご覧ください。

割り当てと上限

Vertex AI Feature Store(レガシー)では割り当てと上限が適用されます。使用量の上限を設定すること、リソースを管理するだけでなく、予期しない使用量の急増から Google Cloud ユーザーのコミュニティを保護できます。予定外の制約が発生しないように、割り当てと上限ページで Vertex AI Feature Store(レガシー)の割り当てを確認してください。たとえば、Vertex AI Feature Store(レガシー)では、1 分あたりに作成可能なオンライン サービング ノードとオンライン サービング リクエストの数に割り当てが設定されています。

データの保持

Vertex AI Feature Store(レガシー)は、特徴値をデータ保持制限まで維持します。この上限は、値がインポートされた日時ではなく、特徴値に関連付けられたタイムスタンプに基づいています。Vertex AI Feature Store(レガシー)は、タイムスタンプが上限を超える値を削除するようにスケジュールします。

料金

Vertex AI Feature Store(レガシー)の料金は、保存するデータの量や featurestore オンライン ノードの数など、複数の要因によって決まります。featurestore を作成するとすぐに料金が発生します。詳細については、Vertex AI Feature Store(レガシー)の料金をご覧ください。

次のステップ