Vertex ML Metadata の概要

科学的手法では、観測値と実験のパラメータの両方を記録することが重要です。データ サイエンスでは、機械学習(ML)のテストで使用されるパラメータ、アーティファクト、指標を追跡することも重要です。このメタデータは、次のような場合に役立ちます。

  • 本番環境の ML システムの実行を分析し、予測の品質変化を理解する。
  • ML テストを分析し、さまざまなハイパーパラメータのセットの有効性を比較する。
  • データセットやモデルなどの ML アーティファクトのリネージを追跡し、アーティファクトの生成要因となった要素や、アーティファクトが他のアーティファクトの派生でどのように使用されたかを理解する。
  • 同じアーティファクトとパラメータを使用して ML ワークフローを再実行する。
  • ガバナンス目的で ML アーティファクトのダウンストリームの使用状況を追跡する。

Vertex ML Metadata を使用すると、ML システムによって生成されたメタデータとアーティファクトを記録し、そのメタデータに対してクエリを実行できます。これにより、ML システムまたはアーティファクトの生成状況の分析、デバッグ、監査を行うことができます。

Vertex ML Metadata は、Google の TensorFlow Extended チームが開発したオープンソースの ML Metadata(MLMD)ライブラリで使用されているコンセプトに基づいています。

Vertex ML Metadata の概要

Vertex ML Metadata は、ML システムのメタデータをグラフとして収集します。

メタデータ グラフの場合、アーティファクトと実行はノードとして表示され、イベントは実行の入力または出力としてアーティファクトをリンクするエッジとして表示されます。コンテキストは、アーティファクトと実行を論理的にまとめるサブグラフを表します。

アーティファクト、実行、コンテキストには Key-Value ペアのメタデータを適用できます。たとえば、モデルには、そのトレーニングに使用されるフレームワークを記述するメタデータ(モデルの精度、再現率など)を含めることができます。

詳しくは、ML システムのメタデータの追跡をご覧ください。Vertex AI Pipelines のメタデータを分析する場合は、詳細なチュートリアルをご覧ください。

ML アーティファクト リネージ

機械学習 ML システムのパフォーマンスの変化を理解するには、ML ワークフローで生成されたメタデータとそのアーティファクトのリネージを分析する必要があります。アーティファクトのリネージには、作成に使用された要素だけでなく、このアーティファクトから派生したアーティファクトやメタデータも含まれます。

たとえば、モデルのリネージには次のものが含まれます。

  • モデルの作成に使用されたトレーニング、テスト、評価データ
  • モデルのトレーニング中に使用されたハイパーパラメータ
  • モデルのトレーニングに使用されたコード。
  • トレーニングと評価プロセスで記録されたメタデータ(モデルの精度など)。
  • このモデルから派生したアーティファクト(バッチ予測の結果など)。

Vertex ML Metadata を使用して ML システムのメタデータを追跡すると、次のような質問に答えることができます。

  • 特定のモデルのトレーニングに使用されたデータセット。
  • 特定のデータセットを使用してトレーニングされた組織のモデル。
  • どの実行が最も正確なモデルを生成し、どのハイパーパラメータを使用してモデルをトレーニングしたか。
  • 特定のモデルがデプロイされたターゲットとデプロイのタイミング。
  • 特定の時点で予測の生成に使用されたモデルのバージョン。

詳しくは、ML システムのメタデータの分析をご覧ください。