Vertex ML Metadata の概要

科学的手法では、観測値と実験のパラメータの両方を記録することが重要です。データサイエンスでは、機械学習（ML）のテストで使用されるパラメータ、アーティファクト、指標を追跡することも重要です。このメタデータは、次のような場合に役立ちます。

本番環境の ML システムの実行を分析し、予測の品質変化を理解する。
ML テストを分析し、さまざまなハイパーパラメータのセットの有効性を比較する。
データセットやモデルなどの ML アーティファクトのリネージを追跡し、アーティファクトの生成要因となった要素や、アーティファクトが他のアーティファクトの派生でどのように使用されたかを理解する。
同じアーティファクトとパラメータを使用して ML ワークフローを再実行する。
ガバナンス目的で ML アーティファクトのダウンストリームの使用状況を追跡する。

Vertex ML Metadata を使用すると、ML システムによって生成されたメタデータとアーティファクトを記録し、そのメタデータに対してクエリを実行できます。これにより、ML システムまたはアーティファクトの生成状況の分析、デバッグ、監査を行うことができます。

Vertex ML Metadata は、Google の TensorFlow Extended チームが開発したオープンソースの ML Metadata（MLMD）ライブラリで使用されているコンセプトに基づいています。

Vertex ML Metadata は、ML システムのメタデータをグラフとして収集します。

メタデータグラフの場合、アーティファクトと実行はノードとして表示され、イベントは実行の入力または出力としてアーティファクトをリンクするエッジとして表示されます。コンテキストは、アーティファクトと実行を論理的にまとめるサブグラフを表します。

アーティファクト、実行、コンテキストには Key-Value ペアのメタデータを適用できます。たとえば、モデルには、そのトレーニングに使用されるフレームワークを記述するメタデータ（モデルの精度、再現率など）を含めることができます。

詳しくは、ML システムのメタデータの追跡をご覧ください。Vertex AI Pipelines のメタデータを分析する場合は、詳細なチュートリアルをご覧ください。

ML アーティファクトリネージ

機械学習 ML システムのパフォーマンスの変化を理解するには、ML ワークフローで生成されたメタデータとそのアーティファクトのリネージを分析する必要があります。アーティファクトのリネージには、作成に使用された要素だけでなく、このアーティファクトから派生したアーティファクトやメタデータも含まれます。

たとえば、モデルのリネージには次のものが含まれます。

Vertex ML Metadata を使用して ML システムのメタデータを追跡すると、次のような質問に答えることができます。