Vertex AI での MLOps

このセクションでは、ML ワークフローで ML オペレーション(MLOps)を実装する際に役立つ Vertex AI サービスについて説明します。

モデルのデプロイ後、モデルは、環境内のデータの変化に対応して、最適なパフォーマンスを発揮し、妥当性を維持する必要があります。MLOps は ML システムの安定性と信頼性を向上させる一連の手法です。

Vertex AI MLOps ツールは、予測モデルのモニタリング、アラート、診断、実用的な説明を通じて、AI チーム間のコラボレーションとモデルの改善を支援します。すべてのツールはモジュール式であるため、必要に応じて既存システムに統合できます。

MLOps の詳細については、ML における継続的デリバリーと自動化のパイプラインMLOps の実践ガイドをご覧ください。

MLOps 機能の図

  • ワークフローをオーケストレートする: モデルを手動でトレーニングして提供すると、特にプロセスを何度も繰り返す必要がある場合、時間がかかり、エラーが発生しやすくなることがあります。

    • Vertex AI Pipelines を使用すると、ML ワークフローの自動化、モニタリング、管理が容易になります。
  • ML システムで使用されるメタデータを追跡する: データ サイエンスでは、ML ワークフローで使用されるパラメータ、アーティファクト、指標を追跡することが重要です。特に、ワークフローを複数回繰り返す場合に重要です。

    • Vertex ML Metadata を使用すると、ML システムで使用されるメタデータ、パラメータ、アーティファクトを記録できます。その後、そのメタデータに対しクエリを実行して、ML システムまたはそれが生成するアーティファクトのパフォーマンスを分析、デバッグ、監査できます。
  • ユースケースに最適なモデルを特定する: 新しいトレーニング アルゴリズムを試す場合は、どのトレーニング済みモデルのパフォーマンスが最も優れているかを把握する必要があります。

    • Vertex AI Experiments を使用すると、さまざまなモデル アーキテクチャ、ハイパーパラメータ、トレーニング環境を追跡、分析して、ユースケースに最適なモデルを特定できます。

    • Vertex AI TensorBoard を使用すると、ML テストの追跡、可視化、比較を行い、モデルのパフォーマンスを測定できます。

  • モデル バージョンを管理する: 中央リポジトリにモデルを追加すると、モデル バージョンを追跡できます。

    • Vertex AI Model Registry では、モデルの概要を確認できるため、新しいバージョンの整理、追跡、トレーニングを行いやすくなります。Model Registry では、モデルの評価、エンドポイントへのモデルのデプロイ、バッチ予測の作成、特定のモデルとモデル バージョンの詳細の表示を行えます。
  • 特徴を管理する: 複数のチームで ML の特徴を再利用する場合は、特徴を迅速かつ効率的に共有、提供できる方法が必要です。

    • Vertex AI Feature Store には、ML の特徴を整理、保存、提供するための一元化されたリポジトリが用意されています。一元的な featurestore を使用することで、組織は ML の特徴を大規模に再利用でき、新しい ML アプリケーションの開発とデプロイにかかる時間を短縮できます。
  • モデルの品質をモニタリングする: 本番環境にデプロイされたモデルは、トレーニング データに類似した予測入力データに対して最適のパフォーマンスを発揮します。入力データがモデルのトレーニングに使用するデータから外れると、モデル自体に変化がなくても、モデルのパフォーマンスは低下する可能性があります。

    • Vertex AI Model Monitoring は、トレーニング サービング スキューと予測ドリフトをモニタリングし、受信予測データのスキューがトレーニング ベースラインから遠すぎる場合にアラートを送信します。アラートと特徴分布を使用して、モデルの再トレーニングが必要かどうかを評価できます。

次のステップ