Vertex AI での MLOps

このセクションでは、ML ワークフローで ML オペレーション(MLOps)を実装する際に役立つ Vertex AI サービスについて説明します。

モデルのデプロイ後、モデルは、環境内のデータの変化に対応して、最適なパフォーマンスを発揮し、妥当性を維持する必要があります。MLOps は ML システムの安定性と信頼性を向上させる一連の手法です。

Vertex AI MLOps ツールは、予測モデルのモニタリング、アラート、診断、実用的な説明を通じて、AI チーム間のコラボレーションとモデルの改善を支援します。すべてのツールはモジュール式であるため、必要に応じて既存システムに統合できます。

MLOps の詳細については、ML における継続的デリバリーと自動化のパイプラインMLOps の実践ガイドをご覧ください。

MLOps 機能の図

  • ワークフローをオーケストレートする: モデルを手動でトレーニングして提供すると、特にプロセスを何度も繰り返す必要がある場合、時間がかかり、エラーが発生しやすくなることがあります。

    • Vertex AI Pipelines を使用すると、ML ワークフローの自動化、モニタリング、管理が容易になります。
  • ML システムで使用されるメタデータを追跡する: データ サイエンスでは、ML ワークフローで使用されるパラメータ、アーティファクト、指標を追跡することが重要です。特に、ワークフローを複数回繰り返す場合に重要です。

    • Vertex ML Metadata を使用すると、ML システムで使用されるメタデータ、パラメータ、アーティファクトを記録できます。その後、そのメタデータに対しクエリを実行して、ML システムまたはそれが生成するアーティファクトのパフォーマンスを分析、デバッグ、監査できます。
  • ユースケースに最適なモデルを特定する: 新しいトレーニング アルゴリズムを試す場合は、どのトレーニング済みモデルのパフォーマンスが最も優れているかを把握する必要があります。

    • Vertex AI Experiments を使用すると、さまざまなモデル アーキテクチャ、ハイパーパラメータ、トレーニング環境を追跡、分析して、ユースケースに最適なモデルを特定できます。

    • Vertex AI TensorBoard を使用すると、ML テストの追跡、可視化、比較を行い、モデルのパフォーマンスを測定できます。

  • モデル バージョンを管理する: 中央リポジトリにモデルを追加すると、モデル バージョンを追跡できます。

    • Vertex AI Model Registry では、モデルの概要を確認できるため、新しいバージョンの整理、追跡、トレーニングを行いやすくなります。Model Registry では、モデルの評価、エンドポイントへのモデルのデプロイ、バッチ予測の作成、特定のモデルとモデル バージョンの詳細の表示を行えます。
  • 特徴を管理する: 複数のチームで ML の特徴を再利用する場合は、特徴を迅速かつ効率的に共有、提供できる方法が必要です。

    • Vertex AI Feature Store は、機械学習で使用する特徴量を整理、保存、提供するための一元化されたリポジトリです。一元的な featurestore を使用することで、組織は ML の特徴を大規模に再利用でき、新しい ML アプリケーションの開発とデプロイにかかる時間を短縮できます。
  • モデルの品質をモニタリングする: 本番環境にデプロイされたモデルは、トレーニング データに類似した予測入力データに対して最適のパフォーマンスを発揮します。入力データがモデルのトレーニングに使用するデータから外れると、モデル自体に変化がなくても、モデルのパフォーマンスは低下する可能性があります。

    • Vertex AI Model Monitoring は、トレーニング サービング スキューと予測ドリフトをモニタリングし、受信予測データのスキューがトレーニング ベースラインから遠すぎる場合にアラートを送信します。アラートと特徴分布を使用して、モデルの再トレーニングが必要かどうかを評価できます。
  • AI と Python アプリケーションをスケーリングする: Ray は、AI と Python アプリケーションをスケーリングするためのオープンソース フレームワークです。Ray は、機械学習(ML)ワークフローの分散コンピューティングと並列処理を実現するためのインフラストラクチャを提供します。

    • Ray on Vertex AI は、同じオープンソースの Ray コードを使用して、最小限の変更でプログラムを作成し、Vertex AI でアプリケーションを開発できるように設計されています。これにより、ML ワークフローの一部として、Vertex AI PredictionBigQuery など、他の Google Cloud サービスとの Vertex AI のインテグレーションを使用できます。

次のステップ