MLOps とは

MLOps は、データ サイエンティストやエンジニアが ML のライフサイクルをより効率的に管理できるようにする一連のプラクティスです。

ML の開発と運用間のギャップを埋めることを目的としています。MLOps の目標は、一貫性のある確実な方法で ML モデルを開発、テスト、デプロイできるようにすることです。

ML モデルを使用して重要なビジネス上の意思決定を行う組織が増えるにつれ、MLOps の重要性はますます高まっています。

MLOps の定義

MLOps は ML オペレーションの略で、開発からデプロイ、モニタリングに至る ML のライフサイクルを管理するプロセスを指します。これには、次のようなタスクが含まれます。

  • テスト追跡: テストと結果を追跡して最適なモデルを特定する
  • モデルのデプロイ: 本番環境にモデルをデプロイして、アプリケーションからアクセスできるようにする
  • モデルのモニタリング: モデルをモニタリングして、パフォーマンスの問題や低下を検出する
  • モデルの再トレーニング: 新しいデータでモデルを再トレーニングしてパフォーマンスを改善する

MLOps は、本番環境で ML モデルの信頼性、スケーラビリティ、保守性を確保するうえで不可欠です。

MLOps の重要性

MLOps は、ML ライフサイクルを管理し、ML モデルを効果的に開発、デプロイ、保守できるようにするために不可欠です。MLOps がなければ、組織は次のような複数の課題に直面する可能性があります。

エラーのリスクの増大: 手動プロセスでは、ML ライフサイクルでのエラーや不整合が発生し、ML モデルの精度と信頼性が低下する可能性があります。

拡張性の欠如: ML モデルやデータセットのサイズと複雑さが増すにつれ、手動プロセスの管理が難しくなり、ML オペレーションの効果的なスケーリングが困難になります。

効率の低下: 手動のプロセスは時間がかかり、非効率的で、ML モデルの開発とデプロイを遅らせます。

コラボレーションの欠如: 手動プロセスでは、データ サイエンティスト、エンジニア、運用チームの効果的なコラボレーションが困難になり、サイロ化やコミュニケーションの断絶が発生します。

MLOps は、ML のライフサイクルを自動化および管理するためのフレームワークとツールセットを提供することで、これらの課題を解決します。これにより、組織は ML モデルをより効率的、確実、大規模に開発、デプロイ、保守できるようになります。

MLOps のメリット

MLOps を採用した組織には、次のような多数のメリットがもたらされます。

  • 効率性の向上: MLOps は ML ライフサイクルを自動化および合理化し、ML モデルの開発、デプロイ、保守に必要な時間と労力を削減する
  • スケーラビリティの向上: MLOps を採用した組織は ML 運用をより効果的にスケーリングし、より大きなデータセットやより複雑なモデルを処理できるようになる
  • 信頼性の向上: MLOps はエラーや不整合のリスクを軽減し、本番環境で ML モデルの信頼性と正確性を確保する
  • コラボレーションの強化: MLOps は、データ サイエンティスト、エンジニア、運用チームの効果的なコラボレーションを実現する、共通のフレームワークとツールセットを提供する
  • 費用の削減: MLOps は、ML ライフサイクルを自動化および最適化することで費用を削減し、手作業による介入の必要性を低減する

MLOps と DevOps の違いは何ですか?

DevOps は、組織がソフトウェア開発チームと運用チームのギャップを解消するのに役立つ一連のプラクティスです。MLOps は、特に ML モデルのニーズを満たす、類似する一連のプラクティスです。

MLOps と DevOps には、次のようないくつかの重要な違いがあります。

  • 範囲: 焦点は DevOps がソフトウェア開発ライフサイクル、MLOps は ML ライフサイクルである
  • 複雑さ: 多くの場合、ML モデルは従来のソフトウェア アプリケーションよりも複雑で、開発とデプロイに特化したツールと手法を必要とする
  • データ: ML モデルのトレーニングと推論はデータに依存するため、データの管理と処理に関してより多くの課題が生じる
  • 規制: ML モデルは規制要件の対象となる場合があり、開発とデプロイのプロセスに影響する可能性がある

こうした違いはあるものの、MLOps と DevOps には、コラボレーション、自動化、継続的な改善の重要性など、共通する原則がいくつかあります。DevOps のプラクティスを採用した組織の多くは、MLOps の導入時にそれらのプラクティスを活用できます。

MLOps の基本コンポーネント

MLOps は、ML ライフサイクルを管理するために連携する次のような複数のコンポーネントで構成されています。

探索的データ分析(EDA)

EDA は、ML モデルのトレーニングに使用されるデータを探索して理解するプロセスです。これには、次のようなタスクが含まれます。

  • データの可視化: データを可視化してパターン、傾向、外れ値を特定
  • データ クリーニング: 重複データや誤ったデータを削除し、欠損値に対処
  • 特徴量エンジニアリング: 元データを ML モデルに関連する有用な特徴量に変換

データ準備と特徴量エンジニアリング

データの準備と特徴量エンジニアリングは、MLOps プロセスの重要なステップです。データの準備では、モデルのトレーニングに応じて、元データのクリーニング、変換、フォーマットを行います。

特徴量エンジニアリングでは、モデルのトレーニングに対してより関連性が高く、有用な新しい特徴量を元データから作成します。これらのステップは、ML モデルが高品質のデータでトレーニングされ、正確な予測を行えるようにするうえで不可欠です。

モデルのトレーニングと調整

モデルのトレーニングとチューニングでは、準備したデータで ML モデルをトレーニングし、そのハイパーパラメータを最適化して可能な限り最高のパフォーマンスを達成します。

モデルのトレーニングとチューニングの一般的なタスクは次のとおりです。

  • 適切な ML アルゴリズムの選択: 特定の問題とデータセットに適した ML アルゴリズムを選択
  • モデルのトレーニング: トレーニング データで ML モデルをトレーニング
  • モデルのチューニング: ML モデルのハイパーパラメータを調整してパフォーマンスを改善
  • モデルの評価: テストデータに対する ML モデルの性能を評価

モデルのレビューとガバナンス

モデルのレビューとガバナンスにより、責任を持って倫理的に ML モデルを開発、デプロイできるようになります。

  • モデルの検証: ML モデルを検証して、求められるパフォーマンスと品質の基準を満たしていることを確認
  • モデルの公平性: ML モデルにバイアスや差別がないことを確認
  • モデルの解釈可能性: ML モデルが理解および説明可能であることを確認
  • モデル セキュリティ: ML モデルの安全性を確保し、攻撃から保護

モデルの推論とサービング

モデルの推論とサービングでは、トレーニング済みの ML モデルを本番環境にデプロイし、アプリケーションとエンドユーザーが使用できるようにします。

  • モデルのデプロイ: ML モデルを本番環境にデプロイ
  • モデルのサービング: アプリケーションとエンドユーザーが ML モデルを推論に使用できるようにする
  • モデルのモニタリング: 本番環境での ML モデルのパフォーマンスと動作をモニタリング

モデルのモニタリング

モデルのモニタリングでは、本番環境での ML モデルのパフォーマンスと動作を継続的にモニタリングします。タスクには以下が含まれる場合があります。

  • モデルのパフォーマンスの追跡: 精度、適合率、再現率などの指標を追跡して ML モデルのパフォーマンスを評価します。
  • モデルのドリフトの検出: データや環境の変化による ML モデルの経時的なパフォーマンス低下を検出します。
  • モデルの問題の特定: ML モデルのパフォーマンスに影響を与える可能性がある問題(バイアス、過学習、学習不足など)を特定します。

モデルの自動再トレーニング

自動モデル再トレーニングでは、パフォーマンスが低下したときや新しいデータが利用可能になったときに、ML モデルを再トレーニングします。自動モデル再トレーニングには以下が含まれます。

  • モデルの再トレーニングのトリガー: モデルのパフォーマンスの低下や新しいデータの利用可能性などの特定の条件が満たされた場合に、再トレーニング プロセスをトリガーします。
  • モデルの再トレーニング: 最新のデータを使用して ML モデルを再トレーニングし、本番環境でモデルを更新します。
  • 再トレーニングされたモデルの評価: 再トレーニングされたモデルのパフォーマンスを評価し、望ましいパフォーマンス基準を満たしていることを確認します。

Google Cloud でビジネスの課題を解決する

新規のお客様には、Google Cloud で使用できる無料クレジット $300 分を差し上げます。
お客様独自の課題を詳細に検討するには、Google Cloud のセールス スペシャリストまでご相談ください。

次のステップ

$300 分の無料クレジットと 20 以上の Always Free プロダクトを活用して、Google Cloud で構築を開始しましょう。

Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
コンソール
  • Google Cloud プロダクト
  • 100 種類を超えるプロダクトをご用意しています。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。また、すべてのお客様に 25 以上のプロダクトを無料でご利用いただけます(毎月の使用量上限があります)。
Google Cloud