Machine Learning 用の成熟度モデル

Azure Machine Learning

この成熟度モデルの目的は、機械学習運用 (MLOps) の原則とプラクティスを明確にすることです。この成熟度モデルでは、運用レベルの機械学習アプリケーション環境の作成と運用の継続的な改善を示します。これは、機械学習の運用環境およびそれに関連するプロセスの成熟度を測定するために必要な段階的要件を確立するためのメトリックとして使用できます。

成熟度モデル

MLOps 成熟度モデルは、MLOps 環境を正常に実行するために必要な Development Operations (DevOps) の原則とプラクティスを明確にするのに役立ちます。これは、既存の組織がこのような環境を実装しようとしたときに生じるギャップを特定することを目的としています。また、これは、完全に成熟した環境の要件でユーザーを困惑させるのではなく、MLOps 機能を段階的に拡張する方法でもあります。これを、次の目的のガイドとして使用してください。

新しい契約の作業範囲を見積もる。
現実的な成功基準を確立する。
契約終了時に引き渡す成果物を特定する。

ほとんどの成熟度モデルと同様、MLOps 成熟度モデルは、人材または文化、プロセスまたは構造、オブジェクトまたはテクノロジを定性的に評価します。成熟度レベルが上がるに従って、インシデントまたはエラーが開発および運用プロセスの品質向上につながる可能性も高くなります。

MLOps 成熟度モデルは、次の 5 つのレベルの技術的機能に分けられます。

Level	説明	ハイライト	テクノロジ
0	MLOps なし	機械学習モデルのライフサイクル全体を管理することは困難チームは別々で、リリースは困難ほとんどのシステムは "ブラックボックス" として存在し、デプロイ時およびデプロイ後のフィードバックはほとんどなし	手動によるビルドとデプロイモデルおよびアプリケーションの手動によるテストモデルのパフォーマンスの一元的追跡なしモデルトレーニングは手動
1	DevOps はあるが、MLOps はなし	"MLOps なし" よりもリリースの苦労は少ないが、新しいモデルごとにデータチームに依存運用段階でのモデルのパフォーマンスに関するフィードバックは依然として限られる結果の追跡および再現が困難	自動ビルドアプリケーションコードの自動テスト
2	トレーニングの自動化	トレーニング環境は完全に管理され、追跡可能モデルの再現が容易リリースは手動であるが、摩擦は少ない	自動化されたモデルのトレーニングモデルトレーニングのパフォーマンスを一元的に追跡モデル管理
3	モデルデプロイの自動化	リリースは低摩擦で自動デプロイから元のデータまで完全に追跡可能環境全体 (トレーニング > テスト > 運用) を管理	デプロイのためのモデルのパフォーマンスに関する A および B テストを統合すべてのコードのテストを自動化モデルトレーニングのパフォーマンスを一元的に追跡
4	MLOps 運用の完全自動化	システムを完全自動化し、監視を容易化運用システムは、改善方法に関する情報を提供。場合によっては、新しいモデルで自動的に改善ゼロダウンタイムシステムに近づく	モデルトレーニングとテストを自動化デプロイされたモデルからの詳細で一元化されたメトリック

次の表は、そのレベルのプロセス成熟度の詳細な特性を示しています。モデルは常に進化しています。このバージョンは、2020 年 1 月に最終更新されたものです。

Level 0:MLOps なし

ユーザー	モデルの作成	モデルのリリース	アプリケーションの統合
データサイエンティスト: サイロ化、より大きなチームとの定期的なコミュニケーションがないデータエンジニア ( "存在する場合"): サイロ化、より大きなチームとの定期的なコミュニケーションがないソフトウェアエンジニア: サイロ化、他のチームメンバーからリモートでモデルを受信	データ収集は手動コンピューティングは管理されない可能性あり実験は予測追跡されない最終結果は、入力と出力を単一のモデルファイルにまとめられる可能性があり、手動で手渡される	手動プロセススコアリングスクリプトは、実験後に手動で作成される可能性あり、バージョン管理なしリリースは、データサイエンティストまたはデータエンジニアのみによって処理される	実装をデータサイエンティストの専門知識に大きく依存毎回手動によるリリース

Level 1: DevOps あり、MLOps なし

ユーザー	モデルの作成	モデルのリリース	アプリケーションの統合
データサイエンティスト: サイロ化、より大きなチームとの定期的なコミュニケーションがないデータエンジニア (存在する場合): サイロ化、より大きなチームとの定期的なコミュニケーションがないソフトウェアエンジニア: サイロ化、他のチームメンバーからリモートでモデルを受信	データは、データパイプラインによって自動収集コンピューティングは管理される場合もあれば、管理されない場合もある実験は予測追跡されない最終結果は、入力と出力を単一のモデルファイルにまとめられる可能性があり、手動で手渡される	手動プロセススコアリングスクリプトは、実験後に手動で作成される可能性あり、バージョン管理の可能性ありソフトウェアエンジニアへは手渡し	モデルの基本的な統合テストありモデルの実装をデータサイエンティストの専門知識に大きく依存リリースを自動化アプリケーションコードのユニットテストあり

Level 2: トレーニングの自動化

ユーザー	モデルの作成	モデルのリリース	アプリケーションの統合
データサイエンティスト: データエンジニアと緊密に連携して、実験コードを反復可能なスクリプトまたはジョブに変換データエンジニア: データサイエンティストと連携ソフトウェアエンジニア: サイロ化、他のチームメンバーからリモートでモデルを受信	データは、データパイプラインによって自動収集コンピューティングを管理実験結果を追跡トレーニングコードと生成されたモデルの両方のバージョンを管理	手動によるリリーススコアリングスクリプトをテストと共にバージョン管理リリースをソフトウェアエンジニアリングチームで管理	モデルの基本的な統合テストありモデルの実装をデータサイエンティストの専門知識に大きく依存アプリケーションコードのユニットテストあり

Level 3: モデルデプロイの自動化

ユーザー	モデルの作成	モデルのリリース	アプリケーションの統合
データサイエンティスト: データエンジニアと緊密に連携して、実験コードを反復可能なスクリプトまたはジョブに変換データエンジニア: データサイエンティストおよびソフトウェアエンジニアと連携して入力および出力を管理ソフトウェアエンジニア: データエンジニアと連携して、アプリケーションコードへのモデルの統合を自動化	データは、データパイプラインによって自動収集コンピューティングを管理実験結果を追跡トレーニングコードと生成されたモデルの両方のバージョンを管理	自動リリーススコアリングスクリプトをテストと共にバージョン管理リリースを継続的デリバリー (CI/CD) パイプラインで管理	モデルリリースごとのユニットおよび統合テストモデルの実装について、データサイエンティストの専門知識への依存度を低減アプリケーションコードのユニットおよび統合テストあり

Level 4: MLOps の再トレーニングの完全自動化

ユーザー	モデルの作成	モデルのリリース	アプリケーションの統合
データサイエンティスト: データエンジニアと緊密に連携して、実験コードを反復可能なスクリプトまたはジョブに変換。ソフトウェアエンジニアと連携して、データエンジニアのためのマーカーを特定データエンジニア: データサイエンティストおよびソフトウェアエンジニアと連携して入力および出力を管理ソフトウェアエンジニア: データエンジニアと連携して、アプリケーションコードへのモデルの統合を自動化。デプロイ後のメトリック収集を実装	データは、データパイプラインによって自動収集運用メトリックに基づいて再トレーニングを自動トリガーコンピューティングを管理実験結果を追跡トレーニングコードと生成されたモデルの両方のバージョンを管理	自動リリーススコアリングスクリプトをテストと共にバージョン管理継続的インテグレーションおよび継続的デリバリー (CI/CD) パイプラインで管理	モデルリリースごとのユニットおよび統合テストモデルの実装について、データサイエンティストの専門知識への依存度を低減アプリケーションコードのユニットおよび統合テストあり

Level	説明	ハイライト	テクノロジ
0	MLOps なし	機械学習モデルのライフサイクル全体を管理することは困難チームは別々で、リリースは困難ほとんどのシステムは "ブラックボックス" として存在し、デプロイ時およびデプロイ後のフィードバックはほとんどなし	手動によるビルドとデプロイモデルおよびアプリケーションの手動によるテストモデルのパフォーマンスの一元的追跡なしモデルトレーニングは手動
1	DevOps はあるが、MLOps はなし	"MLOps なし" よりもリリースの苦労は少ないが、新しいモデルごとにデータチームに依存運用段階でのモデルのパフォーマンスに関するフィードバックは依然として限られる結果の追跡および再現が困難	自動ビルドアプリケーションコードの自動テスト
2	トレーニングの自動化	トレーニング環境は完全に管理され、追跡可能モデルの再現が容易リリースは手動であるが、摩擦は少ない	自動化されたモデルのトレーニングモデルトレーニングのパフォーマンスを一元的に追跡モデル管理
3	モデルデプロイの自動化	リリースは低摩擦で自動デプロイから元のデータまで完全に追跡可能環境全体 (トレーニング > テスト > 運用) を管理	デプロイのためのモデルのパフォーマンスに関する A および B テストを統合すべてのコードのテストを自動化モデルトレーニングのパフォーマンスを一元的に追跡
4	MLOps 運用の完全自動化	システムを完全自動化し、監視を容易化運用システムは、改善方法に関する情報を提供。場合によっては、新しいモデルで自動的に改善ゼロダウンタイムシステムに近づく	モデルトレーニングとテストを自動化デプロイされたモデルからの詳細で一元化されたメトリック

Machine Learning 用の成熟度モデル

成熟度モデル

Level 0:MLOps なし

Level 1: DevOps あり、MLOps なし

Level 2: トレーニングの自動化

Level 3: モデルデプロイの自動化

Level 4: MLOps の再トレーニングの完全自動化

次のステップ

フィードバック

フィードバック

その他のリソース

Machine Learning 用の成熟度モデル

成熟度モデル

Level 0:MLOps なし

Level 1: DevOps あり、MLOps なし

Level 2: トレーニングの自動化

Level 3: モデル デプロイの自動化

Level 4: MLOps の再トレーニングの完全自動化

次のステップ

関連リソース

フィードバック

フィードバック

その他のリソース

Level 3: モデルデプロイの自動化