Team Data Science Process ライフサイクルのデプロイ ステージ

この記事では、Team Data Science Process (TDSP) のデプロイ ステージに関連付けられている目標、タスク、成果物のアウトラインを示します。 このプロセスでは、チームがデータサイエンスプロジェクトを構築するために使用できる推奨ライフサイクルが提供されます。 ライフサイクルは、チームが (多くの場合、反復的に) 実行する主要なステージの概要を示します。

  • ビジネスの把握
  • データの取得と理解
  • モデリング
  • デプロイ
  • 顧客による受け入れ

TDSPライフサイクルの視覚的な表現を次に示します。

Diagram that shows the stages of the TDSP lifecycle.

目的

デプロイステージの目標は、最終的に顧客に受け入れられるように、データパイプラインを使用してモデルを運用環境または運用環境にデプロイすることです。

タスクを完了する方法

このステージの主なタスクは、モデルを運用可能にすることです。 モデルとパイプラインを、アプリケーションで利用できるように運用環境または運用環境に似た環境にデプロイします。

モデルの運用化

適切に実行される一連のモデルが完成したら、チームは他のアプリケーションで使用できるようにモデルを運用可能にすることができます。 予測は、ビジネス要件に応じてリアルタイムまたはバッチ処理で行われます。 モデルをデプロイするには、APIインターフェイスを使用してモデルを公開します。 インターフェイスを使用すると、ユーザーは次のようなさまざまなアプリケーションからモデルを簡単に使用できます。

  • Web サイト
  • スプレッドシート
  • ダッシュボード
  • 基幹業務アプリケーション
  • バックエンド アプリケーション

Azure Machine Learning によるモデル運用化の例については、「機械学習モデルを Azure にデプロイする」を参照してください。 運用モデルとデプロイするデータパイプラインに監視を組み込むことをお勧めします。 これは、その後のシステム状態のレポートとトラブルシューティングに役立ちます。

MLflowとの統合

このステージをサポートするために、次のAzure Machine Learning機能を組み込むことができます。

  • モデル管理: デプロイを準備するには、運用環境または運用環境にモデルを配置します。 MLflowは、デプロイ可能なモデルを管理およびバージョン管理します。これは、運用化の向上に役立ちます。

  • モデルの提供とデプロイ: MLflowのモデル提供機能によってデプロイプロセスが容易になるため、さまざまな環境でモデルを簡単に提供できます。

Artifacts

このステージでは、チームは次のものを提供します。

  • システムの正常性と主要なメトリックを表示する状態ダッシュボード。 Power BIを使用してダッシュボードを作成することをお勧めします。

  • デプロイの詳細を含む最終的なモデリングレポート

  • 最終的なソリューションアーキテクチャドキュメント

ピアレビューされた文献

研究者は、査読済み文献でTDSPに関する研究を発表しています。 引用文献は、デプロイライフサイクルステージを含め、他のアプリケーションやTDSPと同様のアイデアを調査する機会を提供します。

共同作成者

この記事は、Microsoft によって保守されています。 当初の寄稿者は以下のとおりです。

プリンシパル作成者:

  • Mark Tabladillo | シニア クラウド ソリューション アーキテクト

パブリックでない LinkedIn プロファイルを表示するには、LinkedIn にサインインします。

これらの記事では、TDSPライフサイクルの他のステージについて説明しています。