はじめに

完了

MLOps (機械学習向け DevOps) を使用すると、データ サイエンス チームと IT チームは協力して、機械学習モデルの監視、検証、ガバナンスにより、モデルの開発と展開のペースを上げることができます。 MLOps により、エンド ツー エンドのワークフローの自動化によって、DevOps の理念が Machine Learning にもたらされます。 MLOps は Azure Machine Learning の一部であり、IoT Edge デバイスに展開できます。

Machine Learning のエンド ツー エンドのライフ サイクルを次に示します。

Diagram showing end-to-end machine learning life cycle.

  1. Azure DevOps 用の Azure Machine Learning 拡張機能を使用し、再利用可能な Machine Learning パイプラインでモデルを作成します。 GitHub にコードを格納して、MLOps パイプラインに自動的に統合されるようにします。

  2. 豊富なメタデータとイベント管理を備えたバージョン モデル用の Azure DevOps と Azure Machine Learning を使用して MLOps のロールアウトを自動化します。

  3. MLOps パイプラインでのすべての成果物に対する監査証跡を自動的に作成して、資産の整合性を確保し、規制の要件を満たします。

  4. 信頼できるモデルをリリースし、再トレーニングのタイミングを把握できるように、パフォーマンスを展開して監視します。

  5. データ ドリフトを観察し、モデルの情報をフィードバックして、将来のトレーニングを改善します。

運用環境への機械学習モデルの展開は、ワークフローの中で最も重要な問題点の 1 つになります。 ターゲット プラットフォームが IoT Edge のときは、展開プロセスがもう 1 つの課題になります。 次のようなものがあります。

  • IoT 機械学習モデルは急速に変化しているため、(現在のデータ ドリフトに関して) 劣化するのも速くなります。 そのため、より頻繁に再トレーニングが必要になります。

  • IoT 機械学習モデルは、さまざまな種類のターゲット プラットフォームに展開する必要があり、パフォーマンスやセキュリティなどの面で、これらのプラットフォームの機能を利用する必要があります。

  • IoT Edge ソリューションはオフラインで実行することが必要になる場合があるため、モデルの更新頻度にオフラインで対応できるようにする必要があります。

シナリオ

あなたが石油ガス業界で働いていて、遠隔地や海外で動作している何千基もの石油ガス ポンプを管理する担当者であると考えてください。 これらの場所が遠隔地であっても、チームは現場の障害を迅速に特定し、修正する必要があります。 そのため、ポンプ用の予測メンテナンス システムを構築して展開する必要があります。 予測メンテナンス モデルを作成する前に、接続されたデバイスのリモート監視用のシステムを実装し、ストリームにセンサー データを取り込み、そのデータを処理して、データベースに格納する必要があります。 現在、チームは IoT Edge でこの目標を達成するために管理を行っています。 ポンプに接続されている現場の複数のセンサーからデータをキャプチャできます。 現在、異常はダッシュボードで視覚的に検出されます。 そのため、エンジニアは最新の機械学習モデルから異常を検出できる新しい予測メンテナンス システムの展開を望んでいます。 新しい予測メンテナンス システムによって生成されたモデルは、データ ドリフトを考慮して、データの現在の状態を動的に反映する必要があります。 したがって、システムでは、状態を示すためにモデルを頻繁かつ自動的に再トレーニングできる必要があります。 また、さまざまな製造元の多様なポンプにトレーニング済みのモデルを展開する必要があります。 システムでは、パフォーマンスとセキュリティの両方について、ポンプのソフトウェアに固有の特性を使用する必要があります。 最後に、展開されるモデルは、必要に応じて、Edge デバイスでオフラインで実行できる必要があります。 この会社は、これらの目標を達成することで、メンテナンス コストと運用コストを大幅に節約し、社内の安全性と環境への影響を高めることができます。

Diagram showing a predictive maintenance scenario.

このモジュールでは、IoT Edge デバイスに対するコンテキストでの、ソース管理、再現可能なトレーニング パイプライン、モデル ストレージ、バージョン管理モデルのパッケージ化モデルの検証展開運用環境でのモデルの監視、モデルの再トレーニングについて説明します。

このモジュールでは、上記のシナリオのコンテキストでの、機械学習モデルの開発と展開に対する IoT Edge 向け MLOps の重要性を調べます。