Azure Machine Learning Studio の Machine learning モジュール (クラシック)

機械学習の一般的なワークフローには多くのフェーズが含まれています。

  • 解決する問題と、結果を測定するためのメトリックを識別します。

  • 適切なデータの検索、クリーニング、準備。

  • 最適な機能を特定し、新機能をエンジニアリングします。

  • モデルの構築、評価、およびチューニング。

  • モデルを使用して、予測、推奨事項、およびその他の結果を生成します。

このセクションのモジュールでは、モデルをトレーニングするためにデータにアルゴリズムを適用する機械学習の最終フェーズのツールを提供します。 これらの最終フェーズでは、スコアを生成し、モデルの精度と有用性を評価することもできます。

注意

適用対象: Machine Learning Studio (クラシック)

このコンテンツは、Studio (クラシック) のみに関連しています。 Azure Machine Learning デザイナーに同様のドラッグアンドドロップモジュールが追加されました。 この記事では、2つのバージョンの比較について詳しく説明します。

カテゴリ別の機械学習タスクの一覧

  • モデルの初期化

    クラスタリング回帰分類異常検出モデルなど、さまざまなカスタマイズ可能な機械学習アルゴリズムから選択できます。

  • トレーニング

    構成されたモデルにデータを提供して、パターンから学習し、予測に使用できる統計を作成します。

  • スコア

    トレーニング済みのモデルを使用して予測を作成します。

  • Evaluate

    トレーニング済みのモデルの精度を測定したり、複数のモデルを比較したりします。

この試験段階のワークフローの詳細については、「 信用リスクソリューションのチュートリアル」を参照してください。

前提条件

モデルの構築の楽しい部分に進む前に、通常は多くの準備が必要です。 このセクションでは Machine Learning Studio (クラシック) のツールへのリンクを提供します。このツールを使用すると、データをクリーンアップし、入力の品質を向上させ、実行時エラーを防ぐことができます。

データの探索とデータ品質

データが正しい種類のデータ、適切な数量、および選択したアルゴリズムの適切な品質であることを確認します。 データの量とその配布方法を理解します。 外れ値はありますか。 それらはどのように生成されたのでしょうか。 重複するレコードはありますか。

欠損値の処理

不足値はさまざまな面で結果に影響を与えます。 たとえば、ほとんどすべての統計的手法で不足値のあるケースが破棄されます。 既定では、Machine Learning は、不足値のある行が検出されたときに、次の規則に従います。

  • モデルのトレーニングに使用されるデータに不足値がある場合、不足値を含む行はスキップされます。

  • モデルに対するスコアリング時に入力として使用されるデータに欠損値がある場合、欠損値は入力として使用されますが、null 値は反映されます。 これは通常、有効な予測ではなく、結果に null が挿入されることを意味します。

モデルをトレーニングする前に、必ずデータを確認してください。 欠損値を埋め込む、またはデータを修正するには、次のモジュールを使用します。

特徴の選択と次元の縮小

Machine Learning Studio (クラシック) を使用すると、最も役に立つ属性を見つけるためにデータを簡単に確認できます。

適切なアルゴリズムを選択する

解決しようとしている問題により、分析に使用するデータの選択とアルゴリズムの選択の両方が決定されます。

詳細については、「 Azure Machine Learning でアルゴリズムを選択する方法」を参照してください。

Machine learning の動作の例については、 Azure AI Galleryを参照してください。

ヒントと、いくつかの一般的なデータタスクのチュートリアルについては、「 チームデータサイエンスプロセスの実行に関するチュートリアル」を参照してください。

関連項目