Machine Learning モジュールの説明

このトピックでは、Azure Machine Learning Studio (クラシック) に含まれるすべての モジュール の概要について説明します。これは、予測モデルを簡単に構築してテストするための対話型のビジュアルワークスペースです。

注意

適用対象: Machine Learning Studio (クラシック)

このコンテンツは、Studio (クラシック) のみに関連しています。 Azure Machine Learning デザイナーに同様のドラッグアンドドロップモジュールが追加されました。 この記事では、2つのバージョンの比較について詳しく説明します。

モジュールとは何ですか。

Machine Learning Studio (クラシック) では、モジュールは実験を作成するためのビルディングブロックです。 各モジュールは、ワークスペース内のデータを操作できる特定の機械学習アルゴリズム、関数、またはコードライブラリをカプセル化します。 モジュールは、他のモジュールからの接続を受け入れ、データを共有および変更するように設計されています。

各モジュールで実行されるコードは、多くのソースから取得されます。 これには、オープンソースライブラリと言語、Microsoft Research によって開発されたアルゴリズム、Azure などのクラウドサービスを操作するためのツールが含まれます。

ヒント

機械学習アルゴリズムをお探しですか? デシジョンツリー、クラスタリング、ニューラルネットワークなどのモジュールが含まれている Machine Learning カテゴリを参照してください。 トレーニング評価のカテゴリには、モデルのトレーニングとテストに役立つモジュールが含まれています。

モジュールを接続して構成することで、外部ソースからデータを読み取り、分析用に準備し、機械学習アルゴリズムを適用し、結果を生成するワークフローを作成できます。

Machine Learning Studio (クラシック) で 実験 が開いている場合は、左側のナビゲーションウィンドウで現在のモジュールの完全な一覧を確認できます。 これらの構成要素を実験にドラッグした後、それらを接続して、実験と呼ばれる完全な機械学習ワークフローを作成します。

場合によっては、新しい機能を追加したり、古いコードを削除したりするためにモジュールが更新されることがあります。 この場合、モジュールを使用するように作成した実験は引き続き実行されます。 ただし、次に実験を開いたときに、モジュールをアップグレードするか、別のモジュールを使用するように求めるメッセージが表示されます。

完全な機械学習の実験を構築する方法の例については、次のチュートリアルを参照してください。

モジュールのカテゴリ

関連モジュールを簡単に見つけられるように、Machine Learning Studio (クラシック) の machine learning ツールは、これらのカテゴリ別にグループ化されています。

データ形式の変換

このカテゴリに含まれるモジュールは、データを他の機械学習ツールのデータ形式に変換する場合に使用します。

  • データの入力と出力

    これらのモジュールを使用して、Hadoop クラスター、Azure Table storage、web Url などのクラウドデータソースからデータとモデルを読み取ります。 これらのモジュールを使用して、ストレージまたはデータベースに結果を書き込むこともできます。

  • データ変換

    このカテゴリに含まれるモジュールは、分析用データを作成する場合に使用します。 データ型の変更、特徴またはラベルとしての列へのフラグの設定、特徴の生成、データのスケーリングまたは正規化を行うことができます。

  • フィルター

    デジタル信号処理から派生した数値データを変換します。

  • カウントを使用した学習

    コンパクトが大規模なデータセットを記述する特徴を構築するには、ジョイント確率分布を使用します。

  • 操作

    このグループには、データサイエンス用のさまざまなツールが用意されています。 たとえば、欠損値の削除や置換、列のサブセットの選択、列の追加、または2つのデータセットの連結を行うことができます。

  • サンプルおよび分割

    抽出条件またはサイズによってデータセットを分割し、トレーニングセットとテストセットを作成したり、特定の行を分離したりします。

  • 拡大と縮小

    数値データを変換します。

特徴選択

このカテゴリに含まれるモジュールは、広範に研究されている統計的手法でデータの最も優れた特徴を識別する場合に使用します。

Machine Learning

このグループには、Machine Learning によってサポートされる機械学習アルゴリズムの大部分が含まれています。

また、モデルのトレーニング、スコアの生成、およびモデルのパフォーマンスの評価によって、アルゴリズムのサポートを目的としたモジュールも含まれています。

  • Evaluate

    モデルのトレーニングが完了したら、これらのツールを使用してモデルの精度を測定します。

  • 初期化する

    これらのモジュールは、パラメーターを設定することによってカスタマイズできる機械学習アルゴリズムを提供します。 このセクションのアルゴリズムは、次の種類ごとにグループ化されています。

  • スコア

    これらのモジュールを使用して、アルゴリズムを通じて新しいデータを渡し、評価のための一連の結果を生成します。 また、予測サービスの一部としてスコアリングの結果を使用することもできます。

  • トレーニング

    これらのモジュールは、指定したデータに対して初期化された機械学習モデルをトレーニングします。

OpenCV ライブラリ モジュール

このカテゴリに含まれるモジュールを使用すると、一般的なオープン ソース ライブラリに簡単にアクセスしてイメージの処理や分類を行うことができます。

R 言語モジュール

このカテゴリに含まれるモジュールは、カスタムの R コードを実験に追加したり、R パッケージに基づいて機械学習モデルを実装する場合に使用します。

Python 言語モジュール

このカテゴリに含まれるモジュールは、カスタムの Python コードを実験に追加する場合に使用します。

統計関数

このカテゴリに含まれるモジュールは、確率分布の計算、カスタムの計算タスクの作成など、数値変数に関連するさまざまなタスクを実行する場合に使用します。

Text Analytics

これらのモジュールを使用して、特徴ハッシュと名前付きエンティティの認識を実行したり、自然言語処理ツールを使用してテキストを前処理したりします。

時系列

これらのモジュールを使用して、時系列データ用に特別に設計されたアルゴリズムを使用して、傾向の異常を評価します。

Machine Learning Studio (クラシック) モジュールは、Azure Data Factory などの他のツールでサポートされているデータ統合ツールの複製を試行しません。 代わりに、モジュールは機械学習に固有の機能を提供します。

  • データの正規化、グループ化、およびスケーリング
  • データの統計分布の計算
  • その他の機械学習形式への変換
  • 機械学習の実験と結果のエクスポートに使用されるデータのインポート
  • テキスト分析、機能の選択、次元の縮小

データの操作と保存により高度な機能が必要な場合は、次の情報を参照してください。

  • Azure Data Factory: エンタープライズ対応のクラウドデータ処理パイプライン。
  • Azure SQL Database: machine learning への統合アクセスを備えたスケーラブルなストレージ。
  • CosmosDB: NoSQL データストア;Machine Learning Studio (クラシック) にデータをインポートします。
  • Azure Data Lake Analytics: ビッグデータに対する分散分析。
  • Stream Analytics: モノのインターネットのイベント処理。
  • Azure Text Analytics: テキスト処理用の複数のオプションと、音声、画像、顔認識用の関連認知サービス。
  • Azure Databricks: Spark ベースの分析プラットフォーム。

関連項目