2 クラス平均化パーセプトロン モジュールTwo-Class Averaged Perceptron module

この記事では Azure Machine Learning デザイナーのモジュールについて説明します。This article describes a module in Azure Machine Learning designer.

平均化パーセプトロン アルゴリズムに基づいて機械学習モデルを作成するには、このモジュールを使用します。Use this module to create a machine learning model based on the averaged perceptron algorithm.

この分類アルゴリズムは、教師あり学習手法であるため、ラベル列を含む "タグ付けされたデータセット" が必要となります。This classification algorithm is a supervised learning method, and requires a tagged dataset, which includes a label column. モデルのトレーニングは、対象のモデルとタグ付けされたデータセットを "モデルのトレーニング" に入力として渡すことにより行うことができます。You can train the model by providing the model and the tagged dataset as an input to Train Model. その後は、トレーニング済みのモデルを使用して新しい入力例の値を予測することができます。The trained model can then be used to predict values for the new input examples.

平均化パーセプトロン モデルについてAbout averaged perceptron models

平均化パーセプトロンの手法 は、ニューラル ネットワークの初期の単純なバージョンです。The averaged perceptron method is an early and simple version of a neural network. この手法では、線形関数に基づいて入力がいくつかの可能な出力に分類され、特徴ベクターから得られる重みのセットと結合されます。このため、"パーセプトロン" と呼ばれます。In this approach, inputs are classified into several possible outputs based on a linear function, and then combined with a set of weights that are derived from the feature vector—hence the name "perceptron."

単純なパーセプトロン モデルは線形分離可能なパターンを学習するのに適しています。一方、ニューラル ネットワーク (特にディープ ニューラル ネットワーク) は、より複雑なクラス境界をモデル化できます。The simpler perceptron models are suited to learning linearly separable patterns, whereas neural networks (especially deep neural networks) can model more complex class boundaries. ただし、パーセプトロンはより高速であり、ケースを順次処理するため、継続的なトレーニングで使用できます。However, perceptrons are faster, and because they process cases serially, perceptrons can be used with continuous training.

2 クラス平均化パーセプトロンの構成方法How to configure Two-Class Averaged Perceptron

  1. 2 クラス平均化パーセプトロン モジュールをパイプラインに追加します。Add the Two-Class Averaged Perceptron module to your pipeline.

  2. [Create trainer mode](トレーナー モードの作成) オプションを設定して、モデルのトレーニング方法を指定します。Specify how you want the model to be trained, by setting the Create trainer mode option.

    • Single Parameter (単一パラメーター) : モデルの構成方法を決めている場合は、特定の値のセットを引数として渡します。Single Parameter: If you know how you want to configure the model, provide a specific set of values as arguments.

    • [Parameter Range](パラメーター範囲) : 最適なパラメーターがわからず、パラメーター スイープを実行する場合は、このオプションを選択します。Parameter Range: Select this option if you are not sure of the best parameters, and want to run a parameter sweep. 反復する値の範囲を選択します。モデルのハイパーパラメーターの調整では、指定した設定の可能なすべての組み合わせに対して反復処理を行い、最適な結果を生成するハイパーパラメーターを決定します。Select a range of values to iterate over, and the Tune Model Hyperparameters iterates over all possible combinations of the settings you provided to determine the hyperparameters that produce the optimal results.

  3. [Learning rate](学習速度)学習速度 の値を指定します。For Learning rate, specify a value for the learning rate. 学習速度の値は、モデルがテストされて修正される度に確率的勾配降下法で使用されるステップのサイズを制御します。The learning rate values control the size of the step that is used in stochastic gradient descent each time the model is tested and corrected.

    速度の値を小さくすると、モデルのテストが頻繁に実行されますが、ローカルで停滞する可能性があります。By making the rate smaller, you test the model more often, with the risk that you might get stuck in a local plateau. ステップのサイズを大きくすることで収束速度は速くなりますが、真の極小値から離れていってしまうおそれがあります。By making the step larger, you can converge faster, at the risk of overshooting the true minima.

  4. [Maximum number of iterations](イテレーションの最大数) には、アルゴリズムによってトレーニング データを検証する回数を入力します。For Maximum number of iterations, type the number of times you want the algorithm to examine the training data.

    早く停止することで、より優れた一般化がもたらされる場合が多いです。Stopping early often provides better generalization. イテレーションの回数を増やすと適合が向上する反面、過剰適合のおそれがあります。Increasing the number of iterations improves fitting, at the risk of overfitting.

  5. [Random number seed](乱数シード) には、必要に応じて、シードとして使用する整数値を入力します。For Random number seed, optionally type an integer value to use as the seed. 繰り返し実行したときのパイプラインの再現性を確保したい場合は、シードを使用することをお勧めします。Using a seed is recommended if you want to ensure reproducibility of the pipeline across runs.

  6. トレーニング データセットを接続し、モデルをトレーニングします。Connect a training dataset, and train the model:

    • [Create trainer mode](トレーナー モードの作成)[Single Parameter](単一パラメーター) に設定した場合は、タグ付けされたデータセットと モデルのトレーニング モジュールを接続します。If you set Create trainer mode to Single Parameter, connect a tagged dataset and the Train Model module.

    • [Create trainer mode](トレーナー モードの作成)[Parameter Range](パラメーター範囲) に設定した場合は、[Tune Model Hyperparameters](モデルのハイパーパラメーターの調整) を使用して、タグ付けしたデータセットを接続してモデルをトレーニングします。If you set Create trainer mode to Parameter Range, connect a tagged dataset and train the model by using Tune Model Hyperparameters.


    パラメーター範囲を [モデルのトレーニング] に渡すと、単一のパラメーター リストの既定値のみが使用されます。If you pass a parameter range to Train Model, it uses only the default value in the single parameter list.

    [Tune Model Hyperparameters](モデルのハイパーパラメーターの調整) モジュールによって、パラメーターごとに設定の範囲が求められているとき、それに単一のパラメーター値セットを渡した場合、それらの値は無視され、学習器の既定値が使用されます。If you pass a single set of parameter values to the Tune Model Hyperparameters module, when it expects a range of settings for each parameter, it ignores the values, and uses the default values for the learner.

    [Parameter Range](パラメーター範囲) オプションを選択し、任意のパラメーターに単一の値を入力した場合、指定した単一の値はスイープ全体で使用されます。これは、他のパラメーターが値の範囲の中で変化する場合でも同様です。If you select the Parameter Range option and enter a single value for any parameter, that single value you specified is used throughout the sweep, even if other parameters change across a range of values.

次のステップNext steps

Azure Machine Learning で使用できる一連のモジュールを参照してください。See the set of modules available to Azure Machine Learning.