多クラスのブースト デシジョン ツリーMulticlass Boosted Decision Tree

この記事では Azure Machine Learning デザイナー (プレビュー) 内のモジュールについて説明します。This article describes a module in Azure Machine Learning designer (preview).

ブースト デシジョン ツリー アルゴリズムに基づく機械学習モデルを作成するには、このモジュールを使用します。Use this module to create a machine learning model that is based on the boosted decision trees algorithm.

ブースト デシジョン ツリーは、第 2 のツリーで第 1 のツリーの誤差を補正し、第 3 のツリーで第 1 および第 2 のツリーの誤差を補正するといったアンサンブル学習手法です。A boosted decision tree is an ensemble learning method in which the second tree corrects for the errors of the first tree, the third tree corrects for the errors of the first and second trees, and so forth. 予測は、ツリーの集団に基づいて行われます。Predictions are based on the ensemble of trees together.

構成方法How to configure

このモジュールでは、トレーニングされていない分類モデルが作成されます。This module creates an untrained classification model. 分類は教師あり学習手法であるため、ラベル列のすべての行に値を含んだ "ラベル付けされたデータセット" が必要です。Because classification is a supervised learning method, you need a labeled dataset that includes a label column with a value for all rows.

このタイプのモデルは、"モデルのトレーニング" を使用してトレーニングできます。You can train this type of model by using the Train Model.

  1. 多クラスのブースト デシジョン ツリー モジュールをパイプラインに追加します。Add the Multiclass Boosted Decision Tree module to your pipeline.

  2. [Create trainer mode](トレーナー モードの作成) オプションを設定して、モデルのトレーニング方法を指定します。Specify how you want the model to be trained by setting the Create trainer mode option.

    • Single Parameter (単一パラメーター) : モデルの構成方法がわかっている場合、特定の値のセットを引数として渡すことができます。Single Parameter: If you know how you want to configure the model, you can provide a specific set of values as arguments.

    • [Parameter Range](パラメーター範囲) : 最適なパラメーターがわからず、パラメーター スイープを実行する場合は、このオプションを選択します。Parameter Range: Select this option if you are not sure of the best parameters, and want to run a parameter sweep. 反復する値の範囲を選択します。モデルのハイパーパラメーターの調整では、指定した設定の可能なすべての組み合わせに対して反復処理を行い、最適な結果を生成するハイパーパラメーターを決定します。Select a range of values to iterate over, and the Tune Model Hyperparameters iterates over all possible combinations of the settings you provided to determine the hyperparameters that produce the optimal results.

  3. [Maximum number of leaves per tree](ツリーあたりの最大リーフ数) は、ツリーに作成できる終端ノード (リーフ) の最大数を制限します。Maximum number of leaves per tree limits the maximum number of terminal nodes (leaves) that can be created in any tree.

     By increasing this value, you potentially increase the size of the tree and achieve higher precision, at the risk of overfitting and longer training time.
    
  4. [Minimum number of samples per leaf node](リーフ ノードごとの最小サンプル数) は、ツリーの終端ノード (リーフ) を作成するうえで必要なケース数を指定します。Minimum number of samples per leaf node indicates the number of cases required to create any terminal node (leaf) in a tree.

      By increasing this value, you increase the threshold for creating new rules. For example, with the default value of 1, even a single case can cause a new rule to be created. If you increase the value to 5, the training data would have to contain at least five cases that meet the same conditions.
    
  5. [学習速度] は、学習時のステップ サイズを定義します。Learning rate defines the step size while learning. 0 から 1 までの数値を入力してください。Enter a number between 0 and 1.

      The learning rate determines how fast or slow the learner converges on an optimal solution. If the step size is too large, you might overshoot the optimal solution. If the step size is too small, training takes longer to converge on the best solution.
    
  6. [Number of trees constructed](構築するツリーの数) は、集団として作成するデシジョン ツリーの総数を指定します。Number of trees constructed indicates the total number of decision trees to create in the ensemble. 作成するデシジョン ツリーを増やすと、カバレッジが向上する可能性はありますが、トレーニング時間が長くなります。By creating more decision trees, you can potentially get better coverage, but training time will increase.

  7. [Random number seed](乱数シード) に、ランダム シード値として使用する値 (負でない整数) を必要に応じて設定します。Random number seed optionally sets a non-negative integer to use as the random seed value. シードを指定することによって、同じデータとパラメーターで繰り返し実行したときの再現性が確保されます。Specifying a seed ensures reproducibility across runs that have the same data and parameters.

      The random seed is set by default to 42. Successive runs using different random seeds can have different results.
    

注意

[Create trainer mode](トレーナー モードの作成)[Single Parameter](単一パラメーター) に設定した場合は、タグ付けされたデータセットとモデルのトレーニング モジュールを接続します。If you set Create trainer mode to Single Parameter, connect a tagged dataset and the Train Model module.

次のステップNext steps

Azure Machine Learning で使用できる一連のモジュールを参照してください。See the set of modules available to Azure Machine Learning.