チュートリアル:デザイナーを使用して自動車の価格を予測する (プレビュー)Tutorial: Predict automobile price with the designer (preview)

適用先: 無効Basic エディション 有効Enterprise エディション                       (Enterprise にアップグレード)APPLIES TO: noBasic edition yesEnterprise edition                       (Upgrade to Enterprise)

この 2 部構成のチュートリアルでは、Azure Machine Learning のデザイナーを使用して、自動車の価格を予測する機械学習モデルをトレーニングおよびデプロイする方法について説明します。In this two-part tutorial, you learn how to use the Azure Machine Learning designer to train and deploy a machine learning model that predicts the price of any car. このデザイナーはドラッグ アンド ドロップ式のツールであり、コードを 1 行も書くことなく機械学習モデルを作成できます。The designer is a drag-and-drop tool that lets you create machine learning models without a single line of code.

チュートリアルのパート 1 で学習する内容は次のとおりです。In part one of the tutorial, you'll learn how to:

  • 新しいパイプラインを作成する。Create a new pipeline.
  • データをインポートする。Import data.
  • データを準備する。Prepare data.
  • 機械学習モデルをトレーニングする。Train a machine learning model.
  • 機械学習モデルを評価する。Evaluate a machine learning model.

チュートリアルのパート 2 では、リアルタイム推論エンドポイントとしてモデルをデプロイし、送信した技術仕様に基づいて任意の自動車の価格を予測します。In part two of the tutorial, you'll deploy your model as a real-time inferencing endpoint to predict the price of any car based on technical specifications you send it.

注意

このチュートリアルの完成版をサンプル パイプラインとして入手できます。A completed version of this tutorial is available as a sample pipeline.

これを見つけるには、ワークスペースのデザイナーに移動します。To find it, go to the designer in your workspace. [新しいパイプライン] セクションで [Sample 1 - Regression:Automobile Price Prediction(Basic)](サンプル 1 - 回帰: 自動車価格の予測 (Basic)) を選択してください。In the New pipeline section, select Sample 1 - Regression: Automobile Price Prediction(Basic).

新しいパイプラインを作成するCreate a new pipeline

Azure Machine Learning パイプラインによって、複数の機械学習ステップとデータ処理ステップが 1 つのリソースに整理されます。Azure Machine Learning pipelines organize multiple machine learning and data processing steps into a single resource. 複数のプロジェクトや複数のユーザーにまたがる複雑な機械学習ワークフローをパイプラインで効率的に整理、管理、再利用することができます。Pipelines let you organize, manage, and reuse complex machine learning workflows across projects and users.

Azure Machine Learning パイプラインを作成するには、Azure Machine Learning ワークスペースが必要です。To create an Azure Machine Learning pipeline, you need an Azure Machine Learning workspace. このセクションでは、その両方のリソースを作成する方法について説明します。In this section, you learn how to create both these resources.

新しいワークスペースを作成するCreate a new workspace

デザイナーを使用するためには、まず Azure Machine Learning ワークスペースが必要です。In order to use the designer, you first need an Azure Machine Learning workspace. ワークスペースは、Azure Machine Learning の最上位のリソースで、Azure Machine Learning で作成するすべての成果物を操作するための一元的な場所を提供します。The workspace is the top-level resource for Azure Machine Learning, it provides a centralized place to work with all the artifacts you create in Azure Machine Learning.

Azure Machine Learning ワークスペース (Enterprise Edition) がある場合は、次のセクションに進みますIf you have an Azure Machine Learning workspace with an Enterprise edition, skip to the next section.

  1. ご利用の Azure サブスクリプションの資格情報を使って、Azure portal にサインインします。Sign in to the Azure portal by using the credentials for your Azure subscription.

  2. Azure portal の左上隅にある [+ リソースの作成] を選択します。In the upper-left corner of the Azure portal, select + Create a resource.

    新しいリソースを作成

  3. 検索バーを使用して、Machine Learning を見つけます。Use the search bar to find Machine Learning.

  4. [Machine Learning] を選択します。Select Machine Learning.

  5. [Machine Learning] ウィンドウで、 [作成] を選択して開始します。In the Machine Learning pane, select Create to begin.

  6. 新しいワークスペースを構成するには、次の情報を指定します。Provide the following information to configure your new workspace:

    フィールドField 説明Description
    ワークスペース名Workspace name ワークスペースを識別する一意の名前を入力します。Enter a unique name that identifies your workspace. この例では、docs-ws を使用します。In this example, we use docs-ws. 名前は、リソース グループ全体で一意である必要があります。Names must be unique across the resource group. 覚えやすく、他のユーザーが作成したワークスペースと区別しやすい名前を使用します。Use a name that's easy to recall and to differentiate from workspaces created by others.
    サブスクリプションSubscription 使用する Azure サブスクリプションを選択します。Select the Azure subscription that you want to use.
    Resource groupResource group サブスクリプションの既存のリソース グループを使用するか、任意の名前を入力して新しいリソース グループを作成します。Use an existing resource group in your subscription, or enter a name to create a new resource group. リソース グループは、Azure ソリューションの関連するリソースを保持します。A resource group holds related resources for an Azure solution. この例では、docs-aml を使用します。In this example, we use docs-aml.
    LocationLocation ユーザーとデータ リソースに最も近い場所を選択し、ワークスペースを作成します。Select the location closest to your users and the data resources to create your workspace.
    ワークスペースのエディションWorkspace edition [Enterprise] を選択します。Select Enterprise. このチュートリアルでは、Enterprise エディションを使用する必要があります。This tutorial requires the use of the Enterprise edition. Enterprise エディションはプレビュー段階であり、現時点では特別なコストは追加されません。The Enterprise edition is in preview and doesn't currently add any extra costs.
  7. ワークスペースの構成が完了したら、 [作成] を選択します。After you're finished configuring the workspace, select Create.

    警告

    クラウドへのワークスペースの作成には数分かかる場合があります。It can take several minutes to create your workspace in the cloud.

    プロセスが完了すると、デプロイ成功メッセージが表示されます。When the process is finished, a deployment success message appears.

  8. 新しいワークスペースを表示するには、 [Go to resource](リソースに移動) を選択します。To view the new workspace, select Go to resource.

パイプラインを作成するCreate the pipeline

  1. ml.azure.com にサインインし、使用するワークスペースを選択します。Sign in to ml.azure.com, and select the workspace you want to work with.

  2. [デザイナー] を選択します。Select Designer.

    デザイナーへのアクセス方法を示すビジュアル ワークスペースのスクリーンショット

  3. [Easy-to-use prebuilt modules](あらかじめ構築された使いやすいモジュール) を選択します。Select Easy-to-use prebuilt modules.

  4. キャンバスの上部にある既定のパイプライン名 Pipeline-Created-on を選択します。At the top of the canvas, select the default pipeline name Pipeline-Created-on. この名前を Automobile price prediction (自動車価格の予測) に変更します。Rename it to Automobile price prediction. 名前は一意でなくてもかまいません。The name doesn't need to be unique.

既定のコンピューティング先を設定するSet the default compute target

パイプラインは、ワークスペースにアタッチされたコンピューティング リソースであるコンピューティング先で実行されます。A pipeline runs on a compute target, which is a compute resource that's attached to your workspace. コンピューティング先を作成した後、それを将来の実行のために再利用できます。After you create a compute target, you can reuse it for future runs.

パイプライン全体の既定のコンピューティング先を設定できます。この設定により、既定で同じコンピューティング先を使用するようすべてのモジュールに伝えられます。You can set a Default compute target for the entire pipeline, which will tell every module to use the same compute target by default. ただしコンピューティング先は、モジュールごとに自分で指定することができます。However, you can specify compute targets on a per-module basis.

  1. キャンバス上部の、パイプライン名の横に表示される 歯車アイコンのスクリーンショット (歯車アイコン) を選択して [設定] ペインを開きます。Next to the pipeline name, select the Gear icon Screenshot of the gear icon at the top of the canvas to open the Settings pane.

  2. キャンバスの右側にある [設定] ペインで、 [コンピューティング先を選択] を選択します。In the Settings pane to the right of the canvas, select Select compute target.

    使用できるコンピューティング先が既にある場合は、それを選択してこのパイプラインを実行できます。If you already have an available compute target, you can select it to run this pipeline.

    注意

    デザイナーは、Azure Machine Learning コンピューティングおよび Azure Machine Learning コンピューティング インスタンスのコンピューティング先でのみトレーニング実験を実行できます。The designer can only run training experiments on Azure Machine Learning Compute and Azure Machine Learning compute instance targets. その他のコンピューティング先は表示されません。Other compute targets won't be shown.

  3. コンピューティング リソースの名前を入力します。Enter a name for the compute resource.

  4. [保存] を選択します。Select Save.

    注意

    コンピューティング リソースを作成するには約 5 分かかります。It takes approximately five minutes to create a compute resource. リソースの作成後は、それを再利用できるため、今後の実行では、この待機時間をスキップできます。After the resource is created, you can reuse it and skip this wait time for future runs.

    コンピューティング リソースは、コストを節約するために、アイドル状態のときは 0 ノードに自動スケーリングされます。The compute resource autoscales to zero nodes when it's idle to save cost. しばらくしてからそれを再度使用すると、スケールアップして元に戻すときに約 5 分の待機時間が発生することがあります。When you use it again after a delay, you might experience approximately five minutes of wait time while it scales back up.

データのインポートImport data

デザイナーには、実験に利用できるいくつかのサンプル データセットが含まれています。There are several sample datasets included in the designer for you to experiment with. このチュートリアルでは、Automobile price data (Raw) を使用します。For this tutorial, use Automobile price data (Raw).

  1. パイプライン キャンバスの左側には、データセットとモジュールのパレットがあります。To the left of the pipeline canvas is a palette of datasets and modules. [データセット] を選択し、 [サンプル] セクションを見て、利用可能なサンプル データセットを確認します。Select Datasets, and then view the Samples section to view the available sample datasets.

  2. Automobile price data (Raw) データセットを選択し、キャンバスにドラッグします。Select the dataset Automobile price data (Raw), and drag it onto the canvas.

    データをキャンバスにドラッグする

データの視覚化Visualize the data

使用するデータセットを把握するために、データを視覚化することができます。You can visualize the data to understand the dataset that you'll use.

  1. Automobile price data (Raw) モジュールを選択します。Select the Automobile price data (Raw) module.

  2. キャンバスの右側にある [モジュールの詳細] ペインで [Outputs + log](出力 + ログ) を選択します。In the module details pane to the right of the canvas, select Outputs + log.

  3. グラフ アイコンを選択してデータを視覚化します。Select the graph icon to visualize the data.

    データの視覚化

  4. データ ウィンドウで別の列を選択して、それぞれの情報を表示します。Select the different columns in the data window to view information about each one.

    各行は自動車を表していて、各自動車に関連付けられている変数が列として表示されます。Each row represents an automobile, and the variables associated with each automobile appear as columns. このデータセット内には、205 の行と 26 の列があります。There are 205 rows and 26 columns in this dataset.

データを準備するPrepare data

通常、データセットには、分析前にある程度の前処理が必要です。Datasets typically require some preprocessing before analysis. データセットを検査したときに、いくつか不足値があることに気付いたかもしれません。You might have noticed some missing values when you inspected the dataset. モデルがデータを正しく分析するには、これらの不足値を整理する必要があります。These missing values must be cleaned so that the model can analyze the data correctly.

列の削除Remove a column

モデルをトレーニングする際は、欠損データに対処する必要があります。When you train a model, you have to do something about the data that's missing. このデータセットでは、normalized-losses 列に多数の欠損値が存在するので、その列全体をモデルから除外します。In this dataset, the normalized-losses column is missing many values, so you will exclude that column from the model altogether.

  1. キャンバスの左側にあるモジュール パレットで [データ変換] セクションを展開し、 [Select Columns in Dataset](データセットの列を選択する) モジュールを見つけます。In the module palette to the left of the canvas, expand the Data Transformation section and find the Select Columns in Dataset module.

  2. [Select Columns in Dataset](データセットの列を選択する) モジュールをキャンバスにドラッグします。Drag the Select Columns in Dataset module onto the canvas. データセット モジュールの下のモジュールを削除します。Drop the module below the dataset module.

  3. Automobile price data (Raw) データセットを、 [Select Columns in Dataset](データセットの列を選択する) モジュールに接続します。Connect the Automobile price data (Raw) dataset to the Select Columns in Dataset module. データセットの出力ポート (キャンバス上のデータセットの下部にある小さい円) から [Select Columns in Dataset](データセットの列を選択する) の入力ポート (モジュールの上部にある小さい円) までドラッグします。Drag from the dataset's output port, which is the small circle at the bottom of the dataset on the canvas, to the input port of Select Columns in Dataset, which is the small circle at the top of the module.

    ヒント

    1 つのモジュールの出力ポートを別のモジュールの入力ポートに接続するときに、パイプラインを通じてデータのフローを作成することになります。You create a flow of data through your pipeline when you connect the output port of one module to an input port of another.

    モジュールの接続

  4. Select Columns in Dataset (データセットの列を選択する) モジュールを選択します。Select the Select Columns in Dataset module.

  5. キャンバスの右側にある [モジュールの詳細] ペインで [列の編集] を選択します。In the module details pane to the right of the canvas, select Edit column.

  6. [Include](対象) の横にある [列名] ボックスの一覧を展開し、 [すべての列] を選択します。Expand the Column names drop down next to Include, and select All columns.

  7. [+] を選択し、新しいルールを追加します。Select the + to add a new rule.

  8. ドロップダウン メニューから [Exclude](除外)[列名] を選択します。From the drop-down menus, select Exclude and Column names.

  9. テキスト ボックスに「normalized-losses」と入力します。Enter normalized-losses in the text box.

  10. 右下の [保存] を選択して列セレクターを閉じます。In the lower right, select Save to close the column selector.

    列を除外する

  11. Select Columns in Dataset (データセットの列を選択する) モジュールを選択します。Select the Select Columns in Dataset module.

  12. キャンバスの右側にある [モジュールの詳細] ペインで [コメント] ボックスを選択し、「Exclude normalized losses」と入力します。In the module details pane to the right of the canvas, select the Comment text box and enter Exclude normalized losses.

    コメントがグラフに表示されることで、パイプラインが整理しやすくなります。Comments will appear on the graph to help you organize your pipeline.

見つからないデータのクリーンアップClean missing data

normalized-losses 列を削除した後も、データセットにはまだ欠損値が存在します。Your dataset still has missing values after you remove the normalized-losses column. 残りの欠損データは [Clean Missing Data](見つからないデータのクリーンアップ) モジュールを使用して削除できます。You can remove the remaining missing data by using the Clean Missing Data module.

ヒント

デザイナーでは、欠損値を入力データから取り除くことが、ほとんどのモジュールを使用するための前提条件となっています。Cleaning the missing values from input data is a prerequisite for using most of the modules in the designer.

  1. キャンバスの左側にあるモジュール パレットで [データ変換] セクションを展開し、 [Clean Missing Data](見つからないデータのクリーンアップ) モジュールを見つけます。In the module palette to the left of the canvas, expand the section Data Transformation, and find the Clean Missing Data module.

  2. [Clean Missing Data](見つからないデータのクリーンアップ) モジュールをパイプライン キャンバスにドラッグします。Drag the Clean Missing Data module to the pipeline canvas. それを [Select Columns in Dataset](データセットの列を選択する) モジュールに接続します。Connect it to the Select Columns in Dataset module.

  3. [Clean Missing Data](見つからないデータのクリーンアップ) モジュールを選択します。Select the Clean Missing Data module.

  4. キャンバスの右側にある [モジュールの詳細] ペインで [列の編集] を選択します。In the module details pane to the right of the canvas, select Edit Column.

  5. 表示される [クリーニング対象の列] ウィンドウで、 [含める] の横にあるドロップダウン メニューを展開します。In the Columns to be cleaned window that appears, expand the drop-down menu next to Include. [すべての列] を選択しますSelect, All columns

  6. [保存] を選びます。Select Save

  7. キャンバスの右側にある [モジュールの詳細] ペインで、 [Cleaning mode](クリーニング モード)[Remove entire row](行全体を削除) を選択します。In the module details pane to the right of the canvas, select Remove entire row under Cleaning mode.

  8. キャンバスの右側にある [モジュールの詳細] ペインで [コメント] ボックスを選択し、「Remove missing value rows」と入力します。In the module details pane to the right of the canvas, select the Comment box, and enter Remove missing value rows.

    これでパイプラインは次のようになっているはずです。Your pipeline should now look something like this:

    Select-column

機械学習モデルのトレーニングTrain a machine learning model

データを処理するためのモジュールが揃ったら、トレーニング モジュールを設定することができます。Now that you have the modules in place to process the data, you can set up the training modules.

予測したい価格は数値であるため、回帰アルゴリズムを使用できます。Because you want to predict price, which is a number, you can use a regression algorithm. この例では、線形回帰モデルを使用します。For this example, you use a linear regression model.

データを分割するSplit the data

データの分割は、機械学習における一般的なタスクです。Splitting data is a common task in machine learning. ここでは、データを 2 つの独立したデータセットに分割します。You will split your data into two separate datasets. 一方のデータセットでモデルをトレーニングし、もう一方のデータセットでモデルの精度をテストします。One dataset will train the model and the other will test how well the model performed.

  1. モジュール パレットで [データ変換] セクションを展開し、 [Split Data](データの分割) モジュールを見つけます。In the module palette, expand the section Data Transformation and find the Split Data module.

  2. [Split Data](データの分割) モジュールをパイプライン キャンバスにドラッグします。Drag the Split Data module to the pipeline canvas.

  3. [Clean Missing Data](見つからないデータのクリーンアップ) モジュールの左側のポートを [Split Data](データの分割) モジュールに接続します。Connect the left port of the Clean Missing Data module to the Split Data module.

    重要

    [Split Data](データの分割) には必ず、 [Clean Missing Data](見つからないデータのクリーンアップ) の左側の出力ポートを接続してください。Be sure that the left output ports of Clean Missing Data connects to Split Data. クリーンアップされたデータは、左側のポートに格納されます。The left port contains the the cleaned data. 右側のポートには、破棄されたデータが格納されます。The right port contains the discarted data.

  4. [Split Data](データの分割) モジュールを選択します。Select the Split Data module.

  5. キャンバスの右側にある [モジュールの詳細] ペインで、 [Fraction of rows in the first output dataset](最初の出力データセット内の行の割合) を 0.7 に設定します。In the module details pane to the right of the canvas, set the Fraction of rows in the first output dataset to 0.7.

    このオプションによって、データの 70% をモデルのトレーニング、30% をテストに分割します。This option splits 70 percent of the data to train the model and 30 percent for testing it. 70% のデータセットには、左側の出力ポートからアクセスできます。The 70 percent dataset will be accessible through the left output port. 残りのデータには、右側の出力ポートからアクセスできます。The remaining data will be available through the right output port.

  6. キャンバスの右側にある [モジュールの詳細] ペインで [コメント] ボックスを選択し、「Split the dataset into training set (0.7) and test set (0.3) 」と入力します。In the module details pane to the right of the canvas, select the Comment box, and enter Split the dataset into training set (0.7) and test set (0.3).

モデルをトレーニングするTrain the model

価格が含まれたデータセットを指定して、モデルをトレーニングします。Train the model by giving it a dataset that includes the price. トレーニング データによって提示された価格と特徴との間の関係を説明するモデルがアルゴリズムによって構築されます。The algorithm constructs a model that explains the relationship between the features and the price as presented by the training data.

  1. モジュール パレットで [Machine Learning Algorithms](機械学習アルゴリズム) を展開します。In the module palette, expand Machine Learning Algorithms.

    このオプションによって、学習アルゴリズムの初期化に使用できるモジュールのカテゴリが複数表示されます。This option displays several categories of modules that you can use to initialize learning algorithms.

  2. [Regression](回帰) > [Linear Regression](線形回帰) の順に選択し、パイプライン キャンバスにドラッグします。Select Regression > Linear Regression, and drag it to the pipeline canvas.

  3. モジュール パレットで [Module training](モジュールのトレーニング) セクションを展開し、 [Train Model](モデルのトレーニング) モジュールをキャンバスにドラッグします。In the module palette, expand the section Module training, and drag the Train Model module to the canvas.

  4. [Linear Regression](線形回帰) モジュールの出力を [Train Model](モデルのトレーニング) モジュールの左側の入力に接続します。Connect the output of the Linear Regression module to the left input of the Train Model module.

  5. [Split Data](データの分割) モジュールのトレーニング データ出力 (左側のポート) を [Train Model](モデルのトレーニング) モジュールの右側の入力に接続します。Connect the training data output (left port) of the Split Data module to the right input of the Train Model module.

    重要

    [Train Model](モデルのトレーニング) には必ず、 [Split Data](データの分割) の左側の出力ポートを接続してください。Be sure that the left output ports of Split Data connects to Train Model. トレーニング セットは、左側のポートに格納されます。The left port contains the the training set. 右側のポートには、テスト セットが格納されます。The right port contains the test set.

    Train Model (モデルのトレーニング) モジュールの正しい構成を示すスクリーンショット。

  6. Train Model (モデルのトレーニング) モジュールを選択します。Select the Train Model module.

  7. キャンバスの右側にある [モジュールの詳細] ペインで [列の編集] セレクターを選択します。In the module details pane to the right of the canvas, select Edit column selector.

  8. [Label column](ラベル列) ダイアログ ボックスのドロップダウン メニューを展開して [列名] を選択します。In the Label column dialog box, expand the drop-down menu and select Column names.

  9. テキスト ボックスに「price」(価格) を入力して、モデルで予測しようとする値を指定します。In the text box, enter price to specify the value that your model is going to predict.

    重要

    列名を正確に入力してください。Make sure you enter the column name exactly. price は大文字にしないでください。Do not capitalize price.

    パイプラインは次のようになっているはずです。Your pipeline should look like this:

    [Train Model](モデルのトレーニング) モジュールを追加した後のパイプラインの正しい構成を示すスクリーンショット。

[Score Model](モデルのスコア付け) モジュールを追加するAdd the Score Model module

データの 70% を使用してモデルをトレーニングした後で、残りの 30% にスコアを付け、モデルの精度を確認します。After you train your model by using 70 percent of the data, you can use it to score the other 30 percent to see how well your model functions.

  1. 検索ボックスに「score model」と入力して、 [Score Model](モデルのスコア付け) モジュールを見つけます。Enter score model in the search box to find the Score Model module. モジュールをパイプライン キャンバスにドラッグします。Drag the module to the pipeline canvas.

  2. Train Model (モデルのトレーニング) モジュールの出力を、Score Model (モデルのスコア付け) の左側の入力ポートに接続します。Connect the output of the Train Model module to the left input port of Score Model. Split Data (データの分割) モジュールのテスト データの出力 (右側のポート) を、Score Model (モデルのスコア付け) の右側の入力ポートに接続します。Connect the test data output (right port) of the Split Data module to the right input port of Score Model.

モデルの評価モジュールを追加するAdd the Evaluate Model module

モデルがどの程度の精度でテスト データセットにスコア付けしたかを、 [Evaluate Model](モデルの評価) モジュールを使用して評価します。Use the Evaluate Model module to evaluate how well your model scored the test dataset.

  1. 検索ボックスに「evaluate」と入力して、 [Evaluate Model](モデルの評価) モジュールを見つけます。Enter evaluate in the search box to find the Evaluate Model module. モジュールをパイプライン キャンバスにドラッグします。Drag the module to the pipeline canvas.

  2. Score Model (モデルのスコア付け) モジュールの出力を、Evaluate Model (モデルの評価) の左側の入力に接続します。Connect the output of the Score Model module to the left input of Evaluate Model.

    最終的なパイプラインは次のようになっているはずです。The final pipeline should look something like this:

    パイプラインの正しい構成を示すスクリーンショット。

パイプラインを送信するSubmit the pipeline

パイプラインの設定がすべて完了したら、パイプラインの実行を送信して機械学習モデルをトレーニングすることができます。Now that your pipeline is all setup, you can submit a pipeline run to train your machine learning model. 有効なパイプライン実行をいつでも送信できます。これを使用すると、開発中にパイプラインの変更を確認できます。You can submit a valid pipeline run at any point, which can be used to review changes to your pipeline during development.

  1. キャンバス上部の [Submit](送信) を選択します。At the top of the canvas, select Submit.

  2. [Set up pipeline run](パイプライン実行のセットアップ) ダイアログ ボックスで、 [Create new](新規作成) を選択します。In the Set up pipeline run dialog box, select Create new.

    注意

    実験グループの同様のパイプラインは同時に実行されます。Experiments group similar pipeline runs together. パイプラインを複数回実行する場合は、一連の実行に対して同じ実験を選択できます。If you run a pipeline multiple times, you can select the same experiment for successive runs.

    1. [New experiment Name](新しい実験名) にわかりやすい名前を入力します。Enter a descriptive name for New experiment Name.

    2. [Submit](送信) をクリックします。Select Submit.

    実行の状態と詳細は、キャンバスの右上で確認できます。You can view run status and details at the top right of the canvas.

    最初の実行の場合は、パイプラインの実行が完了するまでに最大 20 分かかることがあります。If is the first run, it may take up to 20 minutes for your pipeline to finish running. 既定のコンピューティング設定の最小ノード サイズは 0 です。これは、アイドル状態になった後に、デザイナーによってリソースが割り当てられる必要があることを意味します。The default compute settings have a minimum node size of 0, which means that the designer must allocate resources after being idle. コンピューティング リソースが既に割り当てられているため、パイプラインの反復実行にかかる時間は短くなります。Repeated pipeline runs will take less time since the compute resources are already allocated. さらにデザイナーでは、各モジュール用にキャッシュされた結果を使用して、効率を向上させます。Additionally, the designer uses cached results for each module to further improve efficiency.

スコア付けラベルを確認するView scored labels

実行が完了したら、パイプラインの実行結果を確認できます。After the run completes, you can view the results of the pipeline run. まず、回帰モデルによって生成された予測に注目します。First, look at the predictions generated by the regression model.

  1. [Score Model](モデルのスコア付け) モジュールを選択して、その出力を表示します。Select the Score Model module to view its output.

  2. キャンバスの右側にある [モジュールの詳細] ペインで、 [Outputs + logs](出力 + ログ)視覚化アイコン (グラフ アイコン) の順に選択して結果を表示します。In the module details pane to the right of the canvas, select Outputs + logs > graph icon visualize icon to view results.

    ここでは、予測された価格と、データのテストによる実際の価格を確認できます。Here you can see the predicted prices and the actual prices from the testing data.

    Scored Label (スコア付けラベル) 列が強調表示された状態の出力の視覚化のスクリーンショット

モデルを評価するEvaluate models

テスト データセットに対してトレーニング済みのモデルがどの程度の精度で実行されたかを [Evaluate Model](モデルの評価) を使用して確認します。Use the Evaluate Model to see how well the trained model performed on the test dataset.

  1. [Evaluate Model](モデルの評価) モジュールを選択して、その出力を表示します。Select the Evaluate Model module to view its output.

  2. キャンバスの右側にある [モジュールの詳細] ペインで、 [Outputs + logs](出力 + ログ)視覚化アイコン (グラフ アイコン) の順に選択して結果を表示します。In the module details pane to the right of the canvas, select Outputs + logs > graph icon visualize icon to view results.

作成したモデルに対して、以下の統計値が表示されます。The following statistics are shown for your model:

  • Mean Absolute Error (MAE、平均絶対誤差):絶対誤差の平均。Mean Absolute Error (MAE): The average of absolute errors. 誤差とは、予測された値と実際の値との差です。An error is the difference between the predicted value and the actual value.
  • Root Mean Squared Error (RMSE、二乗平均平方根誤差):テスト データセットに対して実行した予測の二乗誤差平均の平方根です。Root Mean Squared Error (RMSE): The square root of the average of squared errors of predictions made on the test dataset.
  • Relative Absolute Error (相対絶対誤差):実際の値とすべての実際の値の平均との絶対差を基準にした絶対誤差の平均です。Relative Absolute Error: The average of absolute errors relative to the absolute difference between actual values and the average of all actual values.
  • Relative Squared Error (相対二乗誤差):実際の値とすべての実際の値の平均との二乗差を基準にした二乗誤差の平均です。Relative Squared Error: The average of squared errors relative to the squared difference between the actual values and the average of all actual values.
  • Coefficient of Determination (決定係数):R-2 乗値ともいいます。どの程度モデルが高い精度でデータと適合するかを示す統計指標です。Coefficient of Determination: Also known as the R squared value, this statistical metric indicates how well a model fits the data.

この誤差の統計情報は、それぞれ小さいほど良いとされます。For each of the error statistics, smaller is better. 値が小さいほど、予測が実際の値により近いことを示します。A smaller value indicates that the predictions are closer to the actual values. 決定係数では、値が 1 (1.0) に近づくほど、予測の精度が高くなります。For the coefficient of determination, the closer its value is to one (1.0), the better the predictions.

リソースをクリーンアップするClean up resources

続けてチュートリアルのパート 2 (モデルのデプロイ) を行う場合は、このセクションはスキップしてください。Skip this section if you want to continue on with part 2 of the tutorial, deploying models.

重要

作成したリソースは、Azure Machine Learning のその他のチュートリアルおよびハウツー記事の前提条件として使用できます。You can use the resources that you created as prerequisites for other Azure Machine Learning tutorials and how-to articles.

すべてを削除するDelete everything

作成したすべてのものを使用する予定がない場合は、料金が発生しないように、リソース グループ全体を削除します。If you don't plan to use anything that you created, delete the entire resource group so you don't incur any charges.

  1. Azure portal で、ウィンドウの左側にある [リソース グループ] を選択します。In the Azure portal, select Resource groups on the left side of the window.

    Azure portal でリソース グループを削除する

  2. 一覧から、作成したリソース グループを選択します。In the list, select the resource group that you created.

  3. [リソース グループの削除] を選択します。Select Delete resource group.

リソース グループを削除すると、デザイナーで作成したすべてのリソースも削除されます。Deleting the resource group also deletes all resources that you created in the designer.

個々の資産を削除するDelete individual assets

実験を作成したデザイナーで、個々の資産を選択し、 [削除] ボタンを選択してそれらを削除します。In the designer where you created your experiment, delete individual assets by selecting them and then selecting the Delete button.

ここで作成したコンピューティング ターゲットは、使用されていない場合、自動的にゼロ  ノードに自動スケーリングされます。The compute target that you created here automatically autoscales to zero nodes when it's not being used. このアクションは、料金を最小限に抑えるために実行されます。This action is taken to minimize charges. コンピューティング ターゲットを削除する場合は、次の手順を実行してください。 If you want to delete the compute target, take these steps:

アセットを削除する

各データセットを選択し、 [登録解除] を選択することによって、ワークスペースからデータセットを登録解除できます。You can unregister datasets from your workspace by selecting each dataset and selecting Unregister.

データセットの登録解除

データセットを削除するには、Azure portal または Azure Storage Explorer を使用してストレージ アカウントに移動し、これらのアセットを手動で削除します。To delete a dataset, go to the storage account by using the Azure portal or Azure Storage Explorer and manually delete those assets.

次のステップNext steps

パート 2 では、モデルをリアルタイム エンドポイントとしてデプロイする方法を学習します。In part two, you'll learn how to deploy your model as a real-time endpoint.