チュートリアル:Azure Machine Learning の自動 ML で分類モデルを作成するTutorial: Create a classification model with automated ML in Azure Machine Learning

適用先: 無効Basic エディション 有効Enterprise エディション                       (Enterprise にアップグレード)APPLIES TO: noBasic edition yesEnterprise edition                       (Upgrade to Enterprise)

このチュートリアルでは、Azure Machine Learning の自動機械学習インターフェイスを使用して、1 行のコードも記述せずに基本的な分類モデルを作成する方法について説明します。In this tutorial, you learn how to create a basic classification model without writing a single line of code using Azure Machine Learning's automated machine learning interface. この分類モデルは、クライアントが金融機関に定期預金を申し込むかどうかを予測します。This classification model predicts if a client will subscribe to a fixed term deposit with a financial institution.

自動機械学習を使用することで、時間がかかるタスクを自動化することができます。With automated machine learning, you can automate away time intensive tasks. 自動機械学習では、アルゴリズムとハイパーパラメーターのさまざまな組み合わせをすばやく反復し、選択された成功のメトリックに基づいて最適なモデルを効率的に発見します。Automated machine learning rapidly iterates over many combinations of algorithms and hyperparameters to help you find the best model based on a success metric of your choosing.

このチュートリアルでは、次のタスクを実施する方法について説明します。In this tutorial, you learn how to do the following tasks:

  • Azure Machine Learning ワークスペースを作成します。Create an Azure Machine Learning workspace.
  • 自動機械学習の実験を実行します。Run an automated machine learning experiment.
  • 実験の詳細を表示します。View experiment details.
  • モデルをデプロイします。Deploy the model.

前提条件Prerequisites

  • Azure サブスクリプション。An Azure subscription. Azure サブスクリプションをお持ちでない場合は、無料アカウントを作成してください。If you don't have an Azure subscription, create a free account.

  • bankmarketing_train.csv データ ファイルをダウンロードします。Download the bankmarketing_train.csv data file. [y] 列では、このチュートリアルの予測対象列として後で識別される定期預金に顧客が申し込んだかどうかが示されます。The y column indicates if a customer subscribed to a fixed term deposit, which is later identified as the target column for predictions in this tutorial.

ワークスペースの作成Create a workspace

Azure Machine Learning ワークスペースは、機械学習モデルを実験、トレーニング、およびデプロイするために使用する、クラウドでの基本的なリソースです。An Azure Machine Learning workspace is a foundational resource in the cloud that you use to experiment, train, and deploy machine learning models. ワークスペースは、Azure サブスクリプションとリソース グループを、サービス内の簡単に使用できるオブジェクトに結び付けます。It ties your Azure subscription and resource group to an easily consumed object in the service.

ワークスペースを作成するには、Azure リソースを管理するための Web ベースのコンソールである Azure portal を使用します。You create a workspace via the Azure portal, a web-based console for managing your Azure resources.

  1. ご利用の Azure サブスクリプションの資格情報を使って、Azure portal にサインインします。Sign in to the Azure portal by using the credentials for your Azure subscription.

  2. Azure portal の左上隅にある [+ リソースの作成] を選択します。In the upper-left corner of the Azure portal, select + Create a resource.

    新しいリソースを作成

  3. 検索バーを使用して、Machine Learning を見つけます。Use the search bar to find Machine Learning.

  4. [Machine Learning] を選択します。Select Machine Learning.

  5. [Machine Learning] ウィンドウで、 [作成] を選択して開始します。In the Machine Learning pane, select Create to begin.

  6. 新しいワークスペースを構成するには、次の情報を指定します。Provide the following information to configure your new workspace:

    フィールドField 説明Description
    ワークスペース名Workspace name ワークスペースを識別する一意の名前を入力します。Enter a unique name that identifies your workspace. この例では、docs-ws を使用します。In this example, we use docs-ws. 名前は、リソース グループ全体で一意である必要があります。Names must be unique across the resource group. 覚えやすく、他のユーザーが作成したワークスペースと区別しやすい名前を使用します。Use a name that's easy to recall and to differentiate from workspaces created by others.
    サブスクリプションSubscription 使用する Azure サブスクリプションを選択します。Select the Azure subscription that you want to use.
    Resource groupResource group サブスクリプションの既存のリソース グループを使用するか、任意の名前を入力して新しいリソース グループを作成します。Use an existing resource group in your subscription, or enter a name to create a new resource group. リソース グループは、Azure ソリューションの関連するリソースを保持します。A resource group holds related resources for an Azure solution. この例では、docs-aml を使用します。In this example, we use docs-aml.
    LocationLocation ユーザーとデータ リソースに最も近い場所を選択し、ワークスペースを作成します。Select the location closest to your users and the data resources to create your workspace.
    ワークスペースのエディションWorkspace edition [Enterprise] を選択します。Select Enterprise. このチュートリアルでは、Enterprise エディションを使用する必要があります。This tutorial requires the use of the Enterprise edition. Enterprise エディションはプレビュー段階であり、現時点では特別なコストは追加されません。The Enterprise edition is in preview and doesn't currently add any extra costs.
  7. ワークスペースの構成が完了したら、 [作成] を選択します。After you're finished configuring the workspace, select Create.

    警告

    クラウドへのワークスペースの作成には数分かかる場合があります。It can take several minutes to create your workspace in the cloud.

    プロセスが完了すると、デプロイ成功メッセージが表示されます。When the process is finished, a deployment success message appears.

  8. 新しいワークスペースを表示するには、 [Go to resource](リソースに移動) を選択します。To view the new workspace, select Go to resource.

重要

お使いのワークスペースサブスクリプションをメモしておきます。Take note of your workspace and subscription. これらは、適切な場所に実験を作成するために必要になります。You'll need these to ensure you create your experiment in the right place.

実験を作成して実行するCreate and run the experiment

https://ml.azure.com の Azure Machine Learning Studio で、次の実験の設定を完了し、ステップを実行します。Azure Machine Learning Studio は、あらゆるスキル レベルのデータ サイエンス実務者がデータ サイエンス シナリオを実行するための機械学習ツールを含む統合 Web インターフェイスです。You complete the following experiment set-up and run steps via Azure Machine learning at https://ml.azure.com, a consolidated web interface that includes machine learning tools to perform data science scenarios for data science practitioners of all skill levels. このインターフェイスは、Internet Explorer ブラウザーではサポートされていません。This interface is not supported on Internet Explorer browsers.

  1. https://ml.azure.com で Azure Machine Learning にサインインします。Sign in to Azure Machine Learning at https://ml.azure.com.

  2. お使いのサブスクリプションと、作成したワークスペースを選択します。Select your subscription and the workspace you created.

  3. [Get started](作業を開始する) を選択します。Select Get started.

  4. 左側のウィンドウの [Author](作成者) セクションで [Automated ML](自動 ML) を選択します。In the left pane, select Automated ML under the Author section.

    これは初めての自動 ML 実験であるため、空のリストとドキュメントへのリンクが表示されます。Since this is your first automated ML experiment, you'll see an empty list and links to documentation.

    開始ページ

  5. [New automated ML run](新しい自動 ML の実行) を選択します。Select New automated ML run.

  6. 新しいデータセットを作成するには、 [+ データセットの作成] ドロップダウンで [From local files](ローカル ファイルから) を選択します。Create a new dataset by selecting From local files from the +Create dataset drop-down.

    1. [基本情報] フォームでデータセットに名前を付け、必要に応じて説明を入力します。On the Basic info form, give your dataset a name and provide an optional description. 自動 ML インターフェイスでは、現在、TabularDatasets だけがサポートされています。そのため、データセットの種類は既定で "表形式" に設定されます。The automated ML interface currently only supports TabularDatasets, so the dataset type should default to Tabular.

    2. 左下の [次へ] を選択しますSelect Next on the bottom left

    3. [データストアとファイルの選択] フォームで、ワークスペースの作成時に自動的に設定された既定のデータストア、workspaceblobstore (Azure Blob Storage) を選択します。On the Datastore and file selection form, select the default datastore that was automatically set up during your workspace creation, workspaceblobstore (Azure Blob Storage). データ ファイルは、ここにアップロードすることで、ワークスペースから利用できるようになります。This is where you'll upload your data file to make it available to your workspace.

    4. [参照] を選択します。Select Browse.

    5. ローカル コンピューター上の bankmarketing_train.csv ファイルを選択します。Choose the bankmarketing_train.csv file on your local computer. これは、前提条件としてダウンロードしたファイルです。This is the file you downloaded as a prerequisite.

    6. データセットに一意の名前を付け、必要に応じて説明を入力します。Give your dataset a unique name and provide an optional description.

    7. 左下の [次へ] を選択して、ワークスペースの作成時に自動的に設定された既定のコンテナーにアップロードします。Select Next on the bottom left, to upload it to the default container that was automatically set up during your workspace creation.

      アップロードが完了すると、ファイルの種類に基づいて [Settings and preview](設定とプレビュー) フォームが事前設定されます。When the upload is complete, the Settings and preview form is pre-populated based on the file type.

    8. [Settings and preview](設定とプレビュー) フォームが次のように設定されていることを確認し、 [次へ] を選択します。Verify that the Settings and preview form is populated as follows and select Next.

      フィールドField 説明Description チュートリアルの値Value for tutorial
      ファイル形式File format ファイルに格納されているデータのレイアウトと種類を定義します。Defines the layout and type of data stored in a file. 区切り記号Delimited
      区切り記号Delimiter プレーンテキストまたは他のデータ ストリーム内の個別の独立した領域の間の境界を指定するための 1 つ以上の文字。One or more characters for specifying the boundary between  separate, independent regions in plain text or other data streams. コンマComma
      エンコードEncoding データセットの読み取りに使用する、ビットと文字のスキーマ テーブルを識別します。Identifies what bit to character schema table to use to read your dataset. UTF-8UTF-8
      列見出しColumn headers データセットの見出しがある場合、それがどのように処理されるかを示します。Indicates how the headers of the dataset, if any, will be treated. すべてのファイルのヘッダーを同じものにするAll files have same headers
      行のスキップSkip rows データセット内でスキップされる行がある場合、その行数を示します。Indicates how many, if any, rows are skipped in the dataset. なしNone
    9. [スキーマ] フォームを使用すると、この実験用にデータをさらに構成できます。The Schema form allows for further configuration of your data for this experiment. この例では、day_of_week 特徴のトグル スイッチを選択して、この実験に含めないようにします。For this example, select the toggle switch for the day_of_week feature, so as to not include it for this experiment. [次へ] を選択します。Select Next.

      [プレビュー] タブの構成

    10. [詳細の確認] フォームで、 [基本情報] および [Settings and preview](設定とプレビュー) のフォームに入力された情報が一致していることを確認します。On the Confirm details form, verify the information matches what was previously populated on the Basic info and Settings and preview forms.

    11. [作成] を選択して、データセットの作成を完了します。Select Create to complete the creation of your dataset.

    12. リストにデータセットが表示されたら、それを選択します。Select your dataset once it appears in the list.

    13. [Data preview](データのプレビュー) を確認して [day_of_week] が含まれていないことを確保してから、 [OK] を選択します。Review the Data preview to ensure you didn't include day_of_week then, select OK.

    14. [次へ] を選択します。Select Next.

  7. 次のように [Configure Run](構成の実行) フォームに入力します。Populate the Configure Run form as follows:

    1. この実験の名前として「my-1st-automl-experiment」と入力します。Enter this experiment name: my-1st-automl-experiment

    2. 予測するターゲット列として、 [y] を選択します。Select y as the target column, what you want to predict. この列には、クライアントが定期預金を申し込むかどうかが示されます。This column indicates whether the client subscribed to a term deposit or not.

    3. [Create a new compute](新しいコンピューティングの作成) を選択し、コンピューティング先を構成します。Select Create a new compute and configure your compute target. コンピューティング先とは、トレーニング スクリプトを実行したりサービスのデプロイをホストしたりするために使用されるローカルまたはクラウド ベースのリソース環境です。A compute target is a local or cloud-based resource environment used to run your training script or host your service deployment. この実験では、クラウド ベースのコンピューティングを使用します。For this experiment, we use a cloud-based compute.

      フィールドField 説明Description チュートリアルの値Value for tutorial
      コンピューティング名Compute name コンピューティング コンテキストを識別する一意名。A unique name that identifies your compute context. automl-computeautoml-compute
      仮想マシンのサイズ  Virtual machine size コンピューティングの仮想マシン サイズを選択します。Select the virtual machine size for your compute. Standard_DS12_V2Standard_DS12_V2
      最小および最大ノード ([詳細設定] 内)Min / Max nodes (in Advanced Settings) データをプロファイリングするには、1 つ以上のノードを指定する必要があります。To profile data, you must specify 1 or more nodes. 最小ノード: 1Min nodes: 1
      最大ノード: 6Max nodes: 6
      1. [作成] を選択して、コンピューティング先を取得します。Select Create to get the compute target.

        完了するまでに数分かかります。This takes a couple minutes to complete.

      2. 作成後、ドロップダウン リストから新しいコンピューティング先を選択します。After creation, select your new compute target from the drop-down list.

    4. [次へ] を選択します。Select Next.

  8. [Task type and settings](タスクの種類と設定) フォームで、機械学習のタスクの種類として [分類] を選択します。On the Task type and settings form, select Classification as the machine learning task type.

    1. [View additional configuration settings](追加の構成設定を表示) を選択し、次のようにフィールドを設定します。Select View additional configuration settings and populate the fields as follows. これらは、トレーニング ジョブをより細かく制御するための設定です。These settings are to better control the training job. 設定しない場合、実験の選択とデータに基づいて既定値が適用されます。Otherwise, defaults are applied based on experiment selection and data.

      注意

      このチュートリアルでは、メトリック スコアまたはイテレーションあたりの最大コア数のしきい値は設定しません。In this tutorial, you won't set a metric score or max cores per iterations threshold. また、アルゴリズムのテストをブロックしません。Nor will you block algorithms from being tested.

      追加の構成 Additional configurations 説明Description チュートリアル用の値  Value for tutorial
      主要メトリックPrimary metric 機械学習アルゴリズムを測定される評価メトリック。Evaluation metric that the machine learning algorithm will be measured by. AUC_weightedAUC_weighted
      自動特徴付けAutomatic featurization 前処理が有効になります。Enables preprocessing. これには、合成的特徴を生成するための自動データ クレンジング、準備、変換が含まれます。This includes automatic data cleansing, preparing, and transformation to generate synthetic features. 有効化Enable
      ブロックされたアルゴリズムBlocked algorithms トレーニング ジョブから除外するアルゴリズムAlgorithms you want to exclude from the training job なしNone
      終了条件Exit criterion 条件が満たされると、トレーニング ジョブが停止します。If a criteria is met, the training job is stopped. トレーニング ジョブ時間 (時間): 1Training job time (hours): 1
      メトリック スコアしきい値: なしMetric score threshold: None
      検証Validation クロス検証タイプとテストの回数を選択します。Choose a cross-validation type and number of tests. 検証タイプ:Validation type:
       k 分割交差検証  k-fold cross-validation

      検証の数: 2Number of validations: 2
      コンカレンシーConcurrency イテレーションごとに実行される並列イテレーションの最大数The maximum number of parallel iterations executed per iteration  最大同時イテレーション数: 5Max concurrent iterations: 5

      [保存] を選択します。Select Save.

  9. [完了] を選択して実験を実行します。Select Finish to run the experiment. 実験の準備が開始されると、 [Run Detail](実行の詳細) 画面が開いて、一番上に [Run status](実行の状態) が表示されます。The Run Detail screen opens with the Run status at the top as the experiment preparation begins.

重要

実験の実行の準備に、10 から 15 分かかります。Preparation takes 10-15 minutes to prepare the experiment run. 実行の開始後、各イテレーションのためにさらに 2、3 分かかります。Once running, it takes 2-3 minutes more for each iteration.
実験の進行に応じて実行の状態を確認するには、 [最新の情報に更新] を定期的に選択します。Select Refresh periodically to see the status of the run as the experiment progresses.

運用環境では、しばらく席を離れるかもしれません。In production, you'd likely walk away for a bit. ただし、このチュートリアルでは、他のイテレーションが実行中でも、アルゴリズムのテストが終わりしだい、 [モデル] タブで調査することをお勧めします。But for this tutorial, we suggest you start exploring the tested algorithms on the Models tab as they complete while the others are still running.

モデルを調査するExplore models

[モデル] タブに移動し、テストされたアルゴリズム (モデル) を確認します。Navigate to the Models tab to see the algorithms (models) tested. 既定では、モデルは完了時のメトリック スコアで並べ替えられます。By default, the models are ordered by metric score as they complete. このチュートリアルでは、選択した AUC_weighted メトリックに基づいて最も高いスコアを獲得したモデルがリストの一番上に表示されます。For this tutorial, the model that scores the highest based on the chosen AUC_weighted metric is at the top of the list.

すべての実験モデルが終了するのを待っている間に、完了したモデルの [アルゴリズム名] を選択して、そのパフォーマンスの詳細を調査します。While you wait for all of the experiment models to finish, select the Algorithm name of a completed model to explore its performance details.

次の例では、 [モデルの詳細][視覚化] のタブを移動して、選択したモデルのプロパティ、メトリック、およびパフォーマンス グラフを表示しています。The following navigates through the Model details and the Visualizations tabs to view the selected model's properties, metrics, and performance charts.

イテレーションの実行の詳細

最適なモデルをデプロイするDeploy the best model

自動機械学習インターフェイスを使用すると、わずかな手順で最良のモデルを Web サービスとしてデプロイすることができます。The automated machine learning interface allows you to deploy the best model as a web service in a few steps. デプロイとは、新しいデータを予測したり、潜在的な機会領域を特定したりできるようにモデルを統合することです。Deployment is the integration of the model so it can predict on new data and identify potential areas of opportunity.

この実験における Web サービスへのデプロイは、定期預金の潜在顧客を特定するためのスケーラブルな反復 Web ソリューションを金融機関が持つことを意味します。For this experiment, deployment to a web service means that the financial institution now has an iterative and scalable web solution for identifying potential fixed term deposit customers.

実行が完了したら、 [Run Detail](実行の詳細) ページに戻り、 [モデル] タブを選択します。Once the run is complete, navigate back to the Run Detail page and select the Models tab.

この実験では、VotingEnsembleAUC_weighted メトリックに基づいて最適なモデルと見なされます。In this experiment context, VotingEnsemble is considered the best model, based on the AUC_weighted metric. このモデルをデプロイしますが、デプロイには完了まで約 20 分かかることにご留意ください。We deploy this model, but be advised, deployment takes about 20 minutes to complete. デプロイ プロセスには、モデルを登録したり、リソースを生成したり、Web サービス用にそれらを構成したりすることを含む、いくつかの手順が伴います。The deployment process entails several steps including registering the model, generating resources, and configuring them for the web service.

  1. 左下隅の [Deploy best model](最適なモデルのデプロイ) ボタンを選択します。Select the Deploy best model button in the bottom-left corner.

  2. [Deploy a model](モデルのデプロイ) ペインに次のように入力します。Populate the Deploy a model pane as follows:

    フィールドField ValueValue
    デプロイ名Deployment name my-automl-deploymy-automl-deploy
    デプロイの説明Deployment description 初めての自動機械学習実験のデプロイMy first automated machine learning experiment deployment
    コンピューティングの種類Compute type Azure のコンピューティング インスタンス (ACI) を選択します。Select Azure Compute Instance (ACI)
    認証を有効にするEnable authentication 無効。Disable.
    Use custom deployments (カスタム デプロイを使用する)Use custom deployments 無効。Disable. 既定のドライバー ファイル (スコアリング スクリプト) と環境ファイルが自動的に生成されます。Allows for the default driver file (scoring script) and environment file to be autogenerated.

    この例では、 [Advanced](詳細) メニューに指定されている既定値を使用します。For this example, we use the defaults provided in the Advanced menu.

  3. [デプロイ] を選択します。Select Deploy.

    [実行] 画面の上部に成功を示す緑色のメッセージが表示され、 [Recommended model](推奨モデル) ペインの [Deploy status](デプロイ状態) にステータス メッセージが表示されます。A green success message appears at the top of the Run screen, and in the Recommended model pane, a status message appears under Deploy status. [最新の情報に更新] を定期的にクリックして、デプロイの状態を確認します。Select Refresh periodically to check the deployment status.

これで、予測を生成するための実稼働 Web サービスが作成されました。Now you have an operational web service to generate predictions.

新しい Web サービスの使い方、Azure Machine Learning サポートに組み込まれている Power BI を使用した予測のテスト方法の詳細については、次のステップに進みます。Proceed to the Next Steps to learn more about how to consume your new web service, and test your predictions using Power BI's built in Azure Machine Learning support.

リソースをクリーンアップするClean up resources

デプロイ ファイルはデータ ファイルと実験ファイルよりも大きいため、格納コストは高くなります。Deployment files are larger than data and experiment files, so they cost more to store. アカウントのコストを最小限に抑える場合、またはワークスペースと実験ファイルを保持する場合は、デプロイ ファイルだけを削除します。Delete only the deployment files to minimize costs to your account, or if you want to keep your workspace and experiment files. それ以外の場合で、いずれのファイルも使用する予定がない場合は、リソース グループ全体を削除します。Otherwise, delete the entire resource group, if you don't plan to use any of the files.

デプロイ インスタンスの削除Delete the deployment instance

他のチュートリアルや探索用にリソース グループとワークスペースを維持する場合は、 https://ml.azure.com/ で Azure Machine Learning からデプロイ インスタンスだけを削除します。Delete just the deployment instance from Azure Machine Learning at https://ml.azure.com/ , if you want to keep the resource group and workspace for other tutorials and exploration.

  1. https://ml.azure.com/ の Azure Machine Learning に移動します。Go to Azure Machine Learning at https://ml.azure.com/. お使いのワークスペースに移動し、左側の [アセット] ウィンドウの下の [エンドポイント] を選択します。Navigate to your workspace and on the left under the Assets pane, select Endpoints.

  2. 削除するデプロイを選択し、 [削除] を選択します。Select the deployment you want to delete and select Delete.

  3. [続行] を選択します。Select Proceed.

リソース グループを削除しますDelete the resource group

重要

作成したリソースは、Azure Machine Learning に関連したその他のチュートリアルおよびハウツー記事の前提条件として使用できます。The resources you created can be used as prerequisites to other Azure Machine Learning tutorials and how-to articles.

作成したリソースを今後使用する予定がない場合は、課金が発生しないように削除します。If you don't plan to use the resources you created, delete them, so you don't incur any charges:

  1. Azure Portal で、左端にある [リソース グループ] を選択します。In the Azure portal, select Resource groups on the far left.

    Azure portal で削除するDelete in the Azure portal

  2. 作成したリソース グループを一覧から選択します。From the list, select the resource group you created.

  3. [リソース グループの削除] を選択します。Select Delete resource group.

  4. リソース グループ名を入力します。Enter the resource group name. 次に、 [削除] を選択します。Then select Delete.

次のステップNext steps

この自動機械学習チュートリアルでは、Azure Machine Learning の自動 ML インターフェイスを使用して分類モデルの作成とデプロイを行いました。In this automated machine learning tutorial, you used Azure Machine Learning's automated ML interface to create and deploy a classification model. 詳細と次の手順については、次の記事を参照してください。See these articles for more information and next steps:

注意

この Bank Marketing データセットは、クリエイティブ コモンズ (CCO:パブリック ドメイン) ライセンスにより利用できます。This Bank Marketing dataset is made available under the Creative Commons (CCO: Public Domain) License. データベースの個々のコンテンツに含まれる権限は、データベース コンテンツ ライセンスによりライセンス供与され、Kaggle で入手できます。Any rights in individual contents of the database are licensed under the Database Contents License and available on Kaggle. このデータセットのオリジナルは、UCI Machine Learning データベースから入手できます。This dataset was originally available within the UCI Machine Learning Database.

[Moro その他、2014 年] S. Moro、P. Cortez、Rita。[Moro et al., 2014] S. Moro, P. Cortez and P. Rita. 銀行のテレマーケティングの成功を予測するためのデータドリブン アプローチ。A Data-Driven Approach to Predict the Success of Bank Telemarketing. 意思決定支援システム、Elsevier、62:22-31、2014 年 6 月。Decision Support Systems, Elsevier, 62:22-31, June 2014.