チュートリアル 1:信用リスクの予測 - Azure Machine Learning StudioTutorial 1: Predict credit risk - Azure Machine Learning Studio

このチュートリアルでは、予測分析ソリューションを開発するプロセスについて詳しく説明します。In this tutorial, you take an extended look at the process of developing a predictive analytics solution. Machine Learning Studio で簡単なモデルを開発します。You develop a simple model in Machine Learning Studio. その後、そのモデルを Azure Machine Learning Web サービスとしてデプロイします。You then deploy the model as an Azure Machine Learning web service. このデプロイ モデルは、新しいデータを使用して予測を行うことができます。This deployed model can make predictions using new data. このチュートリアルは、3 部構成のチュートリアル シリーズの第 1 部です。This tutorial is part one of a three-part tutorial series.

クレジットの申請書に記入する情報に基づいて個人のクレジット リスクを予測する必要があるとします。Suppose you need to predict an individual's credit risk based on the information they gave on a credit application.

信用リスクの評価は複雑な問題ですが、このチュートリアルでは、それを少し簡略化してみます。Credit risk assessment is a complex problem, but this tutorial will simplify it a bit. Microsoft Azure Machine Learning Studio を使用して予測分析ソリューションを作成する方法の例として使用してください。You'll use it as an example of how you can create a predictive analytics solution using Microsoft Azure Machine Learning Studio. このソリューションには、Azure Machine Learning Studio と Machine Learning Web サービスを使用します。You'll use Azure Machine Learning Studio and a Machine Learning web service for this solution.

この 3 部構成のチュートリアルでは、まず、公表されている信用リスク データを使用します。In this three-part tutorial, you start with publicly available credit risk data. その後、予測モデルを開発してトレーニングします。You then develop and train a predictive model. 最後にそのモデルを Web サービスとしてデプロイします。Finally you deploy the model as a web service.

チュートリアルのこのパートでは、次のことを行います。In this part of the tutorial you:

  • Machine Learning Studio ワークスペースの作成Create a Machine Learning Studio workspace
  • 既存のデータのアップロードUpload existing data
  • 実験の作成Create an experiment

その後、この実験を使用してモデルをトレーニング (第 2部) し、それらをデプロイ (第 3 部) することができます。You can then use this experiment to train models in part 2 and then deploy them in part 3.

有料と無料のオプションで提供されている Azure Machine Learning Studio をお試しください。Try Azure Machine Learning Studio, available in paid or free options.

前提条件Prerequisites

このチュートリアルでは、これまでに少なくとも 1 回は Machine Learning Studio を使用したことがあり、機械学習の概念をある程度理解していることを前提としています。This tutorial assumes that you've used Machine Learning Studio at least once before, and that you have some understanding of machine learning concepts. いずれにしても専門家ではないことを想定しています。But it doesn't assume you're an expert in either.

Azure Machine Learning Studio をまだ使用したことがない場合は、Azure Machine Learning Studio で初めてのデータ サイエンス実験を作成するクイック スタートから始めることをお勧めします。If you've never used Azure Machine Learning Studio before, you might want to start with the quickstart, Create your first data science experiment in Azure Machine Learning Studio. そのクイック スタートでは、Machine Learning Studio を初めて使用する場合の手順を示しながら、The quickstart takes you through Machine Learning Studio for the first time. 実験にモジュールをドラッグ アンド ドロップして互いに結び付け、実験を実行して結果を確認する方法の基本について説明します。It shows you the basics of how to drag-and-drop modules onto your experiment, connect them together, run the experiment, and look at the results.

ヒント

Azure AI Gallery には、このチュートリアルで開発する実験の作業コピーがあります。You can find a working copy of the experiment that you develop in this tutorial in the Azure AI Gallery. Tutorial - Predict credit risk (チュートリアル - 信用リスクの予測) 」にアクセスし、 [Open in Studio](Studio で開く) をクリックして Machine Learning Studio ワークスペースに実験のコピーをダウンロードしてください。Go to Tutorial - Predict credit risk and click Open in Studio to download a copy of the experiment into your Machine Learning Studio workspace.

Machine Learning Studio ワークスペースの作成Create a Machine Learning Studio workspace

Machine Learning Studio を使用するには、Microsoft Azure Machine Learning Studio ワークスペースが必要です。To use Machine Learning Studio, you need to have a Microsoft Azure Machine Learning Studio workspace. このワークスペースには、実験を管理および公開するのに必要なツールが用意されています。This workspace contains the tools you need to create, manage, and publish experiments.

ワークスペースを作成するには、「Azure Machine Learning Studio ワークスペースの作成と共有」を参照してください。To create a workspace, see Create and share an Azure Machine Learning Studio workspace.

ワークスペースが作成された後、Machine Learning Studio (https://studio.azureml.net/Home) を開きます。After your workspace is created, open Machine Learning Studio (https://studio.azureml.net/Home). ワークスペースが複数ある場合は、ウィンドウの右上隅のツールバーでワークスペースを選択できます。If you have more than one workspace, you can select the workspace in the toolbar in the upper-right corner of the window.

Studio でのワークスペースの選択

ヒント

自分がワークスペースの所有者になっている場合は、自分以外のユーザーをワークスペースに招待することで、作業中の実験を共有することができます。If you are owner of the workspace, you can share the experiments you're working on by inviting others to the workspace. これは、Machine Learning Studio の [設定] ページから実行でき、You can do this in Machine Learning Studio on the SETTINGS page. 必要な情報は各ユーザーの Microsoft アカウントまたは組織アカウントだけです。You just need the Microsoft account or organizational account for each user.

[設定] ページで [ユーザー] をクリックします。次に、ウィンドウの下部にある [INVITE MORE USERS] をクリックします。On the SETTINGS page, click USERS, then click INVITE MORE USERS at the bottom of the window.

既存のデータのアップロードUpload existing data

信用リスクの予測モデルを作成するには、トレーニングとその後のモデルのテストに使用できるデータが必要です。To develop a predictive model for credit risk, you need data that you can use to train and then test the model. このチュートリアルでは、UC Irvine Machine Learning Repository の "UCI Statlog (German Credit Data) Data Set" (UCI Statlog (ドイツの信用貸付データ) データ セット) を使用します。For this tutorial, You'll use the "UCI Statlog (German Credit Data) Data Set" from the UC Irvine Machine Learning repository. 詳細についてはこちらを参照してください:You can find it here:
https://archive.ics.uci.edu/ml/datasets/Statlog+(German+Credit+Data)

german.data という名前のファイルを使用します。You'll use the file named german.data. このファイルをローカル ハード ドライブにダウンロードします。Download this file to your local hard drive.

この german.data データセットの行には、信用貸付の過去 1,000 人の申請者に関する 20 の変数が含まれています。The german.data dataset contains rows of 20 variables for 1000 past applicants for credit. これらの 20 の変数は、データセットの特徴セット (特徴ベクトル) を表し、それぞれの信用貸付申請者を識別する特徴を提供します。These 20 variables represent the dataset's set of features (the feature vector), which provides identifying characteristics for each credit applicant. 各行の追加の列は、申請者について計算された信用リスクを表し、700 人の申請者が低リスクとして、300 人が高リスクとして識別されています。An additional column in each row represents the applicant's calculated credit risk, with 700 applicants identified as a low credit risk and 300 as a high risk.

UCI Web サイトは、このデータの特徴ベクトルの属性についての詳細を提供します。The UCI website provides a description of the attributes of the feature vector for this data. このデータには、財務情報、クレジット履歴、雇用状況、個人情報が含まれます。This data includes financial information, credit history, employment status, and personal information. 各申請者について、申請者の信用リスクの高低を示す二項評価が与えられています。For each applicant, a binary rating has been given indicating whether they are a low or high credit risk.

このデータを使用して、予測分析モデルをトレーニングします。You'll use this data to train a predictive analytics model. 完了したら、このモデルで新しい個人の特徴ベクトルを受け入れて、信用リスクの高低を予測できるようになります。When you're done, your model should be able to accept a feature vector for a new individual and predict whether they are a low or high credit risk.

ここで興味深い展開になります。Here's an interesting twist.

UCI Web サイト上のデータセットの説明では、個人の信用リスクを誤って分類した場合のコストについて触れています。The description of the dataset on the UCI website mentions what it costs if you misclassify a person's credit risk. モデルが実際には信用リスクが低い人を信用リスクが高いと予測すると、誤分類をしたことになります。If the model predicts a high credit risk for someone who is actually a low credit risk, the model has made a misclassification.

しかし逆の誤分類、つまり、モデルが実際には信用リスクが高い人を信用リスクが低いと予測する場合は、金融機関に 5 倍のコストがかかります。But the reverse misclassification is five times more costly to the financial institution: if the model predicts a low credit risk for someone who is actually a high credit risk.

そこで、モデルをトレーニングして、後者の場合の誤分類コストがもう一方の誤分類に比べて 5 倍になるようにします。So, you want to train your model so that the cost of this latter type of misclassification is five times higher than misclassifying the other way.

実験でモデルをトレーニングするときにこれを実行する簡単な方法の 1 つは、信用リスクが高い人を示すエントリを重複 (5 回) させることです。One simple way to do this when training the model in your experiment is by duplicating (five times) those entries that represent someone with a high credit risk.

そうすれば、実際には信用リスクが高い人を信用リスクが低い人としてモデルが誤分類を行うと、重複エントリごとに同じ誤分類が 5 回発生することになります。Then, if the model misclassifies someone as a low credit risk when they're actually a high risk, the model does that same misclassification five times, once for each duplicate. これにより、トレーニング結果でこのエラーのコストが増加します。This will increase the cost of this error in the training results.

データセットの形式の変換Convert the dataset format

元のデータセットは、空白で区切られた形式を使用しています。The original dataset uses a blank-separated format. Machine Learning Studio で使用するにはコンマ区切り値 (CSV) ファイルの方が適しているため、空白をコンマに置き換えてデータセットを変換します。Machine Learning Studio works better with a comma-separated value (CSV) file, so you'll convert the dataset by replacing spaces with commas.

このデータを変換する方法は多数存在します。There are many ways to convert this data. 1 つは、次の Windows PowerShell コマンドを使用する方法です。One way is by using the following Windows PowerShell command:

cat german.data | %{$_ -replace " ",","} | sc german.csv  

他に、次の Unix の sed コマンドを使用する方法もあります。Another way is by using the Unix sed command:

sed 's/ /,/g' german.data > german.csv  

いずれの場合も、コンマ区切りに変換されたデータが、german.csv という名前のファイルに作成されます。このファイルは実験で使用できます。In either case, you have created a comma-separated version of the data in a file named german.csv that you can use in your experiment.

Machine Learning Studio にデータセットをアップロードするUpload the dataset to Machine Learning Studio

データを CSV 形式に変換したら、それを Machine Learning Studio にアップロードする必要があります。Once the data has been converted to CSV format, you need to upload it into Machine Learning Studio.

  1. Machine Learning Studio のホーム ページ (https://studio.azureml.net) を開きます。Open the Machine Learning Studio home page (https://studio.azureml.net).

  2. ウィンドウの左上隅にある [メニュー] をクリックします。 [Azure Machine Learning] をクリックし、 [Studio] を選択してサインインします。Click the menu Menu in the upper-left corner of the window, click Azure Machine Learning, select Studio, and sign in.

  3. ウィンドウの下部にある [+新規] をクリックします。Click +NEW at the bottom of the window.

  4. [データセット] を選択します。Select DATASET.

  5. [ローカル ファイルから] を選択します。Select FROM LOCAL FILE.

    ローカル ファイルからのデータセットの追加

  6. [新しいデータセットをアップロードする] ダイアログで、[参照] をクリックし、作成した german.csv ファイルを検索します。In the Upload a new dataset dialog, click Browse, and find the german.csv file you created.

  7. データセットの名前を入力します。Enter a name for the dataset. このチュートリアルでは、「UCI German Credit Card Data」とします。For this tutorial, call it "UCI German Credit Card Data".

  8. データ型として、 [ヘッダーなしの汎用 CSV ファイル (.nh.csv)] を選択します。For data type, select Generic CSV File With no header (.nh.csv).

  9. 必要に応じて説明を追加します。Add a description if you’d like.

  10. OK チェック マークをクリックします。Click the OK check mark.

    データセットのアップロード

これにより、データは、実験で使用できるデータセット モジュールにアップロードされます。This uploads the data into a dataset module that you can use in an experiment.

Studio にアップロードしたデータセットは、Studio ウィンドウの左側にある [データセット] タブをクリックすることで管理できます。You can manage datasets that you've uploaded to Studio by clicking the DATASETS tab to the left of the Studio window.

データセットの管理

Azure Machine Learning Studio へのトレーニング データのインポートに関するページを参照してください。For more information about importing other types of data into an experiment, see Import your training data into Azure Machine Learning Studio.

実験の作成Create an experiment

このチュートリアルでの次の手順では、アップロードしたデータセットを使用する実験を Machine Learning Studio で作成します。The next step in this tutorial is to create an experiment in Machine Learning Studio that uses the dataset you uploaded.

  1. Studio で、ウィンドウの下部にある [+新規] をクリックします。In Studio, click +NEW at the bottom of the window.

  2. [実験] を選択して、[空の実験] を選択します。Select EXPERIMENT, and then select "Blank Experiment".

    新しい実験を作成する

  3. キャンバスの上部にある既定の実験名を選択し、わかりやすい名前に変更します。Select the default experiment name at the top of the canvas and rename it to something meaningful.

    実験名の変更

    ヒント

    実験のため、 [プロパティ] ウィンドウの [概要][説明] に入力することをお勧めします。It's a good practice to fill in Summary and Description for the experiment in the Properties pane. これらのプロパティを指定しておくと、実験を文書に残すことができるので、誰でも後から見て目標と手法を理解できます。These properties give you the chance to document the experiment so that anyone who looks at it later will understand your goals and methodology.

    実験のプロパティ

  4. 実験キャンバスの左側にあるモジュール パレットの [保存されたデータセット] を展開します。In the module palette to the left of the experiment canvas, expand Saved Datasets.

  5. 作成したデータセットを [マイ データセット] から見つけて、キャンバスにドラッグします。Find the dataset you created under My Datasets and drag it onto the canvas. パレットの上にある [検索] ボックスに名前を入力してデータセットを見つけることもできます。You can also find the dataset by entering the name in the Search box above the palette.

    実験キャンバスへのデータセットの追加

データを準備するPrepare the data

データの最初の 100 行とデータセット全体の統計情報を表示できます。データセットの出力ポート (下部の小さな円) をクリックし、 [視覚化] を選択します。You can view the first 100 rows of the data and some statistical information for the whole dataset: Click the output port of the dataset (the small circle at the bottom) and select Visualize.

データ ファイルには列見出しがないため、ため、Studio では汎用の見出し (Col1、Col2 "など") が付けられます。Because the data file didn't come with column headings, Studio has provided generic headings (Col1, Col2, etc.). 適切な見出しはモデルを作成するために絶対に必要なものではありませんが、実験のデータを操作する際に便利です。Good headings aren't essential to creating a model, but they make it easier to work with the data in the experiment. また、最終的にこのモデルを Web サービスに発行する際に、見出しは、サービスのユーザーが列を特定するのに役立ちます。Also, when you eventually publish this model in a web service, the headings help identify the columns to the user of the service.

列見出しを追加するには、メタデータの編集モジュールを使用します。You can add column headings using the Edit Metadata module.

メタデータの編集モジュールを使用して、データセットに関連付けられたメタデータを変更します。You use the Edit Metadata module to change metadata associated with a dataset. この場合は、それを使用して、列見出しによりわかりやすい名前を付けます。In this case, you use it to provide more friendly names for column headings.

メタデータの編集を使用するには、まず変更する列 (このケースではすべての列) を指定します。次に、それらの列に対して実行するアクション (このケースでは列見出しの変更) を指定します。To use Edit Metadata, you first specify which columns to modify (in this case, all of them.) Next, you specify the action to be performed on those columns (in this case, changing column headings.)

  1. モジュール パレットの [検索] ボックスに「メタデータ」と入力します。In the module palette, type "metadata" in the Search box. モジュールの一覧にメタデータの編集が表示されます。The Edit Metadata appears in the module list.

  2. メタデータの編集モジュールをクリックしてキャンバスにドラッグし、先ほど追加したデータセットの下にドロップします。Click and drag the Edit Metadata module onto the canvas and drop it below the dataset you added earlier.

  3. データセットをメタデータの編集に接続します。データセットの出力ポート (データセット下部の小さな円) をクリックし、メタデータの編集の入力ポート (モジュール上部の小さな円) の上にドラッグしてからマウス ボタンを放します。Connect the dataset to the Edit Metadata: click the output port of the dataset (the small circle at the bottom of the dataset), drag to the input port of Edit Metadata (the small circle at the top of the module), then release the mouse button. これで、マウスをキャンバス上でどこに移動しても、データセットとモジュールが接続されたままになります。The dataset and module remain connected even if you move either around on the canvas.

    実験は以下のようになっているはずです。The experiment should now look something like this:

    メタデータの編集の追加

    赤色の感嘆符は、このモジュールのプロパティがまだ設定されていないことを示します。The red exclamation mark indicates that you haven't set the properties for this module yet. これは次に行います。You'll do that next.

    ヒント

    モジュールをダブルクリックして、テキストを入力すると、モジュールにコメントを追加できます。You can add a comment to a module by double-clicking the module and entering text. これで、実験でモジュールがどのような処理をするのかがひとめでわかります。This can help you see at a glance what the module is doing in your experiment. ここでは、メタデータの編集モジュールをダブルクリックし、「列見出しの追加」というコメントを入力します。In this case, double-click the Edit Metadata module and type the comment "Add column headings". テキスト ボックスを閉じるには、キャンバスの任意の場所をクリックします。Click anywhere else on the canvas to close the text box. コメントを表示するには、モジュールの下向き矢印をクリックします。To display the comment, click the down-arrow on the module.

    コメントが追加されたメタデータの編集モジュール

  4. メタデータの編集を選択し、キャンバスの右側にある [プロパティ] ウィンドウで [列セレクターの起動] をクリックします。Select Edit Metadata, and in the Properties pane to the right of the canvas, click Launch column selector.

  5. [列の選択] ダイアログで、 [使用可能な列] のすべての列を選択して [>] をクリックし、 [選択した列] に移します。In the Select columns dialog, select all the rows in Available Columns and click > to move them to Selected Columns. ダイアログは次のようになります。The dialog should look like this:

    すべての列が選択された列セレクター

  6. OK チェック マークをクリックします。Click the OK check mark.

  7. [プロパティ] ウィンドウに戻り、 [新しい列名] パラメーターを探します。Back in the Properties pane, look for the New column names parameter. このフィールドには、コンマ区切りで列の順番どおりに、データセットの 21 列分の名前を入力します。In this field, enter a list of names for the 21 columns in the dataset, separated by commas and in column order. 列名は、UCI Web サイトのデータセットに関するドキュメントから入手できます。または、次の一覧をコピーして貼り付けることができます。You can obtain the columns names from the dataset documentation on the UCI website, or for convenience you can copy and paste the following list:

    Status of checking account, Duration in months, Credit history, Purpose, Credit amount, Savings account/bond, Present employment since, Installment rate in percentage of disposable income, Personal status and sex, Other debtors, Present residence since, Property, Age in years, Other installment plans, Housing, Number of existing credits, Job, Number of people providing maintenance for, Telephone, Foreign worker, Credit risk  
    

    [プロパティ] ウィンドウは次のようになります。The Properties pane looks like this:

    メタデータの編集のプロパティ

    ヒント

    列見出しを検証する場合は、実験を実行します (実験キャンバスの下の [Run (実行)] をクリックします)。If you want to verify the column headings, run the experiment (click RUN below the experiment canvas). 実行が終了したら (メタデータの編集上に緑のチェック マークが表示されたら)、メタデータの編集モジュールの出力ポートをクリックし、 [視覚化] を選択します。When it finishes running (a green check mark appears on Edit Metadata), click the output port of the Edit Metadata module, and select Visualize. すべてのモジュールで、この方法によって実験データの進捗状況を確認することができます。You can view the output of any module in the same way to view the progress of the data through the experiment.

トレーニング用およびテスト用のデータセットを作成するCreate training and test datasets

モデルのトレーニング用とテスト用にデータが必要です。You need some data to train the model and some to test it. そのため、実験の次の手順では、データセットを 2 つの別々のデータセットに分割します。1 つはモデルのトレーニング用、もう 1 つはテスト用です。So in the next step of the experiment, you split the dataset into two separate datasets: one for training our model and one for testing it.

これには、データの分割モジュールを使用します。To do this, you use the Split Data module.

  1. データの分割モジュールを見つけてキャンバスにドラッグし、メタデータの編集モジュールに接続します。Find the Split Data module, drag it onto the canvas, and connect it to the Edit Metadata module.

  2. 既定では、分割比が 0.5 で、 [ランダム分割] パラメーターが設定されます。By default, the split ratio is 0.5 and the Randomized split parameter is set. これは、データの半分がランダムに抽出されてデータの分割モジュールの 1 つのポートから出力され、残りの半分がもう 1 つのポートから出力されることを意味します。This means that a random half of the data is output through one port of the Split Data module, and half through the other. これらのパラメーターと [ランダム シード] パラメーターを調整して、トレーニング データとテスト データの分割比を変更できます。You can adjust these parameters, as well as the Random seed parameter, to change the split between training and testing data. この例では、これらをそのままにしておきます。For this example, you leave them as-is.

    ヒント

    左の出力ポートから出力されるデータの量は、 [Fraction of rows in the first output dataset] (最初の出力データセットにおける列の割合) プロパティによって決まります。The property Fraction of rows in the first output dataset determines how much of the data is output through the left output port. たとえば、比率を 0.7 に設定すると、データの 70% が左側のポートから、30% が右側のポートから出力されます。For instance, if you set the ratio to 0.7, then 70% of the data is output through the left port and 30% through the right port.

  3. データの分割モジュールをダブルクリックし、「トレーニング/テスト データの分割 50%」とコメントを入力します。Double-click the Split Data module and enter the comment, "Training/testing data split 50%".

データの分割モジュールの出力の用途は自由ですが、ここでは左側の出力をトレーニング データ、右側の出力をテスト データとして使用します。You can use the outputs of the Split Data module however you like, but let's choose to use the left output as training data and the right output as testing data.

前の手順での説明のとおり、高い信用リスクを誤って低リスクと分類すると、低い信用リスクを誤って高リスクと分類した場合の 5 倍のコストが発生します。As mentioned in the previous step, the cost of misclassifying a high credit risk as low is five times higher than the cost of misclassifying a low credit risk as high. これに対応するため、このコストの特徴を反映した新しいデータセットを生成します。To account for this, you generate a new dataset that reflects this cost function. この新しいデータセットでは、高リスクの例を 5 回重複させ、低リスクの例は重複させません。In the new dataset, each high risk example is replicated five times, while each low risk example is not replicated.

この重複は、R コードを使用して実行できます。You can do this replication using R code:

  1. R スクリプトの実行モジュールを見つけて、実験キャンバスにドラッグします。Find and drag the Execute R Script module onto the experiment canvas.

  2. データの分割モジュールの左側の出力ポートを R スクリプトの実行モジュールの 1 つ目の入力ポート ("Dataset1") に接続します。Connect the left output port of the Split Data module to the first input port ("Dataset1") of the Execute R Script module.

  3. R スクリプトの実行モジュールをダブルクリックし、「コスト調整の設定」というコメントを入力します。Double-click the Execute R Script module and enter the comment, "Set cost adjustment".

  4. [プロパティ] ウィンドウの [R スクリプト] パラメーターの既定の文字列を削除し、以下のスクリプトを入力します。In the Properties pane, delete the default text in the R Script parameter and enter this script:

    dataset1 <- maml.mapInputPort(1)
    data.set<-dataset1[dataset1[,21]==1,]
    pos<-dataset1[dataset1[,21]==2,]
    for (i in 1:5) data.set<-rbind(data.set,pos)
    maml.mapOutputPort("data.set")
    

    R スクリプトの実行モジュール内の R スクリプト

データの分割モジュールの各出力について同様の重複操作を設定する必要があります。これによって、トレーニング データとテスト データのコスト調整が等しくなります。You need to do this same replication operation for each output of the Split Data module so that the training and testing data have the same cost adjustment. これを実行する最も簡単方法は、作成したばかりの R スクリプトの実行モジュールを複製して、データの分割モジュールのもう 1 つの出力ポートに接続することです。The easiest way to do this is by duplicating the Execute R Script module you just made and connecting it to the other output port of the Split Data module.

  1. R スクリプトの実行モジュールを右クリックし、 [コピー] を選択します。Right-click the Execute R Script module and select Copy.

  2. 実験キャンバスを右クリックして [貼り付け] を選択します。Right-click the experiment canvas and select Paste.

  3. 新しいモジュールを適切な位置にドラッグし、データの分割モジュールの右側の出力ポートを、この新しい R スクリプトの実行モジュールの 1 つ目の入力ポートに接続します。Drag the new module into position, and then connect the right output port of the Split Data module to the first input port of this new Execute R Script module.

  4. キャンバスの下部で、 [実行] をクリックします。At the bottom of the canvas, click Run.

ヒント

R スクリプトの実行モジュールのコピーには、元のモジュールと同じスクリプトが格納されています。The copy of the Execute R Script module contains the same script as the original module. モジュールをコピーしてキャンバスに貼り付けた場合、モジュールのコピーには元のモジュールのすべてのプロパティが保持されています。When you copy and paste a module on the canvas, the copy retains all the properties of the original.

現在、実験は以下のようになっているはずです。Our experiment now looks something like this:

Adding Split module and R scripts

実験での R スクリプトの使用に関する詳細については、「R を使用した実験の拡張」をご覧ください。For more information on using R scripts in your experiments, see Extend your experiment with R.

リソースのクリーンアップClean up resources

この記事を使用して作成したリソースが不要になった場合は、料金の発生を避けるために削除してください。If you no longer need the resources you created using this article, delete them to avoid incurring any charges. 方法については、製品内ユーザー データのエクスポートと削除に関するページを参照してください。Learn how in the article, Export and delete in-product user data.

次の手順Next steps

このチュートリアルでは、次の手順を完了しました。In this tutorial you completed these steps:

  • Machine Learning Studio ワークスペースの作成Create a Machine Learning Studio workspace
  • ワークスペースへの既存のデータのアップロードUpload existing data into the workspace
  • 実験の作成Create an experiment

これで、このデータのモデルをトレーニングして評価する準備が整いました。You are now ready to train and evaluate models for this data.