Rövid útmutató: az első adatelemzési kísérlet létrehozása Machine Learning Studio (klasszikus)Quickstart: Create your first data science experiment in Machine Learning Studio (classic)

a következőkre vonatkozik:  Ez egy pipa, ami azt jelenti, hogy ez a cikk a Machine Learning Studio (klasszikus) elemre vonatkozik. Machine Learning Studio (klasszikus)  Ez egy X, ami azt jelenti, hogy ez a cikk Azure Machine learningre vonatkozik. Azure Machine Learning APPLIES TO: This is a check mark, which means that this article applies to Machine Learning Studio (classic).Machine Learning Studio (classic) This is an X, which means that this article applies to Azure Machine Learning.Azure Machine Learning

Tipp

A Machine Learning Studiót (klasszikus) használó vagy értékelő ügyfeleknek ajánlott a Azure Machine Learning stúdió,amely húzással használható ML-modulokat, valamint méretezhetőséget, verzióvezérlést és vállalati biztonságot nyújt.Customers using or evaluating Machine Learning Studio (classic) are encouraged to try Azure Machine Learning studio, which provides drag and drop ML modules plus scalability, version control, and enterprise security. A jelenlegi Studio- (klasszikus) ügyfelek megtudhatják, hogyan minklálhat a Azure Machine Learning.Current Studio (classic) customers can learn how to migrate to Azure Machine Learning.

Ebben a rövid útmutatóban egy gépi tanulási kísérletet hoz létre Azure Machine learning Studio (klasszikus) , amely az autó árát különböző változók, például gyártmányok és technikai specifikációk alapján Jósolja meg.In this quickstart, you create a machine learning experiment in Azure Machine Learning Studio (classic) that predicts the price of a car based on different variables such as make and technical specifications.

Ha teljesen új a gépi tanuláshoz, a kezdőknek szóló videó-adatelemzési sorozat a mindennapi nyelvhasználattal és fogalmakkal remek bevezetést nyújt a gépi tanuláshoz.If you're brand new to machine learning, the video series Data Science for Beginners is a great introduction to machine learning using everyday language and concepts.

Ez a rövid útmutató egy kísérlet alapértelmezett munkafolyamatát követi:This quickstart follows the default workflow for an experiment:

  1. Modell létrehozásaCreate a model
  2. A modell betanításaTrain the model
  3. A modell pontozása és teszteléseScore and test the model

Az adatok lekéréseGet the data

Az első dolog, amire szüksége van a Machine learning szolgáltatásban.The first thing you need in machine learning is data. A Studio (klasszikus) számos minta adatkészletet tartalmaz, amelyeket használhat, vagy több forrásból is importálhat adatokat.There are several sample datasets included with Studio (classic) that you can use, or you can import data from many sources. Ebben a példában a munkaterületén megtalálható Automobile price data (Raw) (Nyers autóáradatok) nevű mintahalmazt fogjuk használni.For this example, we'll use the sample dataset, Automobile price data (Raw), that's included in your workspace. Ebben az adathalmazban számos különböző autót bemutató bejegyzés szerepel. A bejegyzések számos adatot (például márka, típus, műszaki specifikációk, ár) tartalmaznak.This dataset includes entries for various individual automobiles, including information such as make, model, technical specifications, and price.

Tipp

Az Azure AI katalógusban megtalálja az alábbi kísérlet egy működő példányát.You can find a working copy of the following experiment in the Azure AI Gallery. Nyissa meg az első adatelemzési kísérletet – az autó árának előrejelzését , és kattintson a Megnyitás a Studióban lehetőségre a kísérlet másolatának letöltéséhez a Machine learning Studio (klasszikus) munkaterületre.Go to Your first data science experiment - Automobile price prediction and click Open in Studio to download a copy of the experiment into your Machine Learning Studio (classic) workspace.

A következőképpen vonhatja be az adathalmazt a kísérletbe.Here's how to get the dataset into your experiment.

  1. Hozzon létre egy új kísérletet az Machine Learning Studio (klasszikus) ablak alján található + új elemre kattintva.Create a new experiment by clicking +NEW at the bottom of the Machine Learning Studio (classic) window. Válassza a kísérlet > üres kísérlet lehetőséget.Select EXPERIMENT > Blank Experiment.

  2. A kísérlet kap egy alapértelmezett nevet, amelyet a vászon tetején láthat.The experiment is given a default name that you can see at the top of the canvas. Jelölje ki ezt a szöveget, és módosítsa valami értelmesebbre, például arra, hogy Autó árának előrejelzése.Select this text and rename it to something meaningful, for example, Automobile price prediction. A névnek nem kell egyedinek lennie.The name doesn't need to be unique.

    A kísérlet átnevezése

  3. A kísérletvászontól balra az adathalmazokat és modulokat tartalmazó paletta látható.To the left of the experiment canvas is a palette of datasets and modules. A paletta tetején található keresőmezőbe gépelje be, hogy automobile. A rendszer megjeleníti az Automobile price data (Raw) (Nyers autóáradatok) nevű adathalmazt.Type automobile in the Search box at the top of this palette to find the dataset labeled Automobile price data (Raw). Húzza rá az adathalmazt a kísérletvászonra.Drag this dataset to the experiment canvas.

    Az autókat tartalmazó adathalmaz megkeresése és a kísérleti vászonra húzása

Ha szeretné megtekinteni az adatokat, kattintson az autó adatkészletének alján található kimeneti portra, majd válassza a Megjelenítés lehetőséget.To see what this data looks like, click the output port at the bottom of the automobile dataset then select Visualize.

Kattintson a kimeneti portra, majd válassza a „Visualize” (Képi megjelenítés) lehetőséget

Tipp

Az adathalmazok és modulok kis körökkel jelölt bemeneti és kimeneti portokkal rendelkeznek – a bemeneti portok felül, a kimeneti portok alul találhatók.Datasets and modules have input and output ports represented by small circles - input ports at the top, output ports at the bottom. Az adatfolyam létrehozásához a kísérlet során össze fogja kötni az egyik modul kimeneti portját egy másik modul bemeneti portjával.To create a flow of data through your experiment, you'll connect an output port of one module to an input port of another. Ha meg szeretné tekinteni, hogyan jelennek meg az adatok az adatfolyam egy adott pontján, kattintson az adathalmaz vagy modul kimeneti portjára.At any time, you can click the output port of a dataset or module to see what the data looks like at that point in the data flow.

Ebben az adatkészletben minden sor egy automobilt jelöl, és az egyes autókhoz tartozó változók oszlopként jelennek meg.In this dataset, each row represents an automobile, and the variables associated with each automobile appear as columns. Az árat a jobb szélső oszlopban fogjuk megjósolni (26. oszlop, "Price" címmel) egy adott autó változóit használva.We'll predict the price in far-right column (column 26, titled "price") using the variables for a specific automobile.

Az autókra vonatkozó adatok megtekintése az adatokat megjelenítő ablakban

A jobb felső sarokban látható „x” gombra kattintva zárja be a képi megjelenítési ablakot.Close the visualization window by clicking the "x" in the upper-right corner.

Az adatok előkészítésePrepare the data

Az adathalmazok elemzése előtt általában némi előfeldolgozás szükséges.A dataset usually requires some preprocessing before it can be analyzed. Talán észrevette, hogy az oszlopok számos sorából hiányoztak az értékek.You might have noticed the missing values present in the columns of various rows. Ahhoz, hogy a modell elemezni tudja az adatokat, el kell távolítani a hiányzó értékeket.These missing values need to be cleaned so the model can analyze the data correctly. Töröljük a hiányzó értékeket tartalmazó sorokat.We'll remove any rows that have missing values. A normalized-losses (normalizált veszteségek) című oszlopból ráadásul rendkívül sok érték hiányzik, ezért ezt az oszlopot teljesen kizárjuk a modellből.Also, the normalized-losses column has a large proportion of missing values, so we'll exclude that column from the model altogether.

Tipp

A legtöbb modul használatának előfeltétele a bemeneti adatok hiányzó értékeinek törlése.Cleaning the missing values from input data is a prerequisite for using most of the modules.

Először hozzáadunk egy modult, amely teljesen eltávolítja a normalizált veszteségek oszlopot.First, we add a module that removes the normalized-losses column completely. Ezután hozzáadunk egy másik modult, amely eltávolítja a hiányzó adatsorokat.Then we add another module that removes any row that has missing data.

  1. A modul paletta tetején található keresőmezőbe írja be a Select Columns ( Oszlopok kiválasztása ) elemet, hogy megtalálja a Select Columns elemet az adatkészlet modulban.Type select columns in the search box at the top of the module palette to find the Select Columns in Dataset module. Ezután húzza a kísérlet vászonra.Then drag it to the experiment canvas. Ezzel a modullal kiválaszthatjuk, hogy melyik adatoszlopokat szeretnénk bevonni a modellbe, vagy éppen kizárni a modellből.This module allows us to select which columns of data we want to include or exclude in the model.

  2. Az Automobile Price (nyers) adathalmaz kimeneti portjának csatlakoztatása az adatkészlet Select oszlopainak bemeneti portjához.Connect the output port of the Automobile price data (Raw) dataset to the input port of the Select Columns in Dataset.

    A „Select Columns in Dataset” (Adathalmaz oszlopainak kijelölése) modul hozzáadása a kísérletvászonhoz, majd összekötése

  3. Kattintson a Select Columns in Dataset (Adathalmaz oszlopainak kijelölése) modulra, majd a Properties (Tulajdonságok) panelen kattintson a Launch column selector (Oszlopválasztó elindítása) elemre.Click the Select Columns in Dataset module and click Launch column selector in the Properties pane.

    • A bal oldalon kattintson a With rules (Szabályokkal) lehetőségreOn the left, click With rules

    • A Begin With (Kezdés a következővel) területen kattintson az All columns (Minden oszlop) lehetőségre.Under Begin With, click All columns. Ezek a szabályok közvetlenül kiválasztja az adatkészlet oszlopait az összes oszlop átadásához (kivéve a kizárni kívánt oszlopokat).These rules direct Select Columns in Dataset to pass through all the columns (except those columns we're about to exclude).

    • A legördülő listákból válassza az Exclude (Kizárás) és a column names (oszlopnevek) lehetőséget, majd kattintson a szövegmezőbe.From the drop-downs, select Exclude and column names, and then click inside the text box. Megjelenik az oszlopnevek listája.A list of columns is displayed. Válassza a normalized-losses (normalizált veszteségek) lehetőséget, amely aztán bekerül a szövegdobozba.Select normalized-losses, and it's added to the text box.

    • Kattintson a pipa (OK) gombra az oszlop választójának bezárásához (a jobb alsó sarokban).Click the check mark (OK) button to close the column selector (on the lower right).

      Az oszlopválasztó elindítása és a „normalized-losses” (normalizált veszteségek) oszlop kizárása

      Ekkor a Select Columns in Dataset (Adathalmaz oszlopainak kijelölése) modul Properties (Tulajdonságok) panelje jelzi, hogy a modul a normalized-losses ( normalizált veszteségek) kivételével az adathalmaz összes oszlopát fel fogja dolgozni.Now the properties pane for Select Columns in Dataset indicates that it will pass through all columns from the dataset except normalized-losses.

      A tulajdonságok panelen látható, hogy a „normalized-losses” (normalizált veszteségek) oszlop ki van zárva

      Tipp

      A modulokhoz megjegyzéseket adhat. Ehhez kattintson duplán a kívánt modulra, majd gépelje be a megjegyzés szövegét.You can add a comment to a module by double-clicking the module and entering text. Így egyetlen pillantással felmérheti, hogy mire szolgál az adott modul a kísérletben.This can help you see at a glance what the module is doing in your experiment. A jelen esetben kattintson duplán a Select Columns in Dataset (Adathalmaz oszlopainak kijelölése) modulra, és írja be az „Exclude normalized losses” (A normalized-losses oszlop kizárása) szöveget.In this case double-click the Select Columns in Dataset module and type the comment "Exclude normalized losses."

      Megjegyzés hozzáadása egy modulhoz dupla kattintással

  4. Húzza a Clean Missing Data (Hiányzó adatok törlése) modult a kísérletvászonra, és kösse össze a Select Columns in Dataset (Adathalmaz oszlopainak kijelölése) modullal.Drag the Clean Missing Data module to the experiment canvas and connect it to the Select Columns in Dataset module. A Properties (Tulajdonságok) panel Cleaning mode (Törlés módja) beállításánál válassza a Remove entire row (Teljes sor eltávolítása) lehetőséget.In the Properties pane, select Remove entire row under Cleaning mode. Ezek a beállítások közvetlenül törlik a hiányzó adatokból az adatok törlését a hiányzó értékeket tartalmazó sorok eltávolításával.These options direct Clean Missing Data to clean the data by removing rows that have any missing values. Kattintson duplán a modulra, és írja be a következő megjegyzést: „Hiányzó értéket tartalmazó sorok törlése”.Double-click the module and type the comment "Remove missing value rows."

    Törlés módjának beállítása „Remove entire row” (Teljes sor eltávolítása) lehetőségre a „Clean Missing Data” (Hiányzó adatok törlése) modulnál

  5. A kísérlet futtatásához kattintson a lap alján található RUN (Futtatás) parancsra.Run the experiment by clicking RUN at the bottom of the page.

    A kísérlet befejezését követően az összes modulnál megjelenik egy zöld pipa, amely jelzi, hogy az adott modul sikeresen lefutott.When the experiment has finished running, all the modules have a green check mark to indicate that they finished successfully. A jobb felső sarokban pedig megjelenik a Finished running (Futtatás befejeződött) állapot.Notice also the Finished running status in the upper-right corner.

    A kísérlet várható megjelenése a futtatás után

Tipp

Miért futtattuk a kísérletet most?Why did we run the experiment now? A kísérlet futtatásával biztosítható, hogy az adatokhoz tartozó oszlopdefiníciók az adatkészletből áthaladnak a Select Columns in Dataset (Adathalmaz oszlopainak kijelölése) modulon és a Clean Missing Data (Hiányzó adatok törlése) modulon.By running the experiment, the column definitions for our data pass from the dataset, through the Select Columns in Dataset module, and through the Clean Missing Data module. Ez azt jelenti, hogy a Clean Missing Data (Hiányzó adatok törlése) modulhoz kapcsolt modulok is megkapják ugyanezeket az adatokat.This means that any modules we connect to Clean Missing Data will also have this same information.

Most már tiszta adattal rendelkezünk.Now we have clean data. Ha szeretné megtekinteni a megtisztított adathalmazt, kattintson a Clean Missing Data (Hiányzó adatok törlése) modul bal oldali kimeneti portjára, és válassza a Visualize (Képi megjelenítés) lehetőséget.If you want to view the cleaned dataset, click the left output port of the Clean Missing Data module and select Visualize. Láthatja, hogy a normalized-losses oszlop eltűnt, ahogy a hiányzó értékek is.Notice that the normalized-losses column is no longer included, and there are no missing values.

Most, hogy megtisztítottuk az adatokat, megadhatjuk, hogy mely jellemzőket szeretnénk felhasználni a prediktív modellben.Now that the data is clean, we're ready to specify what features we're going to use in the predictive model.

Funkciók definiálásaDefine features

A gépi tanulásban a funkciók a érdeklik egyes, mérhető tulajdonságai.In machine learning, features are individual measurable properties of something you're interested in. Adathalmazunk minden sora egy-egy autót képvisel, az oszlopok pedig az autók különböző jellemzőit tartalmazzák.In our dataset, each row represents one automobile, and each column is a feature of that automobile.

A prediktív modellben használandó jellemzők helyes megválasztásához fontos a kísérletezés, illetve a megoldani kívánt probléma jó ismerete.Finding a good set of features for creating a predictive model requires experimentation and knowledge about the problem you want to solve. Bizonyos jellemzők ugyanis hasznosabbak a cél előrejelzéséhez, mint mások.Some features are better for predicting the target than others. Egyes funkciók erős korrelációt mutatnak más funkciókkal, és eltávolíthatók.Some features have a strong correlation with other features and can be removed. A példánkban például szorosan összefügg a city-mpg (fogyasztás városban) és highway-mpg (fogyasztás autópályán), ezért az egyiket eltávolíthatjuk anélkül, hogy lényegesen befolyásolnánk az előrejelzést.For example, city-mpg and highway-mpg are closely related so we can keep one and remove the other without significantly affecting the prediction.

Ideje, hogy létrehozzuk a modellt az adathalmaz jellemzőinek meghatározott részhalmaza alapján.Let's build a model that uses a subset of the features in our dataset. Később visszatérhet ehhez a lépéshez, és más jellemzőket kiválasztva ismét lefuttathatja a kísérletet, ha kíváncsi rá, hogy úgy jobb eredményeket kap-e.You can come back later and select different features, run the experiment again, and see if you get better results. Kezdésként azonban a következő funkciókat próbáljuk ki:But to start, let's try the following features:

Gyártmány, szövegtörzs, kerék-alap, motor-méret, lóerő, csúcs-RPM, autópálya-MPG, Ármake, body-style, wheel-base, engine-size, horsepower, peak-rpm, highway-mpg, price

  1. Húzzon egy újabb Select Columns in Dataset (Adathalmaz oszlopainak kijelölése) modult a kísérletvászonra.Drag another Select Columns in Dataset module to the experiment canvas. Kösse össze a Clean Missing Data (Hiányzó adatok törlése) modul bal oldali kimeneti portját a Select Columns in Dataset (Adathalmaz oszlopainak kijelölése) modul bemenetével.Connect the left output port of the Clean Missing Data module to the input of the Select Columns in Dataset module.

    A „Select Columns in Dataset” (Adathalmaz oszlopainak kijelölése) modul összekötése a „Clean Missing Data” (Hiányzó adatok törlése) modullal

  2. Kattintson duplán a modulra, és írja be: „Az előrejelzéshez használatos jellemzők kiválasztása”.Double-click the module and type "Select features for prediction."

  3. Kattintson a Properties (Tulajdonságok) panel Launch column selector (Oszlopválasztó indítása) elemére.Click Launch column selector in the Properties pane.

  4. Kattintson a With rules (Szabályokkal) lehetőségre.Click With rules.

  5. A Begin With (Kezdés a következővel) területen kattintson a No columns (Egyetlen oszlop sem) lehetőségre.Under Begin With, click No columns. A szűrősorban válassza ki az Include (Belefoglalás) és a column names (oszlopnevek) lehetőséget, és jelölje ki az oszlopnevek listáját a szövegmezőben.In the filter row, select Include and column names and select our list of column names in the text box. Ez a szűrő arra utasítja a modult, hogy ne továbbítson semmilyen oszlopot (funkciót), kivéve a megadott beállításokat.This filter directs the module to not pass through any columns (features) except the ones that we specify.

  6. Kattintson a pipa (OK) gombra.Click the check mark (OK) button.

    Az előrejelzésbe bevonni kívánt oszlopok (tulajdonságok) kijelölése

Ez a modul olyan szűrt adatkészletet hoz létre, amely csak azokat a funkciókat tartalmazza, amelyeket a következő lépésben fogunk használni.This module produces a filtered dataset containing only the features we want to pass to the learning algorithm we'll use in the next step. Később visszatérhet ide, és más jellemzőkkel is elvégezheti az előrejelzést.Later, you can return and try again with a different selection of features.

Algoritmus kiválasztása és alkalmazásaChoose and apply an algorithm

Most, hogy előkészítettük az adatokat, a prediktív modell létrehozásához már csak a tanítás és a tesztelés szükséges.Now that the data is ready, constructing a predictive model consists of training and testing. A következőkben az adatok segítségével elvégezzük a modell betanítását, majd a modell tesztelésével megállapítjuk, hogy milyen pontossággal képes előre jelezni az árakat.We'll use our data to train the model, and then we'll test the model to see how closely it's able to predict prices.

A besorolás és a regresszió két algoritmus, amelynek segítségével felügyelt gépi tanítás valósítható meg.Classification and regression are two types of supervised machine learning algorithms. Besoroláskor a válaszok előrejelzése megadott kategóriakészletből történik (például: színek (vörös, kék vagy zöld)).Classification predicts an answer from a defined set of categories, such as a color (red, blue, or green). A rendszer a számok előrejelzésére regressziós módszert használ.Regression is used to predict a number.

Mivel az árat szeretnénk előre jelezni, ami egy szám, regressziós algoritmust fogunk használni.Because we want to predict price, which is a number, we'll use a regression algorithm. Ebben a példában egy lineáris regressziós modellt fogunk használni.For this example, we'll use a linear regression model.

A modell betanításához az árat tartalmazó adathalmazt biztosítunk számára.We train the model by giving it a set of data that includes the price. A modell megvizsgálja adatokat, és összefüggéseket keres az autó tulajdonságai és az ára között.The model scans the data and look for correlations between an automobile's features and its price. Ezután teszteljük a modellt. Ehhez olyan autók tulajdonságkészletét töltjük be, amelyeket ismerünk, és megnézzük, hogy mennyire sikeresen tudja a modell előre jelezni az ismert árakat.Then we'll test the model - we'll give it a set of features for automobiles we're familiar with and see how close the model comes to predicting the known price.

Az adatok a modell betanítására és tesztelésére is használhatók. Ehhez két halmazra, egy tanítási és egy tesztelési halmazra osztjuk fel az adatokat.We'll use our data for both training the model and testing it by splitting the data into separate training and testing datasets.

  1. Jelölje ki, majd húzza a kísérletvászonra a Split Data (Adatok felosztása) modult, majd kösse össze a legutóbb használt Select Columns in Dataset (Adathalmaz oszlopainak kijelölése) modullal.Select and drag the Split Data module to the experiment canvas and connect it to the last Select Columns in Dataset module.

  2. Kattintással jelölje ki a Split Data (Adatok felosztása) modult.Click the Split Data module to select it. Keresse meg a Properties (Tulajdonságok) panelen a vászontól jobbra a Fraction of rows in the first output dataset (Sorok hányadosa az első kimeneti adathalmazban) beállítást, és adja meg a 0,75 értéket.Find the Fraction of rows in the first output dataset (in the Properties pane to the right of the canvas) and set it to 0.75. Így az adatok 75 százalékát a modell betanítására, 25 százalékát pedig a modell tesztelésére használhatjuk.This way, we'll use 75 percent of the data to train the model, and hold back 25 percent for testing.

    A „Split Data” (Adatok felosztása) modul felosztási értékének beállítása 0,75-re

    Tipp

    A Random seed (Véletlenszám-generálás kezdőértéke) paraméter módosításával különböző véletlenszerűen kiválasztott mintákat hozhat létre, amelyeket szintén felhasználhat a modell betanítására és tesztelésére.By changing the Random seed parameter, you can produce different random samples for training and testing. Ez a paraméter szabályozza a pszeudo-véletlenszám-generátor kezdőértékét.This parameter controls the seeding of the pseudo-random number generator.

  3. Futtassa a kísérletet.Run the experiment. A kísérlet futtatásakor a Select Columns in Dataset (Adathalmaz oszlopainak kijelölése) és a Split Data (Adatok felosztása) modul átadja a következőkben hozzáadott moduloknak az oszlopdefiníciókat.When the experiment is run, the Select Columns in Dataset and Split Data modules pass column definitions to the modules we'll be adding next.

  4. A tanulási algoritmus kiválasztásához bontsa ki a vászontól balra, a modulpalettán található Machine Learning (Gépi tanulás) kategóriát, majd bontsa ki az Initialize Model (Inicializálási modell) kategóriát is.To select the learning algorithm, expand the Machine Learning category in the module palette to the left of the canvas, and then expand Initialize Model. Itt számos modulkategória közül választhat, amelyek segítségével inicializálható a gépi tanulási algoritmus.This displays several categories of modules that can be used to initialize machine learning algorithms. Ehhez a kísérlethez válassza a Regression (Regresszió) kategóriában található Linear Regression (Lineáris regresszió) modult, majd húzza a kísérletvászonra.For this experiment, select the Linear Regression module under the Regression category, and drag it to the experiment canvas. (A modult úgy is megkeresheti, ha a paletta keresőmezőjébe beírja a „linear regression” kifejezést.)(You can also find the module by typing "linear regression" in the palette Search box.)

  5. Keresse meg, majd húzza a kísérletvászonra a Train Model (Modell betanítása) modult.Find and drag the Train Model module to the experiment canvas. Kösse össze a Linear Regression (Lineáris regresszió) modul kimenetét a Train Model (Modell betanítása) modul bal oldali bemenetével, és kösse össze a Split Data (Adatok felosztása) modul adatbetanítási kimenetét (bal oldali port) a Train Model (Modell betanítása) modul jobb oldali bemenetével.Connect the output of the Linear Regression module to the left input of the Train Model module, and connect the training data output (left port) of the Split Data module to the right input of the Train Model module.

    A „Train Model” (Modell betanítása) modul összekötése a „Linear Regression” (Lineáris regresszió) és a „Split Data” (Adatok felosztása) modulokkal

  6. Kattintson a Train Model (Modell betanítása) modulra, kattintson a Properties (Tulajdonságok) panel Launch column selector (Oszlopválasztó indítása) elemére, és válassza ki a price (ár) oszlopot.Click the Train Model module, click Launch column selector in the Properties pane, and then select the price column. Az Ár az az érték, amelyet a modellünk előre fog jelezni.Price is the value that our model is going to predict.

    Jelölje ki a price (ár) oszlopot az oszlopválasztóban. Ehhez helyezze át az Available columns (Elérhető oszlopok) listáról a Selected columns (Kiválasztott oszlopok) listára.You select the price column in the column selector by moving it from the Available columns list to the Selected columns list.

    Az ár oszlop kiválasztása a „Train Model” (Modell betanítása) modulhoz

  7. Futtassa a kísérletet.Run the experiment.

Ezzel kapunk egy betanított regressziós modellt, amely képes pontszámot rendelni az új autóadatokhoz, és így előre jelezni az árakat.We now have a trained regression model that can be used to score new automobile data to make price predictions.

A kísérlet várható megjelenése a futtatás után

Új személygépkocsik árának előrejelzésePredict new automobile prices

Most, hogy adataink 75 százalékával betanítottuk a modellt, a maradék 25 százalék pontozásával megállapíthatjuk, hogy mennyire működik jól.Now that we've trained the model using 75 percent of our data, we can use it to score the other 25 percent of the data to see how well our model functions.

  1. Keresse meg, majd húzza a kísérletvászonra a Score Model (Modell pontozása) modult.Find and drag the Score Model module to the experiment canvas. Kösse össze a Train Model (Modell betanítása) modul kimenetét a Score Model (Modell pontozása) modul bal oldali bemeneti portjával.Connect the output of the Train Model module to the left input port of Score Model. Kösse össze a Split Data (Adatok felosztása) modul tesztelési adatokat tartalmazó kimenetét (jobb oldali portját) a Score Model (Modell pontozása) modul jobb oldali bemeneti portjával.Connect the test data output (right port) of the Split Data module to the right input port of Score Model.

    A „Score Model” (Modell pontozása) modul összekötése a „Train Model” (Modell betanítása) és a „Split Data” (Adatok felosztása) modulokkal

  2. Futtassa a kísérletet, és tekintse meg a pontszám modell modul kimenetét úgy, hogy a pontszám modell kimeneti portjára kattint, és kiválasztja a vizualizáció lehetőséget.Run the experiment and view the output from the Score Model module by clicking the output port of Score Model and select Visualize. A modul megjeleníti az előre jelzett árat, valamint a tesztadatokból ismert tényleges értéket.The output shows the predicted values for price and the known values from the test data.

    A „Score Model” (Modell pontozása) modul kimenete

  3. Végül teszteljük az eredmény minőségét.Finally, we test the quality of the results. Jelölje ki, majd húzza a kísérletvászonra az Evaluate Model (Modell kiértékelése) modult, és kösse össze a Score Model (Modell pontozása) modul kimenetét az Evaluate Model (Modell kiértékelése) bal oldali bemeneti portjával.Select and drag the Evaluate Model module to the experiment canvas, and connect the output of the Score Model module to the left input of Evaluate Model. Az elkészült kísérletnek a következőképpen kell kinéznie:The final experiment should look something like this:

    Az elkészült kísérlet

  4. Futtassa a kísérletet.Run the experiment.

Az Evaluate Model (Modell kiértékelése) modul eredményének megtekintéséhez kattintson a kimeneti portra, majd válassza a Visualize (Képi megjelenítés) lehetőséget.To view the output from the Evaluate Model module, click the output port, and then select Visualize.

A kísérlet kiértékelésének eredménye

A következő statisztikák tekinthetők meg:The following statistics are shown for our model:

  • Mean Absolute Error (átlagos abszolút eltérés, MAE): az abszolút eltérések átlaga (eltérésnek az előre jelzett érték és a tényleges érték közötti különbséget nevezzük).Mean Absolute Error (MAE): The average of absolute errors (an error is the difference between the predicted value and the actual value).
  • Root Mean Squared Error (gyökátlagos négyzetes eltérés, RMSE): a tesztelési adathalmazon végzett előrejelzések eltéréseinek négyzetéből számított átlag négyzetgyöke.Root Mean Squared Error (RMSE): The square root of the average of squared errors of predictions made on the test dataset.
  • Relative Absolute Error (relatív abszolút eltérés): a tényleges értékek és az összes tényleges értékek átlaga közötti különbségek abszolút eltérésének átlaga.Relative Absolute Error: The average of absolute errors relative to the absolute difference between actual values and the average of all actual values.
  • Relative Squared Error (relatív négyzetes eltérés): a négyzetes eltérések átlaga a tényleges értékek és az összes tényleges érték átlaga közötti különbség négyzetes értékéhez viszonyítva.Relative Squared Error: The average of squared errors relative to the squared difference between the actual values and the average of all actual values.
  • Coefficient of Determination (determinációs együttható): ez az R-négyzet értéke néven is ismert statisztikai mérőszám azt mutatja, hogy a modell mennyire illik az adatokhoz.Coefficient of Determination: Also known as the R squared value, this is a statistical metric indicating how well a model fits the data.

Az összes hibastatisztikára igaz, hogy minél kisebb az érték, annál jobb a modell.For each of the error statistics, smaller is better. A kisebb értékek azt jelzik, hogy az előrejelzés közelebb van a tényleges értékekhez.A smaller value indicates that the predictions more closely match the actual values. A Coefficient of Determination (determinációs együttható) értéke minél közelebb van az egyhez (1,0-hoz), annál pontosabb az előrejelzés.For Coefficient of Determination, the closer its value is to one (1.0), the better the predictions.

Az erőforrások eltávolításaClean up resources

Ha már nincs szüksége az ebben a cikkben létrehozott erőforrásokra, törölje őket, hogy elkerülje a költségek viselését.If you no longer need the resources you created using this article, delete them to avoid incurring any charges. A cikkből megtudhatja, hogyan exportálhatja és törölheti a terméken belüli felhasználói információkat.Learn how in the article, Export and delete in-product user data.

Következő lépésekNext steps

Ebben a rövid útmutatóban létrehozott egy egyszerű kísérletet egy minta adatkészlet használatával.In this quickstart, you created a simple experiment using a sample dataset. Ha szeretné megvizsgálni, hogyan hozhat létre és helyezhet üzembe egy modellt részletesebben, folytassa a prediktív megoldás oktatóanyagával.To explore the process of creating and deploying a model in more depth, continue to the predictive solution tutorial.