Rychlý Start: vytvoření prvního experimentu pro datové vědy v Machine Learning Studio (Classic)Quickstart: Create your first data science experiment in Machine Learning Studio (classic)

platí pro:  Toto je značka zaškrtnutí, což znamená, že se tento článek týká Machine Learning Studio (Classic). Machine Learning Studio (Classic)  Toto je X, což znamená, že se tento článek týká Azure Machine Learning. Azure Machine Learning APPLIES TO: This is a check mark, which means that this article applies to Machine Learning Studio (classic).Machine Learning Studio (classic) This is an X, which means that this article applies to Azure Machine Learning.Azure Machine Learning

Tip

Zákazníci, kteří používají nebo vyhodnocují Machine Learning Studio (Classic), se doporučuje vyzkoušet Azure Machine Learning Studio, které poskytuje moduly přetažení a škálovatelnost , správu verzí a zabezpečení podniku.Customers using or evaluating Machine Learning Studio (classic) are encouraged to try Azure Machine Learning studio, which provides drag and drop ML modules plus scalability, version control, and enterprise security.

V tomto rychlém startu vytvoříte experiment strojového učení v Azure Machine Learning Studio (Classic) , který předpovídá cenu auta na základě různých proměnných, jako jsou třeba technické specifikace.In this quickstart, you create a machine learning experiment in Azure Machine Learning Studio (classic) that predicts the price of a car based on different variables such as make and technical specifications.

Pokud se naučíte novinkou ve strojovém učení, je pro začátečníky užitečná řada datových věd , která využívá každodenní jazyk a koncepty.If you're brand new to machine learning, the video series Data Science for Beginners is a great introduction to machine learning using everyday language and concepts.

Tento rychlý Start následuje za výchozím pracovním postupem pro experiment:This quickstart follows the default workflow for an experiment:

  1. Vytvoření modeluCreate a model
  2. Trénování modeluTrain the model
  3. Stanovení skóre a otestování modeluScore and test the model

Získání datGet the data

První věc, kterou potřebujete ve službě Machine Learning, je data.The first thing you need in machine learning is data. Sada Studio (Classic) obsahuje několik ukázkových datových sad, které můžete použít, nebo můžete importovat data z mnoha zdrojů.There are several sample datasets included with Studio (classic) that you can use, or you can import data from many sources. V tomto příkladu použijeme ukázkovou datovou sadu Automobile price data (Raw), která je součástí vašeho pracovního prostoru.For this example, we'll use the sample dataset, Automobile price data (Raw), that's included in your workspace. Tato datová sada obsahuje záznamy řady různých automobilů, včetně informací o značce, modelu, technických specifikacích a ceně.This dataset includes entries for various individual automobiles, including information such as make, model, technical specifications, and price.

Tip

Pracovní kopii následujícího experimentu najdete v galerii Azure AI.You can find a working copy of the following experiment in the Azure AI Gallery. Přejděte na první experiment z oblasti datové vědy, předpověď ceny automobilu a kliknutím na otevřít v aplikaci Studio Stáhněte kopii experimentu do pracovního prostoru Machine Learning Studio (Classic).Go to Your first data science experiment - Automobile price prediction and click Open in Studio to download a copy of the experiment into your Machine Learning Studio (classic) workspace.

Tuto datovou sadu dostanete do svého experimentu takto.Here's how to get the dataset into your experiment.

  1. Vytvořte nový experiment kliknutím na + Nový ve spodní části okna Machine Learning Studio (Classic).Create a new experiment by clicking +NEW at the bottom of the Machine Learning Studio (classic) window. Vyberte experimentovat > prázdný experiment.Select EXPERIMENT > Blank Experiment.

  2. Experimentu se přiřadí výchozí název, který se zobrazí v horní části plátna.The experiment is given a default name that you can see at the top of the canvas. Vyberte tento text a přejmenujte jej na něco smysluplného, například Predikce ceny automobilu.Select this text and rename it to something meaningful, for example, Automobile price prediction. Název nemusí být jedinečný.The name doesn't need to be unique.

    Přejmenování experimentu

  3. Nalevo od plátna experimentu je paleta datových sad a modulů.To the left of the experiment canvas is a palette of datasets and modules. Do pole Hledat v horní části palety zadejte automobile. Vyhledá se datová sada Automobile price data (Raw).Type automobile in the Search box at the top of this palette to find the dataset labeled Automobile price data (Raw). Přetáhněte tuto datovou sadu na plátno experimentu.Drag this dataset to the experiment canvas.

    Vyhledejte datovou sadu automobilů a přetáhněte ji na plátno experimentu.

Pokud se chcete podívat, jak tato data vypadají, klikněte na výstupní port v dolní části datové sady automobilu a potom vyberte vizualizovat.To see what this data looks like, click the output port at the bottom of the automobile dataset then select Visualize.

Klikněte na výstupní port a vyberte Vizualizovat.

Tip

Vstupní a výstupní porty datových sad a modulů jsou reprezentované malými kroužky – vstupní porty v horní části, výstupní porty v dolní části.Datasets and modules have input and output ports represented by small circles - input ports at the top, output ports at the bottom. Pokud chcete vytvořit tok dat prostřednictvím experimentu, připojte výstupní port jednoho modulu ke vstupnímu portu jiného.To create a flow of data through your experiment, you'll connect an output port of one module to an input port of another. V libovolném okamžiku můžete kliknout na výstupní port datové sady nebo modulu a prohlédnout si, jak v tomto bodě vypadá tok dat.At any time, you can click the output port of a dataset or module to see what the data looks like at that point in the data flow.

V této datové sadě každý řádek představuje automobil a proměnné přidružené k jednotlivým automobilům se zobrazí jako sloupce.In this dataset, each row represents an automobile, and the variables associated with each automobile appear as columns. Za použití proměnných pro konkrétní automobil předpovídáme cenu v pravém sloupci (sloupec 26 s názvem Price).We'll predict the price in far-right column (column 26, titled "price") using the variables for a specific automobile.

Zobrazte data automobilů v okně vizualizace dat.

Kliknutím na x v pravém horním rohu zavřete okno vizualizace.Close the visualization window by clicking the "x" in the upper-right corner.

Příprava datPrepare the data

Před analýzou datové sady bývá zpravidla nutné sadu nějakým způsobem předzpracovat.A dataset usually requires some preprocessing before it can be analyzed. Možná jste si ve sloupcích různých řádků všimli chybějících hodnot.You might have noticed the missing values present in the columns of various rows. Tyto chybějící hodnoty se musí vyčistit, aby model mohl data správně analyzovat.These missing values need to be cleaned so the model can analyze the data correctly. Odebereme všechny řádky, které obsahují chybějící hodnoty.We'll remove any rows that have missing values. Hodnoty ve sloupci normalized-losses navíc z velké části chybí, proto tento sloupec v modelu zcela vynecháme.Also, the normalized-losses column has a large proportion of missing values, so we'll exclude that column from the model altogether.

Tip

Vyčištění chybějících hodnot ze vstupních dat je pro většinu modulů nutností.Cleaning the missing values from input data is a prerequisite for using most of the modules.

Nejprve přidáme modul, který zcela odebere sloupec normalizovaných ztrát .First, we add a module that removes the normalized-losses column completely. Pak přidáme další modul, který odebere všechny řádky, které obsahují chybějící data.Then we add another module that removes any row that has missing data.

  1. Do pole Hledat v horní části palety modulů zadejte Výběr sloupců a vyhledejte modul Výběr sloupců v datové sadě .Type select columns in the search box at the top of the module palette to find the Select Columns in Dataset module. Přetáhněte ho na plátno experimentu.Then drag it to the experiment canvas. Tento modul umožňuje vybrat, které sloupce dat chceme zahrnout do modelu, nebo je z modelu naopak vyloučit.This module allows us to select which columns of data we want to include or exclude in the model.

  2. Připojte výstupní port datové sady dat automobilu (RAW) k vstupnímu portu pro výběr sloupců v datové sadě.Connect the output port of the Automobile price data (Raw) dataset to the input port of the Select Columns in Dataset.

    Přidejte modul Výběr sloupců v datové sadě na plátno experimentu a připojte ho.

  3. Klikněte na modul Výběr sloupců v datové sadě a v podokně Vlastnosti klikněte na Spustit selektor sloupců.Click the Select Columns in Dataset module and click Launch column selector in the Properties pane.

    • Vlevo klikněte na S pravidly.On the left, click With rules

    • V části Začít s klikněte na Všechny sloupce.Under Begin With, click All columns. Tato pravidla přímo vyberou sloupce v datové sadě , aby prošla všemi sloupci (s výjimkou těch sloupců, které se chystáme vyloučit).These rules direct Select Columns in Dataset to pass through all the columns (except those columns we're about to exclude).

    • V rozevíracích seznamech vyberte Vyloučit a názvy sloupců a klikněte do textového pole.From the drop-downs, select Exclude and column names, and then click inside the text box. Zobrazí se seznam sloupců.A list of columns is displayed. Vyberte sloupec normalized-losses, který se tak přidá do textového pole.Select normalized-losses, and it's added to the text box.

    • Kliknutím na tlačítko se značkou zaškrtnutí (OK) zavřete selektor sloupců (vpravo dole).Click the check mark (OK) button to close the column selector (on the lower right).

      Spusťte selektor sloupců a vylučte sloupec normalized-losses.

      Podokno vlastností modulu Výběr sloupců v datové sadě teď indikuje, že modul bude procházet všechny sloupce datové sady kromě normalized-losses.Now the properties pane for Select Columns in Dataset indicates that it will pass through all columns from the dataset except normalized-losses.

      Podokno vlastností indikuje, že sloupec normalized-losses je vyloučený.

      Tip

      Kliknutím dvakrát na modul a zadáním textu je možné přidat k modulu komentář.You can add a comment to a module by double-clicking the module and entering text. To vám může pomoci rychle poznat, jaký je účel modulu v experimentu.This can help you see at a glance what the module is doing in your experiment. V tomto případě klikněte dvakrát na modul Výběr sloupců v datové sadě a zadejte komentář Vyloučit normalized-losses.In this case double-click the Select Columns in Dataset module and type the comment "Exclude normalized losses."

      Klikněte dvakrát na modul a přidejte komentář.

  4. Přetáhněte modul Vyčištění chybějících dat na plátno experimentu a propojte jej s modulem Výběr sloupců v datové sadě.Drag the Clean Missing Data module to the experiment canvas and connect it to the Select Columns in Dataset module. V podokně Vlastnosti vyberte v části Režim čištění možnost Odstranit celý řádek.In the Properties pane, select Remove entire row under Cleaning mode. Tyto možnosti přímo čistí chybějící data k vyčištění dat odstraněním řádků, které obsahují chybějící hodnoty.These options direct Clean Missing Data to clean the data by removing rows that have any missing values. Klikněte dvakrát na modul a zadejte komentář Odstranění řádků s chybějícími hodnotami.Double-click the module and type the comment "Remove missing value rows."

    Pro modul Vyčištění chybějících dat nastavte režim čištění na Odstranit celý řádek.

  5. Spusťte experiment kliknutím na SPUSTIT v dolní části stránky.Run the experiment by clicking RUN at the bottom of the page.

    Až se spuštění experimentu dokončí, u všech modulů se zobrazí zelená značka zaškrtnutí, která označuje, že jejich činnost úspěšně skončila.When the experiment has finished running, all the modules have a green check mark to indicate that they finished successfully. Všimněte si také stavu Konec běhu v pravém horním rohu.Notice also the Finished running status in the upper-right corner.

    Po spuštění by experiment měl vypadat asi takhle nějak.

Tip

Proč jsme experiment teď spustili?Why did we run the experiment now? Spuštěním experimentu jsme zajistili, aby definice sloupců pro naše data prošly z původní datové sady přes modul Výběr sloupců v datové sadě a přes modul Vyčištění chybějících dat.By running the experiment, the column definitions for our data pass from the dataset, through the Select Columns in Dataset module, and through the Clean Missing Data module. To znamená, že všechny moduly, které připojíme k modulu Vyčištění chybějících dat, budou také mít tytéž informace.This means that any modules we connect to Clean Missing Data will also have this same information.

Teď máme čistá data.Now we have clean data. Pokud si chcete zobrazit vyčištěnou datovou sadu, klikněte na levý výstupní port modulu Vyčištění chybějících dat a vyberte Vizualizovat.If you want to view the cleaned dataset, click the left output port of the Clean Missing Data module and select Visualize. Všimněte si, že již není zobrazen sloupec normalized-losses a že nechybí žádné hodnoty.Notice that the normalized-losses column is no longer included, and there are no missing values.

Nyní když jsou data vyčištěna, můžete určit, které příznaky použijeme v prediktivním modelu.Now that the data is clean, we're ready to specify what features we're going to use in the predictive model.

Definovat funkceDefine features

Ve strojovém učení jsou funkce jednotlivé měřitelné vlastnosti něčeho, co vás zajímá.In machine learning, features are individual measurable properties of something you're interested in. V naší datové sadě každý řádek představuje jeden automobil a každý sloupec je příznak daného automobilu.In our dataset, each row represents one automobile, and each column is a feature of that automobile.

Nalezení správné sady příznaků pro vytvoření prediktivního modelu vyžaduje experimentování a znalost problému, který chcete vyřešit.Finding a good set of features for creating a predictive model requires experimentation and knowledge about the problem you want to solve. Některé příznaky jsou pro predikci cíle vhodnější než jiné.Some features are better for predicting the target than others. Některé funkce mají silnou korelaci s jinými funkcemi a dají se odebrat.Some features have a strong correlation with other features and can be removed. Například příznaky city-mpg a highway-mpg jsou vzájemně těsně propojené, takže stačí jeden z nich odebrat a ponechat jenom ten druhý, aniž by to vytvářenou predikci výrazně ovlivnilo.For example, city-mpg and highway-mpg are closely related so we can keep one and remove the other without significantly affecting the prediction.

Vytvořme model, který používá podmnožinu příznaků naší datové sady.Let's build a model that uses a subset of the features in our dataset. Později můžete vybrat jiné příznaky, spustit experiment znovu a zjistit, jestli nedostanete lepší výsledky.You can come back later and select different features, run the experiment again, and see if you get better results. Nejdřív ale vyzkoušíme tyto funkce:But to start, let's try the following features:

Značka, styl textu, kolo – základ, velikost motoru, výkon, špička, max./min., silniční-MPG, cenamake, body-style, wheel-base, engine-size, horsepower, peak-rpm, highway-mpg, price

  1. Na plátno experimentu přetáhněte další modul Výběr sloupců v datové sadě.Drag another Select Columns in Dataset module to the experiment canvas. Propojte levý výstupní port modulu Vyčištění chybějících dat se vstupem modulu Výběr sloupců v datové sadě.Connect the left output port of the Clean Missing Data module to the input of the Select Columns in Dataset module.

    Připojte modul Výběr sloupců v datové sadě k modulu Vyčištění chybějících dat.

  2. Poklikejte na modul a zadejte Výběr příznaků pro predikci.Double-click the module and type "Select features for prediction."

  3. V podokně Vlastnosti klikněte na Spustit selektor sloupců.Click Launch column selector in the Properties pane.

  4. Klikněte na S pravidly.Click With rules.

  5. V části Začít s klikněte na Žádné sloupce.Under Begin With, click No columns. V řádku filtru vyberte Zahrnout a názvy sloupců a vyberte náš seznam názvů sloupců v textovém poli.In the filter row, select Include and column names and select our list of column names in the text box. Tento filtr přesměruje modul, aby nepředával žádné sloupce (funkce) s výjimkou těch, které určíme.This filter directs the module to not pass through any columns (features) except the ones that we specify.

  6. Klikněte na tlačítko zaškrtnutí (OK).Click the check mark (OK) button.

    Vyberte sloupce (příznaky), které se mají zahrnout do predikce.

Tento modul vytváří filtrovanou datovou sadu obsahující jenom ty funkce, které chceme předat do výukového algoritmu, který použijeme v dalším kroku.This module produces a filtered dataset containing only the features we want to pass to the learning algorithm we'll use in the next step. Později se můžete vrátit a zkusit jiný výběr příznaků.Later, you can return and try again with a different selection of features.

Volba a použití algoritmuChoose and apply an algorithm

Nyní když jsou data připravena, tvorba prediktivního modelu sestává z trénování a testování.Now that the data is ready, constructing a predictive model consists of training and testing. Naše data použijeme pro trénování modelu. Potom model otestujeme a zjistíme, jak přesně dokáže předpovídat ceny.We'll use our data to train the model, and then we'll test the model to see how closely it's able to predict prices.

Klasifikace a regrese jsou dva typy technik strojového učení se supervizí.Classification and regression are two types of supervised machine learning algorithms. Klasifikace předpovídá odpověď na základě definované sady kategorií, třeba barvy (červená, modrá nebo zelená).Classification predicts an answer from a defined set of categories, such as a color (red, blue, or green). Regrese se používá k předpovědi čísel.Regression is used to predict a number.

Chceme předpovědět cenu, což je číslo, a tak použijeme regresní algoritmus.Because we want to predict price, which is a number, we'll use a regression algorithm. V tomto příkladu použijeme model lineární regrese .For this example, we'll use a linear regression model.

Model trénujeme tím, že mu poskytneme sadu dat, která zahrnují cenu.We train the model by giving it a set of data that includes the price. Model projde data a hledá korelaci mezi příznaky automobilu a jeho cenou.The model scans the data and look for correlations between an automobile's features and its price. Potom model otestujeme. Poskytneme mu sadu příznaků pro automobily, které známe, a uvidíme, do jaké míry se predikce modelu blíží známé ceně.Then we'll test the model - we'll give it a set of features for automobiles we're familiar with and see how close the model comes to predicting the known price.

Naše data můžeme použít jak pro trénování modelu, tak pro jeho otestování. Dají se totiž rozdělit na samostatné sady pro trénování a testování.We'll use our data for both training the model and testing it by splitting the data into separate training and testing datasets.

  1. Vyberte a přetáhněte na plátno experimentu modul Rozdělení dat a propojte jej s posledním modulem Výběr sloupců v datové sadě.Select and drag the Split Data module to the experiment canvas and connect it to the last Select Columns in Dataset module.

  2. Klikněte na modul Rozdělení dat. Modul se vybere.Click the Split Data module to select it. Vyhledejte Podíl řádků v první výstupní sadě dat (v podokně Vlastnosti napravo od plátna) a nastavte ho na 0,75.Find the Fraction of rows in the first output dataset (in the Properties pane to the right of the canvas) and set it to 0.75. Takto použijeme 75 procent dat pro trénování modelu a 25 procent si ponecháme na testování.This way, we'll use 75 percent of the data to train the model, and hold back 25 percent for testing.

    Nastavte podíl pro rozdělení modulu Rozdělení dat na 0,75.

    Tip

    Změnou parametru Náhodná počáteční hodnota je možné pro trénování a testování vytvořit různé náhodné vzorky.By changing the Random seed parameter, you can produce different random samples for training and testing. Tento parametr řídí nastavování počáteční hodnoty pseudonáhodného generátoru čísel.This parameter controls the seeding of the pseudo-random number generator.

  3. Spusťte experiment.Run the experiment. Při spuštění experimentu moduly Výběr sloupců v datové sadě a Rozdělení dat předají definice sloupců do modulů, které přidáme jako další.When the experiment is run, the Select Columns in Dataset and Split Data modules pass column definitions to the modules we'll be adding next.

  4. Nyní vyberte algoritmus učení. Na paletě modulů nalevo od plátna rozbalte kategorii Strojové učení a pak Inicializovat model.To select the learning algorithm, expand the Machine Learning category in the module palette to the left of the canvas, and then expand Initialize Model. Tímto se zobrazí několik kategorií modulů, které je možné použít k inicializaci algoritmů strojového učení.This displays several categories of modules that can be used to initialize machine learning algorithms. Pro tento experiment vyberte modul Lineární regrese v kategorii Regrese a přetáhněte ho na plátno experimentu.For this experiment, select the Linear Regression module under the Regression category, and drag it to the experiment canvas. (Tento modul můžete najít i tak, že do pole Hledat palety zadáte lineární regrese.)(You can also find the module by typing "linear regression" in the palette Search box.)

  5. Najděte modul Trénování modelu a přetáhněte ho na plátno experimentu.Find and drag the Train Model module to the experiment canvas. Propojte výstup modulu Lineární regrese s levým vstupem modulu Trénování modelu a potom propojte výstup trénovacích dat (levý port) modulu Rozdělení dat s pravým vstupem modulu Trénování modelu.Connect the output of the Linear Regression module to the left input of the Train Model module, and connect the training data output (left port) of the Split Data module to the right input of the Train Model module.

    Připojte modul Trénování modelu k modulům Lineární regrese a Rozdělení dat.

  6. Klikněte na modul Trénování modelu, v podokně Vlastnosti klikněte na Spustit selektor sloupců a vyberte sloupec price.Click the Train Model module, click Launch column selector in the Properties pane, and then select the price column. Cena je hodnota, kterou náš model hodlá předpovědět.Price is the value that our model is going to predict.

    V selektoru sloupců vyberete sloupec price – přesunete ho ze seznamu Dostupné sloupce do seznamu Vybrané sloupce.You select the price column in the column selector by moving it from the Available columns list to the Selected columns list.

    Pro modul Trénování modelu vyberte sloupec price.

  7. Spusťte experiment.Run the experiment.

Výsledkem je natrénovaný model, který je možné použít ke stanovení skóre pro nová data automobilů a k následné predikci cen.We now have a trained regression model that can be used to score new automobile data to make price predictions.

Po spuštění by experiment měl vypadat asi takhle nějak.

Předpověď cen nových automobilůPredict new automobile prices

Nyní když jsme natrénovali model pomocí 75 procent dat, můžeme model použít ke stanovení skóre u zbylých 25 procent dat a zjistit, jak dobře model funguje.Now that we've trained the model using 75 percent of our data, we can use it to score the other 25 percent of the data to see how well our model functions.

  1. Najděte modul Určení skóre modelu a přetáhněte ho na plátno experimentu.Find and drag the Score Model module to the experiment canvas. Propojte výstup modulu Trénování modelu s levým vstupním portem modulu Určení skóre modelu.Connect the output of the Train Model module to the left input port of Score Model. Propojte výstup testovacích dat (pravý port) modulu Rozdělení dat s pravým vstupním portem modulu Určení skóre modelu.Connect the test data output (right port) of the Split Data module to the right input port of Score Model.

    Propojte modul Určení skóre modelu s moduly Lineární regrese a Rozdělení dat.

  2. Spusťte experiment a zobrazte výstup z modulu skóre modelu kliknutím na výstupní port modelu skóre a vyberte vizualizovat.Run the experiment and view the output from the Score Model module by clicking the output port of Score Model and select Visualize. Na výstupu se zobrazí predikované hodnoty ceny a známé hodnoty v testovacích datech.The output shows the predicted values for price and the known values from the test data.

    Výstup modulu Určení skóre modelu

  3. Nakonec otestujeme kvalitu výsledků.Finally, we test the quality of the results. Najděte modul Vyhodnocení modelu, přetáhněte ho na plátno experimentu a propojte výstup modulu Určení skóre modelu s levým vstupem modulu Vyhodnocení modelu.Select and drag the Evaluate Model module to the experiment canvas, and connect the output of the Score Model module to the left input of Evaluate Model. Konečný experiment by měl vypadat přibližně takto:The final experiment should look something like this:

    Konečný experiment

  4. Spusťte experiment.Run the experiment.

Zobrazte výstup modulu Vyhodnocení modelu tak, že kliknete na výstupní port a vyberete Vizualizovat.To view the output from the Evaluate Model module, click the output port, and then select Visualize.

Výsledky vyhodnocení pro experiment

Pro náš model se zobrazí následující statistiky:The following statistics are shown for our model:

  • Střední absolutní chyba (MAE): Průměr absolutních chyb (chyba je rozdíl mezi předpovězenou a skutečnou hodnotu)Mean Absolute Error (MAE): The average of absolute errors (an error is the difference between the predicted value and the actual value).
  • Odmocnina střední kvadratické chyby (RMSE): Druhá odmocnina průměru kvadratických chyb předpovědí na základě testovací datové sadyRoot Mean Squared Error (RMSE): The square root of the average of squared errors of predictions made on the test dataset.
  • Relativní absolutní chyba: Průměr absolutních chyb relativních k absolutnímu rozdílu mezi skutečnými hodnotami a průměrem všech skutečných hodnotRelative Absolute Error: The average of absolute errors relative to the absolute difference between actual values and the average of all actual values.
  • Relativní kvadratická chyba: Průměr kvadratických chyb relativních ke kvadratickému rozdílu mezi skutečnými hodnotami a průměrem všech skutečných hodnotRelative Squared Error: The average of squared errors relative to the squared difference between the actual values and the average of all actual values.
  • Koeficient spolehlivosti: Znám také jako hodnota spolehlivosti R, tedy statistická metrika označující kvalitu přizpůsobení modelu datůmCoefficient of Determination: Also known as the R squared value, this is a statistical metric indicating how well a model fits the data.

Pro každou statistiku chyb platí, že menší hodnota je lepší.For each of the error statistics, smaller is better. Menší hodnota označuje, že předpověď přesněji odpovídá skutečným hodnotám.A smaller value indicates that the predictions more closely match the actual values. V případě koeficientu spolehlivosti platí, že čím bližší je jeho hodnota hodnotě jedna (1,0), tím lepší jsou předpovědi.For Coefficient of Determination, the closer its value is to one (1.0), the better the predictions.

Vyčištění prostředkůClean up resources

Pokud už nepotřebujete prostředky, které jste vytvořili pomocí tohoto článku, odstraňte je, abyste se vyhnuli poplatkům.If you no longer need the resources you created using this article, delete them to avoid incurring any charges. Naučte se, jak v článku exportovat a odstranit data uživatelů v produktu.Learn how in the article, Export and delete in-product user data.

Další krokyNext steps

V tomto rychlém startu jste vytvořili jednoduchý experiment s použitím ukázkové datové sady.In this quickstart, you created a simple experiment using a sample dataset. Chcete-li prozkoumat proces tvorby a nasazení modelu podrobněji, pokračujte do kurzu prediktivního řešení.To explore the process of creating and deploying a model in more depth, continue to the predictive solution tutorial.