Načtení dat školení do Tvůrce modelůLoad training data into Model Builder

Naučte se, jak načíst datové sady pro školení ze souboru nebo databáze SQL Server pro použití v jednom ze scénářů tvůrce modelů pro ML.NET.Learn how to load your training datasets from a file or a SQL Server database for use in one of the Model Builder scenarios for ML.NET. Scénáře tvůrce modelů můžou jako školicí data používat databáze SQL Server, soubory obrázků a formáty souborů CSV nebo TSV.Model Builder scenarios can use SQL Server databases, image files, and CSV or TSV file formats as training data.

Omezení datové sady školení v Tvůrci modelůTraining dataset limitations in Model Builder

Tvůrce modelů omezuje množství a typ dat, která můžete použít pro školicí modely:Model Builder limits the amount and type of data you can use for training models:

  • SQL Server data: 100 000 řádkůSQL Server data: 100,000 rows
  • Soubory CSV a TSV: bez omezení velikostiCSV and TSV files: No size limit
  • Obrázky: pouze PNG a JPG.Images: PNG and JPG only.

Scénáře tvůrce modelůModel Builder scenarios

Tvůrce modelů vám pomůže vytvořit modely pro následující scénáře strojového učení:Model Builder helps you create models for the following machine learning scenarios:

  • Analýza mínění (binární klasifikace): klasifikace textových dat do dvou kategorií.Sentiment analysis (binary classification): Classify textual data into two categories.
  • Klasifikace problému (klasifikace více tříd): klasifikace textových dat do 3 nebo více kategorií.Issue classification (multiclass classification): Classify textual data into 3 or more categories.
  • Předpověď ceny (regrese): předpověď číselné hodnoty.Price prediction (regression): Predict a numeric value.
  • Klasifikace obrázků (obsáhlý Learning): kategorizace imagí podle vlastností.Image classification (deep learning): Categorize images based on characteristics.
  • Vlastní scénář: Sestavujte vlastní scénáře z vašich dat pomocí regresí, klasifikace a dalších úkolů.Custom scenario: Build custom scenarios from your data using regression, classification, and other tasks.

Tento článek popisuje scénáře klasifikace a regrese s textovými nebo numerickými daty a scénáři klasifikace obrázků.This article covers classification and regression scenarios with textual or numerical data, and image classification scenarios.

Načtení textu nebo číselných dat ze souboruLoad text or numeric data from a file

Do Tvůrce modelů můžete načíst text nebo číselná data ze souboru.You can load text or numeric data from a file into Model Builder. Přijímá formáty souborů ve formátu CSV nebo oddělených tabulátory (TSV).It accepts comma-delimited (CSV) or tab-delimited (TSV) file formats.

  1. V části datový krok tvůrce modelů vyberte v rozevíracím seznamu zdroj dat možnost soubor .In the data step of Model Builder, select File from the data source dropdown.
  2. Vyberte tlačítko vedle textového pole Vybrat soubor a pomocí Průzkumníka souborů Procházejte a vyberte datový soubor.Select the button next to the Select a file text box, and use File Explorer to browse and select the data file.
  3. Vyberte kategorii v rozevíracím seznamu sloupec pro předpověď (popisek) .Choose a category in the Column to Predict (Label) dropdown.
  4. V rozevíracím seznamu vstupní sloupce (funkce) potvrďte, že jsou zaškrtnuté sloupce dat, které chcete zahrnout.From the Input Columns (Features) dropdown, confirm the data columns you want to include are checked.

Pro tvůrce modelů jste dokončili nastavení souboru zdroje dat.You're done setting up your data source file for Model Builder. Vyberte odkaz výuka , který se přesune k dalšímu kroku v Tvůrci modelů.Select the Train link to move to the next step in Model Builder.

Načtení dat z databáze SQL ServerLoad data from a SQL Server database

Tvůrce modelů podporuje načítání dat z místních a vzdálených SQL Serverch databází.Model Builder supports loading data from local and remote SQL Server databases.

Načtení dat z databáze SQL Server do Tvůrce modulů:To load data from a SQL Server database into Module Builder:

  1. V části datový krok tvůrce modelů vyberte v rozevíracím seznamu zdroj dat možnost SQL Server .In the data step of Model Builder, select SQL Server from the data source dropdown.
  2. Vyberte tlačítko vedle textového pole připojit k SQL Server databázi .Select the button next to the Connect to SQL Server database text box.
    1. V dialogovém okně Vybrat data vyberte Microsoft SQL Server databázový soubor.In the Choose Data dialog, select Microsoft SQL Server Database File.
    2. Zrušte zaškrtnutí políčka vždy použít tento výběr a vyberte pokračovat .Uncheck the Always use this selection checkbox and select Continue
    3. V dialogovém okně Vlastnosti připojení vyberte Procházet a vyberte stažený. Soubor MDF.In the Connection Properties dialog, select Browse and select the downloaded .MDF file.
    4. Vybrat OKSelect OK
  3. Z rozevíracího seznamu název tabulky vyberte název datové sady.Choose the dataset name from the Table Name dropdown.
  4. V rozevíracím seznamu sloupec pro předpověď (popisek) vyberte kategorii dat, na které chcete vytvořit předpověď.From the Column to Predict (Label) dropdown, choose the data category on which you want to make a prediction.
  5. V rozevíracím seznamu vstupní sloupce (funkce) potvrďte zaškrtnutí sloupců, které chcete zahrnout.From the Input Columns (Features) dropdown, confirm the columns you want to include are checked.

Pro tvůrce modelů jste dokončili nastavení souboru zdroje dat.You're done setting up your data source file for Model Builder. Vyberte odkaz výuka , který se přesune k dalšímu kroku v Tvůrci modelů.Select the Train link to move to the next step in Model Builder.

Nastavení datových souborů obrázkůSet up image data files

Tvůrce modelů očekává, že obrazová data budou mít soubory JPG nebo PNG uspořádané ve složkách, které odpovídají kategoriím klasifikace.Model Builder expects image data to be JPG or PNG files organized in folders that correspond to the categories of the classification.

Pokud chcete načíst obrázky do Tvůrce modelů, zadejte cestu k jednomu adresáři nejvyšší úrovně:To load images into Model Builder, provide the path to a single top-level directory:

  • Tento adresář nejvyšší úrovně obsahuje jednu podsložku pro každou kategorii, kterou chcete předpovědět.This top-level directory contains one subfolder for each of the categories to predict.
  • Každá podsložka obsahuje soubory obrázků patřící do příslušné kategorie.Each subfolder contains the image files belonging to its category.

V níže uvedené struktuře složek je flower_photosadresář nejvyšší úrovně.In the folder structure illustrated below, the top-level directory is flower_photos. Existuje pět podadresářů odpovídajících kategoriím, které chcete předpovědět: uzavřené, Dandelion, růže, slunečnice a Tulips.There are five subdirectories corresponding to the categories you want to predict: daisy, dandelion, roses, sunflowers, and tulips. Každý z těchto podadresářů obsahuje obrázky, které patří do příslušné kategorie.Each of these subdirectories contains images belonging to its respective category.

\---flower_photos
    +---daisy
    |       100080576_f52e8ee070_n.jpg
    |       102841525_bd6628ae3c.jpg
    |       105806915_a9c13e2106_n.jpg
    |
    +---dandelion
    |       10443973_aeb97513fc_m.jpg
    |       10683189_bd6e371b97.jpg
    |       10919961_0af657c4e8.jpg
    |
    +---roses
    |       102501987_3cdb8e5394_n.jpg
    |       110472418_87b6a3aa98_m.jpg
    |       118974357_0faa23cce9_n.jpg
    |
    +---sunflowers
    |       127192624_afa3d9cb84.jpg
    |       145303599_2627e23815_n.jpg
    |       147804446_ef9244c8ce_m.jpg
    |
    \---tulips
            100930342_92e8746431_n.jpg
            107693873_86021ac4ea_n.jpg
            10791227_7168491604.jpg

Další krokyNext steps

Pomocí těchto kurzů sestavíte aplikace Machine Learning pomocí Tvůrce modelů:Follow these tutorials to build machine learning apps with Model Builder:

Pokud model sledujete pomocí kódu, Naučte se načíst data pomocí rozhraní ml.NET API.If you're training a model using code, learn how to load data using the ML.NET API.