Share via


Trainingsgegevens laden in Model Builder

Meer informatie over het laden van uw trainingsgegevenssets uit een bestand of een SQL Server-database voor gebruik in een van de Model Builder-scenario's voor ML.NET. Model Builder-scenario's kunnen SQL Server-databases, afbeeldingsbestanden en CSV- of TSV-bestandsindelingen gebruiken als trainingsgegevens.

Model Builder accepteert alleen TSV-, CSV- en TXT-bestanden met komma-, tab- en puntkommascheidingstekens en PNG- en JPG-afbeeldingen.

Scenario's voor Model Builder

Met Model Builder kunt u modellen maken voor de volgende machine learning-scenario's:

  • Gegevensclassificatie (binaire en multiklasseclassificatie): Classificeer tekstgegevens in twee of meer categorieën.
  • Waardevoorspelling (regressie): Een numerieke waarde voorspellen.
  • Afbeeldingsclassificatie (deep learning): Afbeeldingen classificeren in twee of meer categorieën.
  • Aanbeveling (aanbeveling): Maak een lijst met voorgestelde items voor een bepaalde gebruiker.
  • Objectdetectie (deep learning): Object in afbeeldingen detecteren en identificeren. Hiermee kunt u een of meer objecten vinden en ze dienovereenkomstig labelen.

Dit artikel bevat informatie over classificatie en regressie met tekst- of numerieke gegevens, afbeeldingsclassificatie en objectdetectiescenario's.

Tekst- of numerieke gegevens uit een bestand laden

U kunt tekst- of numerieke gegevens uit een bestand laden in Model Builder. Het accepteert door komma's gescheiden (CSV) of TSV-bestandsindelingen (tabscheidingstekens).

  1. Selecteer Bestand als het gegevensbrontype in de gegevensstap van Model Builder.

  2. Selecteer de knop Bladeren naast het tekstvak en gebruik Bestandenverkenner om door het gegevensbestand te bladeren en te selecteren.

  3. Kies een categorie in de vervolgkeuzelijst Kolom om (Label) te voorspellen.

    Notitie

    (Optioneel) scenario's voor gegevensclassificatie: als het gegevenstype van uw labelkolom (de waarde in de vervolgkeuzelijst Kolom om te voorspellen (Label)' is ingesteld op Booleaanse waarde (waar/onwaar), wordt een binair classificatie-algoritme gebruikt in uw modeltrainingspijplijn. Anders wordt een classificatietrainer met meerdere klassen gebruikt. Gebruik geavanceerde gegevensopties om het gegevenstype voor uw labelkolom te wijzigen en modelbouwer te informeren welk type trainer deze moet gebruiken voor uw gegevens.

  4. Werk de gegevens in de koppeling Geavanceerde gegevensopties bij om kolominstellingen in te stellen of de gegevensopmaak bij te werken.

U bent klaar met het instellen van uw gegevensbestand voor Model Builder. Klik op de knop Volgende stap om naar de volgende stap in Model builder te gaan.

Gegevens laden uit een SQL Server-database

Model Builder ondersteunt het laden van gegevens uit lokale en externe SQL Server-databases.

Lokaal databasebestand

Gegevens uit een SQL Server-databasebestand laden in Model Builder:

  1. Selecteer IN de gegevensstap van Model Builder SQL Server als het gegevensbrontype.

  2. Selecteer de knop Gegevensbron kiezen.

    1. Selecteer In het dialoogvenster Gegevensbron kiezen microsoft SQL Server-databasebestand.
    2. Schakel het selectievakje Altijd deze selectie gebruiken uit en selecteer Doorgaan
    3. Selecteer Bladeren in het dialoogvenster Verbinding maken ionEigenschappen en selecteer het gedownloade. MDF-bestand.
    4. Selecteer OK.
  3. Kies de naam van de gegevensset in de vervolgkeuzelijst Tabelnaam .

  4. Kies in de vervolgkeuzelijst Kolom om (Label) te voorspellen de gegevenscategorie waarvoor u een voorspelling wilt doen.

    Notitie

    (Optioneel) scenario's voor gegevensclassificatie: als het gegevenstype van uw labelkolom (de waarde in de vervolgkeuzelijst Kolom om te voorspellen (Label)' is ingesteld op Booleaanse waarde (waar/onwaar), wordt een binair classificatie-algoritme gebruikt in uw modeltrainingspijplijn. Anders wordt een classificatietrainer met meerdere klassen gebruikt. Gebruik geavanceerde gegevensopties om het gegevenstype voor uw labelkolom te wijzigen en modelbouwer te informeren welk type trainer deze moet gebruiken voor uw gegevens.

  5. Werk de gegevens in de koppeling Geavanceerde gegevensopties bij om kolominstellingen in te stellen of de gegevensopmaak bij te werken.

Externe database

Gegevens laden vanuit een SQL Server-databaseverbinding in Model Builder:

  1. Selecteer IN de gegevensstap van Model Builder SQL Server als het gegevensbrontype.

  2. Selecteer de knop Gegevensbron kiezen.

    1. Selecteer Microsoft SQL Server in het dialoogvenster Gegevensbron kiezen.
  3. Voer in het dialoogvenster Verbinding maken ioneigenschappen de eigenschappen van uw Microsoft SQL-database in.

    1. Geef de servernaam op met de tabel waarmee u verbinding wilt maken.
    2. Stel de verificatie in op de server. Als SQL Server-verificatie is geselecteerd, voert u de gebruikersnaam en het wachtwoord van de server in.
    3. Selecteer met welke database u verbinding wilt maken in de vervolgkeuzelijst Een databasenaam selecteren of invoeren. Dit moet automatisch worden ingevuld als de servernaam en aanmeldingsgegevens juist zijn.
    4. Selecteer OK.
  4. Kies de naam van de gegevensset in de vervolgkeuzelijst Tabelnaam .

  5. Kies in de vervolgkeuzelijst Kolom om (Label) te voorspellen de gegevenscategorie waarvoor u een voorspelling wilt doen.

    Notitie

    (Optioneel) scenario's voor gegevensclassificatie: als het gegevenstype van uw labelkolom (de waarde in de vervolgkeuzelijst Kolom om te voorspellen (Label)' is ingesteld op Booleaanse waarde (waar/onwaar), wordt een binair classificatie-algoritme gebruikt in uw modeltrainingspijplijn. Anders wordt een classificatietrainer met meerdere klassen gebruikt. Gebruik geavanceerde gegevensopties om het gegevenstype voor uw labelkolom te wijzigen en modelbouwer te informeren welk type trainer deze moet gebruiken voor uw gegevens.

  6. Werk de gegevens in de koppeling Geavanceerde gegevensopties bij om kolominstellingen in te stellen of de gegevensopmaak bij te werken.

U bent klaar met het instellen van uw gegevensbestand voor Model Builder. Klik op de koppeling Volgende stap om naar de volgende stap in Model Builder te gaan.

Gegevensbestanden voor afbeeldingsclassificatie instellen

Model Builder verwacht dat afbeeldingsclassificatiegegevens JPG- of PNG-bestanden zijn die zijn ingedeeld in mappen die overeenkomen met de categorieën van de classificatie.

Als u installatiekopieën wilt laden in Model Builder, geeft u het pad op naar één map op het hoogste niveau:

  • Deze map op het hoogste niveau bevat één submap voor elk van de categorieën die u wilt voorspellen.
  • Elke submap bevat de afbeeldingsbestanden die deel uitmaken van de categorie.

In de onderstaande mapstructuur wordt de map op het hoogste niveau flower_photos. Er zijn vijf submappen die overeenkomen met de categorieën die u wilt voorspellen: daisy, paardenbloem, rozen, zonnebloemen en tulpen. Elk van deze submappen bevat afbeeldingen die behoren tot de respectieve categorie.

\---flower_photos
    +---daisy
    |       100080576_f52e8ee070_n.jpg
    |       102841525_bd6628ae3c.jpg
    |       105806915_a9c13e2106_n.jpg
    |
    +---dandelion
    |       10443973_aeb97513fc_m.jpg
    |       10683189_bd6e371b97.jpg
    |       10919961_0af657c4e8.jpg
    |
    +---roses
    |       102501987_3cdb8e5394_n.jpg
    |       110472418_87b6a3aa98_m.jpg
    |       118974357_0faa23cce9_n.jpg
    |
    +---sunflowers
    |       127192624_afa3d9cb84.jpg
    |       145303599_2627e23815_n.jpg
    |       147804446_ef9244c8ce_m.jpg
    |
    \---tulips
            100930342_92e8746431_n.jpg
            107693873_86021ac4ea_n.jpg
            10791227_7168491604.jpg

Afbeeldingsgegevensbestanden voor objectdetectie instellen

Model Builder verwacht dat afbeeldingsgegevens voor objectdetectie in JSON-indeling zijn gegenereerd op basis van VoTT. Het JSON-bestand bevindt zich in de map vott-json-export in de doellocatie die is opgegeven in de projectinstellingen.

Het JSON-bestand bestaat uit de volgende gegevens die zijn gegenereerd door VoTT:

  • Alle tags die zijn gemaakt
  • De locaties van het afbeeldingsbestand
  • Informatie over het begrenzingsvak van de afbeelding
  • De tag die is gekoppeld aan de afbeelding

Zie Objectdetectiegegevens genereren vanuit VoTT voor meer informatie over het voorbereiden van gegevens voor objectdetectie.

Volgende stappen

Volg deze zelfstudies om machine learning-apps te bouwen met Model Builder:

Als u een model traint met behulp van code, leert u hoe u gegevens laadt met behulp van de ML.NET-API.