Machine Learning-Train

In dit artikel worden de modules beschreven die worden vermeld in Azure Machine Learning Studio (klassiek) voor het trainen van een machine learning model. Training is het proces van het analyseren van invoer gegevens met behulp van de para meters van een vooraf gedefinieerd model. Vanuit deze analyse leert het model de patronen en slaat ze op in de vorm van een getraind model.

Notitie

Van toepassing op : machine learning Studio (klassiek)

Deze inhoud is alleen van toepassing op Studio (klassiek). Er zijn Vergelijk bare modules voor slepen en neerzetten toegevoegd aan Azure Machine Learning Designer. In dit artikel vindt u meer informatie over de twee versies.

In dit artikel wordt ook het algehele proces in Machine Learning Studio (klassiek) beschreven voor het maken van modellen, training, evaluatie en scores.

machine learning modellen maken en gebruiken

De gebruikelijke werk stroom voor machine learning omvat de volgende fasen:

  • Een geschikt algoritme kiezen en de eerste opties instellen.
  • Train het model op compatibele gegevens.
  • Het maken van voor spellingen door nieuwe gegevens te gebruiken, op basis van de patronen in het model.
  • Het model evalueren om te bepalen of de voor spellingen nauw keurig zijn, hoeveel fout er is en als er sprake is van een overmontage.

Machine Learning Studio (klassiek) ondersteunt een flexibel, aanpasbaar Framework voor machine learning. Elke taak in dit proces wordt uitgevoerd door een specifiek type module, dat kan worden gewijzigd, toegevoegd of verwijderd, zonder de rest van uw experiment te verbreken.

De modules in deze categorie ondersteunen training voor verschillende soorten modellen. Tijdens de training worden de gegevens geanalyseerd op basis van het algoritme van de machine learning. Dit algoritme analyseert de distributie en het type van de gegevens, compileert statistieken en maakt patronen die later kunnen worden gebruikt voor voor spellingen.

Meer informatie over model training

Wanneer Machine Learning een model traint, worden rijen met ontbrekende waarden overgeslagen. Daarom kunt u, als u de waarden hand matig wilt corrigeren, toerekening gebruiken of een andere methode voor het verwerken van ontbrekende waarden opgeven, de module clean Missing Data gebruiken vóór de training van de gegevensset.

U wordt aangeraden de module meta gegevens bewerken te gebruiken om andere problemen met de gegevens op te lossen. Mogelijk moet u de kolom Label markeren, gegevens typen wijzigen of de kolom namen corrigeren.

Zie de categorie gegevens transformatie voor andere algemene taken voor gegevens opschoning, zoals normalisatie, steek proeven, binning en schalen.

Kies de juiste trainer

De methode die u gebruikt voor het trainen van een model is afhankelijk van het type model dat u maakt, en het type gegevens dat het model vereist. Machine Learning biedt bijvoorbeeld modules specifiek voor het trainen van anomalie detectie modellen, aanbevelings modellen en nog veel meer.

Controleer de lijst met trainings modules om te bepalen welke naam juist is voor uw scenario.

Als u niet zeker weet welke para meters u moet gebruiken bij het trainen van een model, gebruikt u een van de modules die worden gebruikt voor het opruimen van de para meters en validatie:

  • Het afstemmen van het model Hyper parameters kan een parameter opruiming uitvoeren op bijna alle classificatie-en regressie modellen. Het traint meerdere modellen en retourneert vervolgens het beste model.

  • De clustering -module sweep ondersteunt model afstemming tijdens het trainings proces en is uitsluitend bedoeld voor gebruik met cluster modellen. U kunt een bereik van centroids opgeven en de gegevens trainen terwijl automatisch de beste para meters worden gedetecteerd.

  • De module voor het valideren van een model is ook nuttig voor model optimalisatie, maar retourneert geen getraind model. In plaats daarvan worden metrische gegevens gegeven die u kunt gebruiken om het beste model te bepalen.

Modellen opnieuw trainen

Als u een productie model opnieuw wilt trainen, kunt u het experiment op elk gewenst moment opnieuw uitvoeren.

U kunt het proces voor opnieuw trainen ook automatiseren met webservices. Zie Azure machine learning modellen opnieuw trainen en bijwerken met Azure Data Factoryvoor een overzicht.

Voortrainde modellen gebruiken

Machine Learning bevat een aantal modellen die zijn voor het voortrainen, zoals de indelings module voor getrainde trapsgewijze installatie kopieën . U kunt deze modellen gebruiken om te scoren zonder extra gegevens invoer.

Daarnaast genereren sommige modules (zoals afwijkings detectie van de tijd reeks) geen getraind model in de iLearner-indeling. Maar ze maken ook gebruik van een intern model, dat vervolgens kan worden gebruikt voor het maken van voor spellingen. Als u deze wilt gebruiken, moet u de para meters configureren en gegevens opgeven.

Een moment opname van een getraind model opslaan

Als u het model wilt opslaan of exporteren, klikt u met de rechter muisknop op de module training en selecteert u Opslaan als getraind model. Het model wordt geëxporteerd naar de iLearner-indeling en opgeslagen in uw werk ruimte, onder getrainde modellen. Getrainde modellen kunnen opnieuw worden gebruikt in andere experimenten of worden verbonden met andere modules voor het scoren.

U kunt ook de module getrainde model laden in een experiment gebruiken om een opgeslagen model op te halen.

Lijst met modules

De categorie trein omvat deze modules:

Sommige modules bevinden zich niet in deze categorie, omdat ze een speciale indeling nodig hebben of zijn aangepast voor een specifieke taak:

Zie ook