Gegevenstransformatie: schalen en verminderen

Belangrijk

De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.

Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.

De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.

In dit artikel worden de modules in Machine Learning Studio (klassiek) beschreven die u kunnen helpen bij het werken met numerieke gegevens. Veelvoorkomende machine learning zijn onder andere het knippen, binningen en normaliseren van numerieke waarden. Andere modules ondersteunen dimensionaliteitsvermindering.

Notitie

Van toepassing op: Machine Learning Studio (klassiek)

Vergelijkbare modules met slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.

Numerieke gegevens modelleren

Taken zoals het normaliseren, binningen of opnieuw distribueren van numerieke variabelen zijn een belangrijk onderdeel van de gegevensvoorbereiding voor machine learning. De modules in deze groep ondersteunen de volgende gegevensvoorbereidingstaken:

  • Gegevens groeperen in opslaglocaties met verschillende grootten of distributies.
  • Uitbijten verwijderen of de waarden wijzigen.
  • Een set numerieke waarden normaliseren in een specifiek bereik.
  • Een compacte set functiekolommen maken op basis van een gegevensset met een hoge dimensie.
  • Selecteer relevante en nuttige functies om te gebruiken bij het bouwen van het model: gebruik de modules Functieselectie of Lineaire discriminantanalyse .
  • Functies selecteren op basis van het aantal waarden: gebruik de module Learning met tellingen.
  • Ontbrekende waarden verwijderen of vervangen: gebruik de module Ontbrekende gegevens ops schonen.
  • Categorische waarden vervangen door numerieke waarden die zijn afgeleid van berekeningen: gebruik de module Discrete waarden vervangen.
  • Een waarschijnlijkheidsverdeling berekenen voor discrete of numerieke kolommen: gebruik de module Waarschijnlijkheidsfunctie evalueren.
  • Digitale signalen en golfvormen filteren en transformeren: gebruik de filtermodule .

Lijst met modules

Deze categorie Gegevenstransformatie - Schalen en verminderen omvat de volgende modules:

Zie ook