Data Transformation

Den här artikeln innehåller de moduler som finns i Azure Machine Learning Studio (klassisk) för data omvandling. För Machine Learning finns det några generella uppgifter i data omvandlingen , till exempel att koppla data uppsättningar eller ändra kolumn namn. Men det innehåller också många uppgifter som är speciella för Machine Learning, till exempel normalisering, diskretisering och gruppering och härledning av saknade värden.

Anteckning

Gäller för: Machine Learning Studio (klassisk)

Det här innehållet gäller endast Studio (klassisk). Liknande dra och släpp-moduler har lagts till i Azure Machine Learning designer. Läs mer i den här artikeln om att jämföra de två versionerna.

Viktigt

Data som du använder i Machine Learning Studio (klassisk) förväntas normalt vara "städa" innan du importerar den till Machine Learning Studio (klassisk). Förberedelse av data kan t. ex. se till att data använder rätt kodning och kontrollerar att data har ett konsekvent schema.

Du kan använda Azure Machine Learning Workbench för att transformera och förbereda alla typer av data. Exempel finns i data transformationer "i Machine Learning Workbench.

Moduler för datatransformering grupperas i följande uppgiftsbaserade kategorier:

  • Skapa filter för digital signal bearbetning: digitala signal filter kan tillämpas på numeriska data för att stödja Machine Learning-uppgifter, till exempel bild igenkänning, röst igenkänning och våg analys.
  • Skapa och använda Count-baserade funktioner: Count-based funktionalisering-moduler hjälper dig att utveckla komprimerade funktioner som du kan använda i Machine Learning.
  • Allmän data behandling och förberedelse: sammanfoga data uppsättningar, rensa saknade värden, gruppera och sammanfatta data, ändra kolumn namn och data typer eller ange vilken kolumn som är en etikett eller funktion.
  • Sampling och delning av data uppsättningar: dela upp data i utbildning och test uppsättningar, dela data uppsättningar med procent eller av ett filter villkor eller utför sampling.
  • Skala och minska data: Förbered numeriska data för analys genom att tillämpa normalisering eller genom skalning. Lager plats data till grupper, ta bort eller Ersätt avvikare eller utföra huvud komponent analys (PCA).

Lista över moduler

Följande modul kategorier ingår i kategorin data omvandling :

Se även