Data Transformation

Viktigt

Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.

Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.

Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.

Den här artikeln listar de moduler som finns i Machine Learning Studio (klassisk) för datatransformering. För maskininlärning medför datatransformering vissa mycket allmänna uppgifter, till exempel att koppla datauppsättningar eller ändra kolumnnamn. Men den innehåller också många uppgifter som är specifika för maskininlärning, till exempel normalisering, gruppering och gruppering samt slutsatsledning av saknade värden.

Anteckning

Gäller endast för: Machine Learning Studio (klassisk)

Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.

Viktigt

Data som du använder i Machine Learning Studio (klassisk) förväntas vanligtvis vara "snyggt" innan du importerar dem till Machine Learning Studio (klassisk). Förberedelse av data kan till exempel omfatta att säkerställa att data använder rätt kodning och kontrollera att data har ett konsekvent schema.

Moduler för datatransformering är grupperade i följande uppgiftsbaserade kategorier:

  • Skapa filter för digital signalbearbetning: Digitala signalfilter kan tillämpas på numeriska data för att stödja maskininlärningsuppgifter som bildigenkänning, röstigenkänning och vågformsanalys.
  • Generera och använda antalsbaserade funktioner: Count-based featurization modules (Antalsbaserade funktioner) hjälper dig att utveckla kompakta funktioner som kan användas i maskininlärning.
  • Allmän datamanipulering och förberedelse: Sammanfoga datauppsättningar, rensa saknade värden, gruppera och sammanfatta data, ändra kolumnnamn och datatyper eller ange vilken kolumn som är en etikett eller en funktion.
  • Sampling och delning av datauppsättningar: Dela upp dina data i tränings- och testuppsättningar, dela upp datauppsättningar i procent eller med ett filtervillkor eller utför sampling.
  • Skala och minska data: Förbered numeriska data för analys genom att tillämpa normalisering eller skalning. Gruppera data i grupper, ta bort eller ersätt avvikande värden eller utför huvudkomponentanalys (PCA).

Lista över moduler

Följande modulkategorier ingår i kategorin Datatransformering :

Se även