Gegevenstransformatie

In dit artikel vindt u een lijst met de modules die in Azure Machine Learning Studio (klassiek) worden weer gegeven voor gegevens transformatie. Voor machine learning omvat de gegevens transformatie enkele algemene taken, zoals het koppelen van gegevens sets of het wijzigen van kolom namen. Maar bevat ook veel taken die specifiek zijn voor machine learning, zoals normalisatie, binning en groepering, en het afmaken van ontbrekende waarden.

Notitie

Van toepassing op : machine learning Studio (klassiek)

Deze inhoud is alleen van toepassing op Studio (klassiek). Er zijn Vergelijk bare modules voor slepen en neerzetten toegevoegd aan Azure Machine Learning Designer. In dit artikel vindt u meer informatie over de twee versies.

Belangrijk

Gegevens die u in Machine Learning Studio (klassiek) gebruikt, worden doorgaans verwacht als ' opruimen ' voordat u deze importeert in Machine Learning Studio (klassiek). Het voorbereiden van gegevens kan bijvoorbeeld inhouden dat de gegevens de juiste code ring gebruiken en controleren of de gegevens een consistent schema hebben.

U kunt Azure Machine Learning Workbench gebruiken om alle soorten gegevens te transformeren en voor te bereiden. Zie voor voor beelden ' gegevens transformaties ' in machine learning Workbench.

Modules voor gegevens transformatie worden gegroepeerd in de volgende op taak gebaseerde Categorieën:

  • Filters maken voor het verwerken van digitale signalen: filters voor digitale signalen kunnen worden toegepast op numerieke gegevens om machine learning taken zoals afbeeldings herkenning, spraak herkenning en Waveform-analyse te ondersteunen.
  • Het genereren en gebruiken van op tellingen gebaseerde functies: parametrisatie modules op basis van Count helpen u bij het ontwikkelen van compacte functies voor gebruik in machine learning.
  • Algemene gegevensbewerking en-voor bereiding: gegevens sets samen voegen, ontbrekende waarden opschonen en gegevens groeperen en samenvatten, de kolom namen en gegevens typen wijzigen of aangeven welke kolom een label of een functie is.
  • Gegevens sets bemonsteren en opsplitsen: Splits uw data in trainings-en test sets, splits sets op percentage of op basis van een filter voorwaarde, of voer steek proeven uit.
  • Gegevens schalen en beperken: Stel numerieke gegevens voor analyse voor door normalisatie toe te passen of te schalen. Bin-gegevens in groepen, verwijderen of vervangen van uitbijters of Principal-onderdeel analyse (PCA) uitvoeren.

Lijst met modules

De volgende module categorieën zijn opgenomen in de gegevens transformatie categorie:

Zie ook