Transformação de dados – escala e redução

Este artigo descreve os módulos no Azure Machine Learning Studio (clássico) que podem ajudá-lo a trabalhar com dados numéricos. Para o aprendizado de máquina, as tarefas de dados comuns incluem recorte, compartimentalização e normalização de valores numéricos. Outros módulos dão suporte à redução de dimensionalidade.

Observação

Aplica-se a: Machine Learning Studio (clássico)

Esse conteúdo pertence apenas ao estúdio (clássico). Módulos de arrastar e soltar semelhantes foram adicionados ao designer de Azure Machine Learning. Saiba mais neste artigo comparando as duas versões.

Modelando dados numéricos

Tarefas como normalização, compartimentalização ou redistribuição de variáveis numéricas são uma parte importante da preparação de dados para o aprendizado de máquina. Os módulos neste grupo dão suporte às seguintes tarefas de preparação de dados:

  • Agrupamento de dados em compartimentos de tamanhos ou distribuições variados.
  • Removendo exceções ou alterando seus valores.
  • Normalizar um conjunto de valores numéricos em um intervalo específico.
  • Criando um conjunto compacto de colunas de recursos de um conjunto de um DataSet de alta dimensão.

Lista de módulos

A categoria transformação de dados-escala e redução inclui os seguintes módulos:

Confira também