Aplicar Filtro

Aplica um filtro para as colunas especificadas de um conjunto de dados

Categoria: transformação/filtro de dados

Observação

Aplica-se a: Machine Learning Studio (clássico)

Esse conteúdo pertence apenas ao estúdio (clássico). Módulos de arrastar e soltar semelhantes foram adicionados ao designer de Azure Machine Learning. Saiba mais neste artigo comparando as duas versões.

Visão geral do módulo

Este artigo descries como usar o módulo aplicar filtro no Azure Machine Learning Studio (clássico) para transformar uma coluna de valores aplicando um filtro previamente definido. Os filtros são usados no processamento de sinal digital para reduzir o ruído ou realçar um padrão. Assim, os valores que você transforma são sempre numéricos e normalmente representam algum tipo de áudio ou sinal visual.

Dica

Você está procurando um tipo diferente de filtro? O Studio (clássico) fornece esses módulos para dados de amostragem, obtenção de um subconjunto de dados, remoção de valores inválidos ou criação de conjuntos de teste e treinamento: dividir dados, limpar dados ausentes, partição e exemplo, aplicar transformação SQL, valores de clipe. Se você precisar filtrar os dados ao lê-los de uma fonte, consulte importar dados. As opções dependem do tipo de origem.

Depois de determinar qual tipo de filtro é melhor para sua fonte de dados, você deve especificar os parâmetros e usar aplicar filtro para transformar o DataSet. Como o design de filtros é separado do processo de aplicação de um filtro, os filtros são reutilizáveis. Por exemplo, se você trabalha frequentemente com dados usados para previsão, pode criar vários tipos de filtros de média de movimento para treinar e comparar vários modelos. Você também pode salvar o filtro para aplicar a outros experimentos ou a diferentes conjuntos de valores.

Como configurar aplicar filtro

  1. Adicione o módulo aplicar filtro ao seu experimento. Você pode encontrar o módulo Filtro IIR em transformação de dados, na categoria filtros .

  2. Para a entrada à direita, conecte um conjunto de dados que contém valores numéricos a uma entrada.

  3. Para a entrada à esquerda, conecte um filtro existente. Você pode reutilizar um filtro salvo ou pode configurar um filtro usando um dos seguintes módulos de filtro: filtro de limite, filtro de média de movimentação, filtro mediano, filtro de IIR, filtro fir, filtro definido pelo usuário.

  4. No painel Propriedades de aplicar filtro, clique em Iniciar seletor de coluna e escolha as colunas às quais o filtro deve ser aplicado.

  5. Execute o experimento ou clique com o botão direito do mouse em aplicar filtro e clique em executar selecionado.

Resultados

A saída contém apenas os dados nas colunas selecionadas, transformados pela aplicação da transformação matemática predefinida especificada.

Se você quiser ver outras colunas no conjunto de linhas, você pode usar o módulo adicionar colunas para mesclar os conjuntos de valores originais e filtrados.

Observação

Os valores na coluna original não foram excluídos ou substituídos e ainda estão disponíveis no experimento para referência. No entanto, a saída do filtro geralmente é mais útil para modelagem.

Exemplos

Para obter exemplos de como os filtros são usados no aprendizado de máquina, consulte o Galeria de ia do Azure:

  • Filtros: demonstra todos os tipos de filtro, usando um conjunto de forma de forma de onda com engenharia.

Observações técnicas

Esta seção contém detalhes de implementação, dicas e respostas para perguntas frequentes.

  • O módulo aplicar filtro associa o tipo de filtro especificado às colunas selecionadas. Se você precisar aplicar diferentes tipos de filtros a colunas diferentes, deverá usar selecionar colunas no conjunto de linhas para isolar as colunas e aplicar diferentes tipos de filtro em fluxos de trabalho separados. Para obter mais informações, consulte selecionar colunas no conjuntode dados.

  • Os filtros não passam por colunas de dados que não são afetadas pelo filtro. Ou seja, a saída de Aplicar Filtro contém apenas os valores numéricos transformados. No entanto, você pode usar o módulo adicionar colunas para unir valores transformados com o conjunto de fonte de origem.

Períodos de filtro

O período de filtro é determinado em parte pelo tipo de filtro, da seguinte maneira:

  • Para resposta de impulso finito (FIR), filtros de média móvel simples e média móvel triangular, o período de filtro é finito.

  • Para resposta de impulso infinito (IIR), filtros de média móvel exponencial e média móvel cumulativa, o período de filtro é infinito.

  • Para filtros de limite, o período do filtro é sempre 1.

  • Para filtros de valor mediano, independentemente do período do filtro, NaNs e valores ausentes no sinal de entrada não produzem novos NaNs na saída.

Valores ausentes

Esta seção descreve o comportamento quando valores ausentes são encontrados, por tipo de filtro. Em geral, quando um filtro encontra um NaN ou um valor ausente no conjunto de dados de entrada, o conjunto de dados de saída torna-se danificado com NaNs para algum próximo número de amostras, dependendo do período do filtro. Isso tem as seguintes consequências:

  • Os filtros FIR, média móvel simples ou média móvel triangular têm um período finito. Como resultado, qualquer valor ausente será seguido por um número de NaNs igual à ordem do filtro menos um.

  • Os filtros IIR, média de movimentação exponencial ou média de movimentação cumulativa têm um período infinito. Como resultado, depois que o primeiro valor ausente for encontrado, o NaNs continuará a se propagar indefinidamente.

  • Em um filtro de limite, o período de um filtro de limite é 1. Como resultado, os valores ausentes e NaNs não se propagam.

  • Para filtros de valor mediano, os NaNs e valores ausentes encontrados no conjunto de dados de entrada não produzem novos NaNs na saída, independentemente do período do filtro.

Entradas esperadas

Nome Tipo DESCRIÇÃO
Filtrar Interface IFilter Implementação do filtro
Conjunto de dados Tabela de Dados Conjunto de dados de entrada

Para obter uma lista de erros específicos para módulos do Studio (clássicos), consulte Machine Learning códigos de erro.

Para obter uma lista de exceções de API, consulte Machine Learning códigos de erro da API REST.

Parâmetros do módulo

Nome Intervalo Type Padrão Descrição
Conjunto de colunas Qualquer ColumnSelection NumericAll Selecione as colunas a serem filtradas

Saída

Nome Tipo Descrição
Conjunto de dados de resultados Tabela de Dados Conjunto de dados de saída

Confira também

Sem
Lista de Módulo A-Z