Transformação de Dados - Filtro

Este artigo descreve como pode utilizar os módulos de filtro no Azure Machine Learning Studio (clássico) para transformar dados digitais. Os módulos deste grupo de ferramentas para Machine Learning Studio (clássico) são baseados em filtros que foram desenvolvidos para a tecnologia de processamento de sinais digitais.

Nota

Aplica-se a: Machine Learning Studio (clássico)

Este conteúdo diz respeito apenas ao Studio (clássico). Módulos semelhantes de arrasto e queda foram adicionados ao designer de Aprendizagem automática Azure. Saiba mais neste artigo comparando as duas versões.

Os filtros são normalmente aplicados aos dados na fase de processamento de dados ou na fase de pré-processamento. Os filtros aumentam a clareza do sinal que é usado para a aprendizagem automática. Por exemplo, pode utilizar os módulos de filtro no Machine Learning Studio (clássico) para estas tarefas de processamento:

  • Limpe as formas de onda que são usadas para o reconhecimento da fala.
  • Detetar tendências ou remover efeitos sazonais em vendas ruidosas ou dados económicos.
  • Analise padrões ou artefactos em sinais de telemetria.

Estes módulos proporcionam uma configuração fácil de filtros utilizando algoritmos bem pesquisados para transformar matematicamente dados de forma de onda. Também pode criar um filtro personalizado se já tiver determinado os coeficientes corretos para aplicar aos seus dados.

Se precisar de fazer tarefas como excluir dados de um conjunto de dados numa base de linha a linha, remover os valores em falta ou reduzir o tamanho de um conjunto de dados, utilize estes módulos em vez disso:

  • Limpar dados em falta: Remova os valores em falta ou substitua os valores em falta por espaços reservados.
  • Partição e Amostra: Divida ou filtre o seu conjunto de dados utilizando critérios como uma gama de datas, um valor específico ou expressões regulares.
  • Valores do clipe: Desa estale uma gama de valores e mantenha apenas os valores dentro desse intervalo.

Filtros no processamento de sinal digital

Tal como pode anexar um filtro a uma câmara para compensar a iluminação ou criar efeitos especiais, pode aplicar um filtro aos dados que utiliza para a aprendizagem automática. Os filtros podem ajudar a melhorar a clareza de um sinal, capturar características interessantes ou reduzir o ruído.

O filtro ideal eliminaria todo o ruído e teria uma sensibilidade uniforme para o sinal pretendido. Mas, desenhar até mesmo um filtro muito bom pode levar muitas iterações ou combinações de técnicas. Se conseguir conceber um filtro eficaz, considere guardar o filtro para que possa reutilizá-lo quando transformar novos dados.

Em geral, a filtragem baseia-se nos princípios da análise da forma de onda. Ao conceber um filtro, procura formas de suprimir ou amplificar partes do sinal, de expor tendências subjacentes, de reduzir o ruído e a interferência, ou de identificar valores de dados que de outra forma poderiam não ser percebidos.

Várias técnicas são aplicadas para decompor tendências individuais ou componentes de formas de onda que criam valores reais de dados. A série de valores pode ser analisada utilizando funções trigonométricas para identificar e isolar as formas de onda individuais. (Isto é verdade quer se trate de uma série econométrica ou das frequências compostas de sinais áudio.) Os filtros podem então ser aplicados a estas formas de onda para eliminar o ruído, amplificar algumas ondas ou remover componentes direcionados.

Quando a filtragem é aplicada a uma série ruidosa para isolar diferentes componentes, pode especificar quais as frequências a remover ou fortalecer especificando a banda de frequências para trabalhar.

Filtros digitais no Estúdio de Machine Learning (clássico)

Os seguintes tipos de filtros são suportados no Machine Learning Studio (clássico):

  • Filtros baseados na decomposição da forma de onda. Exemplos incluem a resposta por impulso finito (FIR) e os filtros infinitos de resposta por impulso (IIR). Estes filtros funcionam removendo componentes específicos de uma série global. Em seguida, pode ver e investigar a forma de onda simplificada.
  • Filtros baseados em médias móveis ou valores medianos. Estes filtros suavizam as variações numa série de dados, com uma média de janelas de tempo. As janelas podem ser fixas ou deslizantes, e podem ter formas diferentes. Por exemplo, uma janela triangular atinge picos no ponto de dados atual (pondera o valor atual mais forte) e segue-se antes e depois do ponto de dados (pesos anteriores e seguintes valores menos forte).
  • Filtros definidos pelo utilizador ou personalizados. Se já conhece as transformações que devem ser aplicadas a uma série de dados, pode criar um filtro definido pelo utilizador. Fornece os coeficientes numéricos que são aplicados para transformar a série de dados. Um filtro personalizado pode imitar um filtro FIR ou IIR. No entanto, com um filtro personalizado, tem mais controlo sobre os valores a aplicar em cada ponto da série.

Terminologia do filtro

A lista que se segue inclui definições simples de termos que são utilizados nos parâmetros e propriedades dos filtros:

  • Banda de passagem: A gama de frequências que podem passar por um filtro sem ser atenuado ou enfraquecido.
  • Banda de paragem: Uma gama de frequências entre limites especificados através dos quais os sinais não são passados. Define a stopband definindo frequências de corte.
  • Passagem alta: Deixe apenas passar altas frequências.
  • Passe baixo: Aceite apenas frequências abaixo de um valor de corte especificado.
  • Canto: Define o limite entre as frequências de stopband e passband. Normalmente, tem a opção de decidir se o canto está incluído ou excluído da banda. Um filtro de primeira ordem provoca atenuação gradual até à frequência do canto. Depois disso, o filtro causa atenuação exponencial. Os filtros de ordem superior (como os filtros Butterworth e Chebyshev) têm declives mais íngremes após a frequência do canto. Os filtros de ordem superior atenuam os valores da banda de paragem muito mais rapidamente e de forma completa.
  • Filtro bandstop (também chamado de filtro de rejeição de banda ou filtro de entalhe): Tem apenas uma stopband. Define a banda de paragem especificando duas frequências: a frequência de corte elevado e a frequência de corte baixa. Um filtro de bandpass normalmente tem duas bandas de paragem: uma em ambos os lados do componente pretendido.
  • Ondulação: Uma pequena variação indesejada que ocorre periodicamente. Em Machine Learning, pode especificar a quantidade de ondulação a tolerar como parte dos parâmetros no design do filtro IIR.

Dica

Precisa de mais informações? Se é novo no processamento de sinais digitais, consulte Uma Introdução ao Processamento de Sinais Digitais. O site fornece definições e ajudas visuais úteis que explicam terminologia básica e conceitos.

Lista de módulos

Os seguintes módulos estão incluídos na categoria De Transformação de Dados - Filtro:

Ver também