Transformación de datos: filtro

Importante

El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.

A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.

La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.

En este artículo se describe cómo puede usar los módulos de filtro en Machine Learning Studio (clásico) para transformar datos digitales. Los módulos de este grupo de herramientas para Machine Learning Studio (clásico) se basan en filtros desarrollados para la tecnología de procesamiento de señales digitales.

Nota

Se aplica a: solo Machine Learning Studio (clásico)

Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.

Normalmente, los filtros se aplican a los datos de la fase de procesamiento de datos o a la fase de preprocesamiento. Los filtros mejoran la claridad de la señal que se usa para el aprendizaje automático. Por ejemplo, puede usar los módulos de filtro en Machine Learning Studio (clásico) para estas tareas de procesamiento:

  • Limpie las formas de onda que se usan para el reconocimiento de voz.
  • Detectar tendencias o quitar efectos estacionales en ventas con ruido o datos económicos
  • Analice patrones o artefactos en señales de telemetría.

Estos módulos proporcionan una configuración sencilla de filtros mediante algoritmos bien investigados para transformar matemáticamente los datos de forma de onda. También puede crear un filtro personalizado si ya ha determinado los coeficientes correctos que aplicará a los datos.

Si necesita realizar tareas como excluir datos de un conjunto de datos por fila, quitar los valores que faltan o reducir el tamaño de un conjunto de datos, use estos módulos en su lugar:

  • Limpiar datos que faltan: quite los valores que faltan o reemplace los valores que faltan por marcadores de posición.
  • Partición y ejemplo: divida o filtre el conjunto de datos mediante criterios como un intervalo de fechas, un valor específico o expresiones regulares.
  • Recortar valores: establezca un intervalo de valores y mantenga solo los valores dentro de ese intervalo.

Filtros en el procesamiento de señales digitales

Al igual que puede adjuntar un filtro a una cámara para compensar la iluminación o para crear efectos especiales, puede aplicar un filtro a los datos que usa para el aprendizaje automático. Los filtros pueden ayudar a mejorar la claridad de una señal, capturar características interesantes o reducir el ruido.

El filtro ideal eliminaría todo el ruido y tendría sensibilidad uniforme para la señal deseada. Sin embargo, diseñar incluso un filtro bastante bueno puede tomar muchas iteraciones o combinaciones de técnicas. Si tiene éxito en el diseño de un filtro eficaz, considere la posibilidad de guardar el filtro para que pueda reutilizarlo al transformar nuevos datos.

En general, el filtrado se basa en los principios de análisis de forma de onda. Al diseñar un filtro, busca formas de suprimir o amplificar partes de la señal, exponer tendencias subyacentes, reducir el ruido y la interferencia, o identificar valores de datos que, de lo contrario, podrían no percibirse.

Se aplican varias técnicas para descomponer tendencias individuales o componentes de forma de onda que crean valores de datos reales. La serie de valores se puede analizar mediante funciones trigonométricas para identificar y aislar formas de onda individuales. (Esto es cierto si es una serie econométrica o las frecuencias compuestas de señales de audio). Después, los filtros se pueden aplicar a estas formas de onda para eliminar el ruido, amplificar algunas ondas o quitar componentes dirigidos.

Cuando se aplica un filtro a una serie con ruido para aislar diferentes componentes, puede especificar qué frecuencias quitar o reforzar, indicando la banda de frecuencias con la que trabajar.

Filtros digitales en Machine Learning Studio (clásico)

Los siguientes tipos de filtros se admiten en Machine Learning Studio (clásico):

  • Filtros basados en descomposición de forma de onda. Algunos ejemplos incluyen filtros de respuesta de impulso finito (FIR) e respuesta de impulso infinito (IIR). Estos filtros funcionan quitando componentes específicos de una serie general. A continuación, puede ver e investigar la forma de onda simplificada.
  • Filtros basados en valores de medianas y medias móviles. Estos filtros suavizan las variaciones de una serie de datos calculando el promedio a lo largo de ventanas de tiempo. Las ventanas se pueden fijar o deslizar, y pueden tener distintas formas. Por ejemplo, una ventana triangular tiene un pico en el punto de datos actual (pondera el valor actual más fuerte) y disminuye antes y después del punto de datos (pondera los valores anteriores y posteriores menos intensamente).
  • Filtros definidos por el usuario o personalizados. Si ya conoce las transformaciones que se deben aplicar a una serie de datos, puede crear un filtro definido por el usuario. Proporcione los coeficientes numéricos que se aplican para transformar la serie de datos. Un filtro personalizado puede emular un filtro FIR o IIR. Sin embargo, con un filtro personalizado, tiene más control sobre los valores que se aplicarán en cada punto de la serie.

Terminología de filtro

En la lista siguiente se incluyen definiciones simples de términos que se usan en los parámetros y propiedades de los filtros:

  • Banda de paso: el intervalo de frecuencias que pueden pasar a través de un filtro sin atenuarse o debilitarse.
  • Banda de parada: intervalo de frecuencias entre los límites especificados a través de los cuales no se pasan las señales. El suprime banda se define estableciendo frecuencias de corte.
  • Paso alto: deje que solo se pasen las frecuencias altas.
  • Paso bajo: acepte solo frecuencias por debajo de un valor de corte especificado.
  • Esquina: define el límite entre las frecuencias stopband y passband. Normalmente, tiene la opción de decidir si la esquina se incluye en la banda o se excluye de esta. Un filtro de primer orden provoca atenuación gradual hasta la frecuencia de la esquina. Después, el filtro provoca una atenuación exponencial. Los filtros de orden superior (como los filtros Butterworth y Chebyshev) tienen pendientes más empinadas después de la frecuencia de la esquina. Los filtros de orden superior atenuan los valores de la banda de detención mucho más rápido y totalmente.
  • Filtro bandtop (también denominado filtro de rechazo de banda o filtro de notch ): solo tiene una banda de detención. Para definir la banda de parada, especifique dos frecuencias: la frecuencia de corte alta y la frecuencia de corte baja. Un filtro bandpass normalmente tiene dos bandas de palabras irrelevantes: una en cualquiera de los lados del componente deseado.
  • Ondulado: una pequeña variación no deseada que se produce periódicamente. En Machine Learning, puede especificar la cantidad de ondas que se tolerarán como parte de los parámetros en el diseño del filtro IIR.

Sugerencia

¿Necesita más información? Si no está familiarizado con el procesamiento de señales digitales, consulte Introducción al procesamiento de señales digitales. El sitio web proporciona definiciones y ayudas visuales útiles que explican la terminología y los conceptos básicos.

Lista de módulos

Los módulos siguientes se incluyen en la categoría Transformación de datos : filtro :

  • Aplicar filtro: aplica un filtro a las columnas especificadas de un conjunto de datos.
  • Filtro FIR: crea un filtro FIR para el procesamiento de señales.
  • Filtro IIR: crea un filtro IIR para el procesamiento de señales.
  • Filtro mediana: crea un filtro mediana que se usa para suavizar los datos para el análisis de tendencias.
  • Filtro de media móvil: crea un filtro de media móvil que suaviza los datos para el análisis de tendencias.
  • Filtro de umbral: crea un filtro de umbral que restringe los valores.
  • Filtro definido por el usuario: crea un filtro FIR o IIR personalizado.

Consulta también