Daten Transformation-Filter

In diesem Artikel wird beschrieben, wie Sie die Filtermodule in Azure Machine Learning Studio (klassisch) zum Transformieren digitaler Daten verwenden können. Die Module in dieser Gruppe von Tools für Machine Learning Studio (klassisch) basieren auf Filtern, die für digitale Signal Verarbeitungstechnologien entwickelt wurden.

Hinweis

Gilt für: Machine Learning Studio (klassisch)

Dieser Inhalt bezieht sich nur auf Studio (klassisch). Ähnliche Drag & Drop-Module wurden Azure Machine Learning-Designer hinzugefügt. Weitere Informationen finden Sie in diesem Artikel zum Vergleich der beiden Versionen.

Filter werden in der Regel auf Daten in der Datenverarbeitungs Stufe oder in der Vorverarbeitungs Phase angewendet. Filter verbessern die Klarheit des Signals, das für Machine Learning verwendet wird. Beispielsweise können Sie die Filtermodule in Machine Learning Studio (klassisch) für die folgenden Verarbeitungsaufgaben verwenden:

  • Bereinigen Sie Wellenformen, die für die Spracherkennung verwendet werden.
  • Erkennen von Trends oder Beseitigen von saisonalen Auswirkungen in verrauschten Verkaufs- oder Wirtschaftsdaten.
  • Analysieren von Mustern oder Artefakten in telemetriesignalen.

Diese Module bieten eine einfache Konfiguration von Filtern, indem Sie gut recherchierte Algorithmen verwenden, um Wellenform-Daten mathematisch zu transformieren. Sie können auch einen benutzerdefinierten Filter erstellen, wenn Sie bereits die richtigen Koeffizienten zur Anwendung auf Ihre Daten ermittelt haben.

Wenn Sie Aufgaben wie das Ausschließen von Daten aus einem DataSet zeilenweise durchführen müssen, indem Sie fehlende Werte entfernen oder die Größe eines Datasets verringern, verwenden Sie stattdessen die folgenden Module:

  • Fehlende Daten bereinigen: Entfernen Sie fehlende Werte, oder ersetzen Sie fehlende Werte durch Platzhalter.
  • Partition und Sample: Teilen oder Filtern Sie das DataSet mithilfe von Kriterien wie einem Datumsbereich, einem bestimmten Wert oder regulären Ausdrücken.
  • Clip Werte: Legen Sie einen Wertebereich fest, und behalten Sie nur die Werte in diesem Bereich bei.

Filter bei der digitalen Signalverarbeitung

Ebenso wie Sie einen Filter an eine Kamera anfügen können, um die Beleuchtung zu kompensieren oder besondere Effekte zu erzeugen, können Sie einen Filter auf die Daten anwenden, die Sie für Machine Learning verwenden. Filter können dabei helfen, die Klarheit eines Signals zu verbessern, interessante Merkmale zu erfassen oder das Rauschen zu verringern.

Der ideale Filter würde alle Geräusche eliminieren und eine einheitliche Empfindlichkeit für das gewünschte Signal aufweisen. Das Entwerfen eines ganz guten Filters kann jedoch viele Iterationen oder Kombinationen von Verfahren erfordern. Wenn Sie einen effektiven Filter entwerfen möchten, sollten Sie den Filter speichern, damit Sie ihn wieder verwenden können, wenn Sie neue Daten transformieren.

Im Allgemeinen basiert eine Filterung auf den Grundsätzen der Wellenformanalyse. Wenn Sie einen Filter entwerfen, suchen Sie nach Möglichkeiten, Teile des Signals zu unterdrücken oder zu verstärken, um zugrunde liegende Trends offenzulegen, Rauschen und Störungen zu reduzieren oder um Datenwerte zu identifizieren, die andernfalls möglicherweise nicht wahrgenommen werden.

Es werden verschiedene Techniken angewendet, um einzelne Trends oder Wellenform Komponenten zu zerlegen, die tatsächliche Datenwerte erstellen. Die Reihe von Werten kann analysiert werden, indem Sie die einzelnen Wellenformen mithilfe von serigonometrischen Funktionen identifizieren und isolieren. (Dies gilt unabhängig davon, ob es sich um eine econometrische Serie oder um die zusammengesetzten Frequenzen von Audiosignalen handelt.) Filter können dann auf diese Wellenformen angewendet werden, um Rauschen zu vermeiden, einige Wellen zu vergrößern oder Ziel Komponenten zu entfernen.

Wenn Filter auf eine verrauschte Reihe angewendet werden, um verschiedene Komponenten zu isolieren, können Sie angeben, welche Frequenzen entfernt oder verstärkt werden sollen, indem Sie das Frequenzband angeben, mit dem gearbeitet werden soll:

Digitale Filter in Machine Learning Studio (klassisch)

Die folgenden Filtertypen werden in Machine Learning Studio (klassisch) unterstützt:

  • Filter auf der Grundlage von Wellenform-Zerlegung. Beispiele hierfür sind die FIR-Filter (Finite Impulse Response) und IIR-Filter (Infinite Impulse Response). Diese Filter funktionieren, indem Sie bestimmte Komponenten aus einer Gesamt Reihe entfernen. Anschließend können Sie das vereinfachte Waveform anzeigen und untersuchen.
  • Filter auf Basis gleitender Mittelwerte oder Medianwerte. Diese Filter glätten Variationen in einer Datenreihe, indem sie über Zeitfenster mitteln. Die Zeitfenster können fest oder gleitend sein, außerdem kann Ihre Form variieren. Ein dreieckiges Fenster hat z. B. ein Maximum beim aktuellen Datenpunkt (gewichtet den aktuellen Wert stärker) und schwächt sich vor und nach dem Datenpunkt ab (gewichtet vorausgehende und folgende Werte geringer).
  • Benutzerdefinierte oder angepasste Filter. Wenn Sie die Transformationen bereits kennen, die auf eine Datenreihe angewendet werden sollen, können Sie einen benutzerdefinierten Filter erstellen. Sie stellen die numerischen Koeffizienten bereit, die zum Transformieren der Datenreihe verwendet werden. Ein benutzerdefinierter Filter kann einen FIR-oder IIR-Filter emulieren. Mit einem benutzerdefinierten Filter haben Sie jedoch mehr Kontrolle über die Werte, die an jedem Punkt in der Reihe angewendet werden sollen.

Filter Terminologie

Die folgende Liste enthält einfache Definitionen von Begriffen, die in den Parametern und Eigenschaften von Filtern verwendet werden:

  • Passband: der Bereich der Häufigkeiten, der einen Filter passieren kann, ohne gedämpft oder abgeschwächt zu werden.
  • Stopband: ein Bereich von Frequenzen zwischen angegebenen Grenzen, durch die Signale nicht übermittelt werden. Sie definieren ein Sperrband, indem Sie Grenzfrequenzen festlegen.
  • High-Pass: nur hohe Frequenzen überlassen.
  • Niedriger Durchlauf: nur Frequenzen unterhalb eines angegebenen Ausschneide Werts werden akzeptiert.
  • Corner: definiert die Grenze zwischen der Sperrband-und der passband-Frequenz. In der Regel können Sie entscheiden, ob die Eckfrequenz in das Band ein- oder davon ausgeschlossen ist. Ein Filter für die erste Reihenfolge bewirkt eine allmähliche Dämpfung bis hin zur Eckfrequenz. Danach verursacht der Filter exponentielle Dämpfung. Filter höherer Ordnung (z. b. Butterworth-und Chebyshev-Filter) haben nach der Eckfrequenz steile Steigungen. Filter höherer Ordnung dämpfen die Werte im Sperrband erheblich schneller und vollständig.
  • Band Stopp Filter (auch als Band Ablehnungs Filter oder Kerb Filter bezeichnet): hat nur ein stopband. Sie definieren das Sperrband, indem Sie zwei Häufigkeiten angeben: die hohe Ausschneide Häufigkeit und die niedrige kürzerungfrequenz. Ein Band Pass -Filter verfügt in der Regel über zwei Stopp Bänder: einen auf beiden Seiten der gewünschten Komponente.
  • Ripple: eine kleine, unerwünschte Abweichung, die periodisch auftritt. In Machine Learning können Sie die Menge an Ripple angeben, die als Teil der Parameter im IIR-Filter Design toleriert werden soll.

Tipp

Benötigen Sie weitere Informationen? Wenn Sie mit der digitalen Signalverarbeitung noch nicht vertraut sind, finden Sie unter Einführung in die digitale SignalverarbeitungWeitere Informationen. Die Website bietet Definitionen und hilfreiche visuelle Hilfsmittel, die grundlegende Terminologie und Konzepte erläutern.

Liste der Module

Die folgenden Module sind in der Kategorie " Data Transformation-Filter " enthalten:

  • Apply Filter: wendet einen Filter auf angegebene Spalten eines Datasets an.
  • FIR-Filter: erstellt einen FIR-Filter für die Signalverarbeitung.
  • IIR-Filter: erstellt einen IIR-Filter für die Signalverarbeitung.
  • Median Filter: erstellt einen Median Filter, der verwendet wird, um Daten für die Trendanalyse zu glätten.
  • Filter für den Gleit enden Durchschnitt: erstellt einen Filter für den gleitenden Durchschnitt, mit dem Daten für Trendanalysen
  • Schwellenwert Filter: erstellt einen Schwellenwert Filter, der Werte einschränkt.
  • Benutzerdefinierter Filter: erstellt einen benutzerdefinierten FIR-oder IIR-Filter.

Weitere Informationen