Moving Average Filter

Erstellt einen gleitenden Durchschnittsfilter zum Glätten von Daten für Trendanalysen

Kategorie: Daten Transformation/-Filter

Hinweis

Gilt für: Machine Learning Studio (klassisch)

Dieser Inhalt bezieht sich nur auf Studio (klassisch). Ähnliche Drag & Drop-Module wurden Azure Machine Learning-Designer hinzugefügt. Weitere Informationen finden Sie in diesem Artikel zum Vergleich der beiden Versionen.

Modulübersicht

In diesem Artikel wird beschrieben, wie Sie das Modul Moving Average Filter in Azure Machine Learning Studio (klassisch) verwenden, um eine Reihe von einseitigen oder zweiseitigen durchschnitten für ein DataSet zu berechnen, indem Sie eine von Ihnen angegebene Fensterlänge verwenden.

Nachdem Sie einen Filter definiert haben, der Ihre Anforderungen erfüllt, können Sie ihn auf ausgewählte Spalten in einem Dataset anwenden, indem Sie ihn mit dem Modul Apply Filter verbinden. Das Modul führt alle Berechnungen durch und ersetzt Werte in numerischen Spalten durch den entsprechenden gleitenden Durchschnitt.

Sie können den daraus resultierenden gleitenden Durchschnitt für Grafiken und Visualisierung, als neue Glättungsgrundlage für die Modellierung, für die Berechnung von Abweichungen von den Berechnungen für ähnliche Zeiträume usw. verwenden.

Tipp

Müssen Sie Daten aus einem Dataset filtern oder fehlende Werte entfernen? Verwenden Sie stattdessen die folgenden Module:

  • Fehlende Daten bereinigen: Verwenden Sie dieses Modul, um fehlende Werte zu entfernen oder fehlende Werte durch Platzhalter zu ersetzen.
  • Partition und Sample: Verwenden Sie dieses Modul, um das Dataset nach Kriterien (z. b. einem Datumsbereich, einem bestimmten Wert oder regulären Ausdrücken) aufzuteilen oder zu filtern.
  • Clip Werte: Verwenden Sie dieses Modul, um einen Bereich festzulegen, und behalten Sie nur die Werte in diesem Bereich.

Verstehen und Verwenden von gleitenden Durchschnitten

Dieser Typ des Durchschnittswerts hilft Ihnen, hilfreiche Zeitmuster für Retrospektive und Echtzeitdaten zu entwickeln und zu prognostizieren. Die einfachste Art des gleitenden Durchschnitts beginnt bei der Stichprobe von Reihen und verwendet den Durchschnittswert dieser Position sowie die vorherigen n Positionen anstelle des tatsächlichen Werts. (Sie können n wie gewünscht definieren.) Der längere Zeitraum n, über den der Durchschnitt berechnet wird, desto geringer ist die Differenz zwischen den Werten. Wenn Sie die Anzahl der verwendeten Werte erhöhen, wirkt sich der einzelne Wert weniger stark auf den resultierenden Durchschnittswert aus.

Ein gleitender Durchschnitt kann einseitig oder zweiseitig sein. Bei einem einseitigen Durchschnitt werden nur die Werte vor dem Indexwert verwendet. Bei einem zweiseitigen Durchschnitt werden Werte aus der Vergangenheit und der Zukunft verwendet.

Für Szenarien, in denen Streamingdaten gelesen werden, sind kumulative und gewichtete gleitende Durchschnittswerte besonders nützlich. Ein kumulativer gleitender Durchschnittswert berücksichtigt die Punkte, die vor dem aktuellen Zeitraum liegen.

Sie können bei der Berechnung des Durchschnitts eine gleichmäßige Gewichtung für alle Datenpunkte festlegen, oder festlegen, dass Werte, die näher an dem aktuellen Datenpunkt liegen, stärker gewichtet werden. In einem gewichteten gleitenden Durchschnitt muss die Summe aller Gewichtungen 1 betragen.

In einem exponentiellen gleitenden Durchschnitt müssen die Durchschnittswerte aus einem Anfangs- und Endwert bestehen, die gewichtet werden können Ein leicht gewichteter Endwert bedeutet, dass der Endwert nah am Anfangswert liegt, sodass der Durchschnittswert ein ähnliches Verhalten wie ein gleitender Durchschnitt mit einem kurzen Gewichtungszeitraum aufweist. Bei stärkeren Endwertgewichtungen verhält sich der Durchschnittswert eher wie ein längerer einfacher gleitender Durchschnitt.

Konfigurieren des Filters für den gleitenden Durchschnitt

  1. Fügen Sie dem Experiment das Filter Modul für den Gleit enden Durchschnitt hinzu. Sie finden dieses Modul unter Daten Transformation in der Kategorie Filter .

  2. Geben Sie für Länge einen positiven ganzzahligen Wert ein, der die Gesamtgröße des Fensters definiert, in dem der Filter angewendet wird. Dies wird auch als Filter Maske bezeichnet. Bei einem gleitenden Durchschnitt bestimmt die Länge des Filters, wie viele Werte im gleitenden Fenster liegen.

    Längere Filter werden auch als Filter höherer Ordnung bezeichnet und bieten ein größeres Berechnungs Fenster und eine genauere Näherung der Trendlinie.

    Kürzere oder niedrigere Reihen folgen Filter verwenden ein kleineres Berechnungs Fenster und ähneln den ursprünglichen Daten genauer.

  3. Wählen Sie unter Typ den Typ des gleitenden Durchschnitts aus, der angewendet werden soll.

    Azure Machine Learning Studio (klassisch) unterstützt die folgenden Typen von gleitenden durchschnittlichen Berechnungen:

    Einfach: ein einfacher gleitender Durchschnitt (SMA) wird als nicht gewichteter paralleler Mittelwert berechnet.

    Dreieckig: dreieckiger Gleitender Durchschnitt (TMA) wird zweimal für eine reibungslosere Trendlinie verwendet. Das Wort "dreieckig" wird von der Form der Gewichtungen abgeleitet, die auf die Daten angewendet werden, die zentrale Werte hervorgehoben.

    Exponentielle einfache Daten: ein exponentieller gleitender Durchschnitt (EMA, gleitender Durchschnitt) verleiht den neuesten Daten mehr Gewicht. Die Gewichtung fällt exponentiell ab.

    Exponentiell: bei einem geänderten exponentiellen gleitenden Durchschnitt wird ein gleitender gleitender Durchschnitt berechnet, bei dem der gleitende Durchschnitt an einem beliebigen Punkt den zuvor berechneten gleitenden Durchschnitt an allen vorangehenden Punkten Diese Methode ergibt eine glattere Trendlinie.

    Kumulativ: bei einem einzelnen Punkt und einem aktuellen gleitenden Durchschnitt berechnet der kumulative gleitende Durchschnitt (CMA) den gleitenden Durchschnitt am aktuellen Punkt.

  4. Fügen Sie das DataSet mit den Werten hinzu, für die Sie einen gleitenden Durchschnitt berechnen möchten, und fügen Sie das Modul Apply Filter hinzu.

    Verbinden Sie den Filter für den Gleit enden Durchschnitt mit der linken Eingabe von Apply Filter, und verbinden Sie das DataSet mit der rechten Eingabe.

  5. Verwenden Sie im Modul Apply Filter die Spaltenauswahl, um anzugeben, auf welche Spalten der Filter angewendet werden soll. Standardmäßig wird die Filter Transformation auf alle numerischen Spalten angewendet. Achten Sie daher darauf, alle Spalten auszuschließen, die nicht über die entsprechenden Daten verfügen.

  6. Führen Sie das Experiment aus.

    Für jede Gruppe von Werten, die durch den Filter length-Parameter definiert werden, wird der aktuelle (oder Index-) Wert durch den Wert des gleitenden Durchschnitts ersetzt.

Beispiele

Beispiele für die Verwendung von Filtern in Machine Learning finden Sie in diesem Experiment in der Azure AI Gallery:

  • Filter: dieses Experiment veranschaulicht alle Filtertypen unter Verwendung eines konstruierten Wellenform Datasets.

Modulparameter

Name Range type Standard BESCHREIBUNG
Länge >=1 Integer 5 Legen Sie die Länge des Fensters für den gleitenden Durchschnitt fest.
Typ Any MovingAverageType Geben Sie den Typ des gleitenden Durchschnitts an, der erstellt werden soll.

Ausgaben

Name Typ BESCHREIBUNG
Filtern IFilter-Schnittstelle Filterimplementierung

Weitere Informationen

Filter
Filter anwenden
A-Z-Modulliste
Zusätzliche Filter Beispiele