Zeitreihendaten

Data Explorer
HDInsight
IoT Hub
Power BI

Bei Zeitreihendaten handelt es sich um eine nach Zeit strukturierte Gruppe von Werten. Zeitliche Reihenfolge, eine wichtige Eigenschaft von Zeitreihendaten, organisiert Ereignisse in der Reihenfolge, in der sie auftreten und zur Verarbeitung gelangen.

Wählen Sie eine Zeitreihenlösung für Daten aus, deren strategischer Wert sich auf Änderungen in einem Asset oder Prozess im Laufe der Zeit konzentriert. Sie können Zeitreihendaten verwenden, um Rückwärts- und Messänderungen anzuzeigen oder zukünftige Änderungen vorauszusehen und vorherzusagen. Zeitreihendaten werden in der Regel in chronologischer Reihenfolge eingetroffen, in der Regel in einen Datenspeicher eingefügt und selten (wenn überhaupt) aktualisiert werden. Im Gegensatz dazu akzeptieren Standarddatenpipelinen für die Onlinetransaktion (OLTP) Daten in beliebiger Reihenfolge und können jederzeit aktualisiert werden.

Zeitreihendaten verfügen über Zeitstempel und Zeit ist eine aussagekräftige Achse zum Anzeigen oder Analysieren der Daten. Zeitreihendaten lassen sich am besten mit einem Punkt- oder Liniendiagramm visualisieren.

Screenshot showing time series data visualized in a line chart.

Aufbau

Screenshot showing typical time series data flow.

Datenfluss

Viele zeitreihenbasierte Systeme, z. B. Internet of Things (IoT)-Szenarien, erfassen Daten in Echtzeit mithilfe einer Echtzeitverarbeitungsarchitektur.

  1. Azure IoT Hub, Azure Event Hubs oder Kafka auf HDInsight erfasst Daten aus einer oder mehreren Datenquellen in die Datenverarbeitungsschicht.
  2. Die Streamverarbeitungsebene verarbeitet die Daten und kann sie für Vorhersageanalysen an einen Machine Learning-Dienst weitergegeben.
  3. Ein analytischer Datenspeicher wie Azure Data Explorer, HBase, Azure Cosmos DB oder Azure Data Lake speichert die verarbeiteten Daten.
  4. Zur Analyse können die Zeitreihendaten mit einer Analyse- und Berichtsanwendung oder einem entsprechenden Dienst angezeigt werden. Beispiele wären etwa Power BI und OpenTSDB für HBase.

Komponenten

Weitere Informationen zu den Komponenten einer Zeitreihenarchitektur finden Sie in den folgenden Artikeln:

Alternativen

Sie können Azure Data Explorer verwenden, um einen Zeitreihendienst zu entwickeln. Azure Data Explorer umfasst native Unterstützung für die Erstellung, Bearbeitung und Analyse mehrerer Zeitreihen mit Überwachung in nahezu Echtzeit.

Azure Data Explorer kann Daten aus vielen Diensten und Plattformen in vielen Formaten erfassen. Weitere Informationen finden Sie unter Von Azure Data Explorer für die Erfassung unterstützter Datenformate. Die Erfassung ist skalierbar, und es gibt keine Grenzen.

Über die Webbenutzeroberfläche von Azure Data Explorer können Sie Abfragen ausführen und Dashboards zur Datenvisualisierung erstellen. Azure Data Explorer kann auch in Dashboarddienste integriert werden, darunter Power BI, Grafana und andere Tools zur Datenvisualisierung, die ODBC- und JDBC-Connectors verwenden. Weitere Informationen finden Sie unter Datenvisualisierung mit Azure Data Explorer.

Anwendungsfälle

  • Sie können Zeitreiheninformationen analysieren, um aktuelle Daten mit historischen Daten zu vergleichen, Anomalien zu erkennen und Echtzeitbenachrichtigungen zu generieren oder historische Trends zu visualisieren.

  • Die Zeitreihenanalyse eignet sich auch gut für die Prädiktivmodellierung und die Prognose von Ergebnissen. Sie können historische Änderungsdatensätze auf viele Prognosemodelle anwenden.

  • IoT-Daten eignen sich bestens für die Speicherung und Analyse von Zeitreihendaten. Eingehende IoT-Daten werden eingefügt und selten aktualisiert (wenn überhaupt). Die Daten werden zeitgestempelt, in die empfangene Reihenfolge eingefügt und in der Regel in chronologischer Reihenfolge angezeigt. Sie können nach hinten suchen, um Anomalien zu erkennen und Trends zu entdecken oder die Daten für die Vorhersageanalyse zu verwenden.

Spezifische Beispiele für Zeitreihendaten umfassen:

  • Im Zeitverlauf erfasste Aktienkurse zur Erkennung von Trends
  • Serverleistung wie CPU-Auslastung, E/A-Last, Arbeitsspeicherauslastung und Auslastung der Netzwerkbandbreite im Laufe der Zeit.
  • Telemetriedaten von Sensoren an Industriemaschinen können einen bevorstehenden Ausfall anzeigen und Warnbenachrichtigungen auslösen.
  • Echtzeit-Fahrzeugdaten wie Geschwindigkeit, Bremsen und Beschleunigen, die über einen bestimmen Zeitraum gesammelt werden, um eine aggregierte Risikobewertung für den Fahrer zu erzeugen.

In jedem dieser Fälle ist die Zeit eine aussagekräftige Achse.

Überlegungen

Im Folgenden finden Sie einige der Vorteile der Zeitreihenlösungen:

  • Eindeutige Darstellung der Veränderungen einer Ressource oder eines Prozesses im Zeitverlauf.
  • Helfen Ihnen schnell, Änderungen an mehreren verwandten Quellen zu erkennen, sodass Anomalien und neue Trends leicht identifiziert werden können.
  • Gut geeignet für Vorhersagemodelle und Prognosen.

Hier finden Sie einige der Herausforderungen für Zeitreihenlösungen:

  • Zeitreihendaten sind oftmals zeitkritisch und müssen zeitnah verarbeitet werden, um Echtzeittrends erkennen zu können oder Warnungen zu generieren. Verzögerungen können Ausfallzeiten und Geschäftliche Auswirkungen verursachen.
  • Es gibt oft einen Bedarf, Daten aus verschiedenen Sensoren und anderen Quellen zu korrelieren, wodurch die Komplexität erhöht wird.
  • Zeitreihendaten sind häufig umfangreich. Das gilt besonders in IoT-Szenarien. Die Speicherung, Indizierung, Abfrage, Analyse und Visualisierung von umfangreichen Datenvolumen kann sich als Herausforderung erweisen.
  • Es kann schwierig sein, die richtige Kombination aus Hochgeschwindigkeitsspeicher und leistungsstarkem Computing für Echtzeitanalysen zu finden und gleichzeitig die Markteinführungszeit und die Gesamtkosten für Investitionen zu minimieren.
  • Eine Datenstromverarbeitungsschicht, die alle eingehenden Daten in Echtzeit mit hoher Genauigkeit und hoher Granularität verarbeiten kann, ist nicht immer möglich. Möglicherweise müssen Sie einige Genauigkeit opfern, indem Sie Daten reduzieren.
    • Sie können Daten reduzieren, indem Sie Gleitzeitfenster wie mehrere Sekunden verarbeiten, um es der Verarbeitungsschichtzeit zu ermöglichen, Berechnungen durchzuführen.
    • Bei der Darstellung größerer Zeiträume können Sie auch ein Downsampling oder eine Aggregation der Daten durchführen – etwa beim Zoomen der Ansicht, um die erfassten Daten mehrerer Monate anzuzeigen.

Beitragende

Dieser Artikel wird von Microsoft gepflegt. Er wurde ursprünglich von folgenden Mitwirkenden geschrieben:

Hauptautor:

Nächste Schritte