Soluções de série de tempoTime series solutions

Dados de séries de tempo são um conjunto de valores organizados por hora.Time series data is a set of values organized by time. Exemplos de tempo os dados de série incluir dados de sensores, os preços de ações, clique em transmitir dados e a telemetria da aplicação.Examples of time series data include sensor data, stock prices, click stream data, and application telemetry. Dados de séries de tempo podem ser analisados para as tendências históricas derivadas, alertas em tempo real ou modelagem de previsão.Time series data can be analyzed for historical trends, real-time alerts, or predictive modeling.

Time Series Insights

Os dados de séries de tempo representam a forma como um recurso ou processo muda ao longo do tempo.Time series data represents how an asset or process changes over time. Os dados têm um timestamp, mas mais importante, o tempo é o eixo mais significativo para ver ou analisar os dados.The data has a timestamp, but more importantly, time is the most meaningful axis for viewing or analyzing the data. Dados de séries de tempo normalmente chegam em ordem de tempo e normalmente são tratados como uma inserção em vez de uma atualização para a base de dados.Time series data typically arrives in order of time and is usually treated as an insert rather than an update to your database. Por este motivo, alteração é medida ao longo do tempo, permitindo-lhe ter um aspeto para trás e para prever futuras alterações.Because of this, change is measured over time, enabling you to look backward and to predict future change. Como tal, os dados de séries de tempo melhor são visualizados com gráficos de dispersão ou linha.As such, time series data is best visualized with scatter or line charts.

Dados de séries de tempo visualizados num gráfico de linhas

Alguns exemplos de dados de séries de tempo são:Some examples of time series data are:

  • Preços de ações capturados ao longo do tempo para detetar tendências.Stock prices captured over time to detect trends.
  • Desempenho do servidor, tais como a utilização da CPU, carga de e/s, utilização da memória e consumo de largura de banda de rede.Server performance, such as CPU usage, I/O load, memory usage, and network bandwidth consumption.
  • Telemetria de sensores em equipamentos industriais, o que pode ser utilizado para detetar notificações de alerta falha e o acionador equipamento pendente.Telemetry from sensors on industrial equipment, which can be used to detect pending equipment failure and trigger alert notifications.
  • Classificar dados telemétricos dos automóveis em tempo real incluindo velocidade, braking e aceleração numa janela de tempo para produzir um risco de agregação para o controlador.Real-time car telemetry data including speed, braking, and acceleration over a time window to produce an aggregate risk score for the driver.

Em cada um desses casos, pode ver como o tempo é mais significativo, como um eixo.In each of these cases, you can see how time is most meaningful as an axis. Exibir os eventos na ordem em que chegou é uma característica-chave de dados de séries de tempo, porque existe uma ordem temporal natural.Displaying the events in the order in which they arrived is a key characteristic of time series data, as there is a natural temporal ordering. Isto é diferente dos dados capturados para standard pipelines de dados OLTP onde os dados podem ser introduzidos em qualquer ordem e atualizados em qualquer altura.This differs from data captured for standard OLTP data pipelines where data can be entered in any order, and updated at any time.

Quando utilizar esta soluçãoWhen to use this solution

Escolha uma solução de série de tempo quando precisa para ingestão de dados cujo valor estratégico centra-se as alterações durante um período de tempo e são principalmente a inserir novos dados e atualizar raramente, se houver.Choose a time series solution when you need to ingest data whose strategic value is centered around changes over a period of time, and you are primarily inserting new data and rarely updating, if at all. Pode usar essas informações para detetar anomalias, visualize tendências e comparar dados atuais para dados históricos, entre outras coisas.You can use this information to detect anomalies, visualize trends, and compare current data to historical data, among other things. Este tipo de arquitetura também é mais adequado para a modelação preditiva e previsão de resultados, porque tem o registo histórico das alterações ao longo do tempo, o que pode ser aplicado a qualquer número de modelos de previsão.This type of architecture is also best suited for predictive modeling and forecasting results, because you have the historical record of changes over time, which can be applied to any number of forecasting models.

Utilização da série de tempo oferece as seguintes vantagens:Using time series offers the following benefits:

  • Claramente representa como um asset ou processo muda ao longo do tempo.Clearly represents how an asset or process changes over time.
  • Ajude a detectar rapidamente as alterações a um número de origens relacionados, tornando anomalias e emergentes tendências claramente se destacam.Helps you quickly detect changes to a number of related sources, making anomalies and emerging trends clearly stand out.
  • Mais adequada para modelação preditiva e previsão.Best suited for predictive modeling and forecasting.

Internet das Coisas (IoT)Internet of Things (IoT)

Dados recolhidos por dispositivos IoT são um ajuste natural para análise e de armazenamento da série de tempo.Data collected by IoT devices is a natural fit for time series storage and analysis. Os dados de entrada são inseridos e raramente, se alguma vez, atualizados.The incoming data is inserted and rarely, if ever, updated. Os dados são timestamped e inserido na ordem foi recebido, e esses dados, normalmente, são apresentados por ordem cronológica, permitindo que os usuários a descobrir tendências, detetar anomalias e utilize as informações para Análise Preditiva.The data is timestamped and inserted in the order it was received, and this data is typically displayed in chronological order, enabling users to discover trends, spot anomalies, and use the information for predictive analysis.

Para obter mais informações, consulte Internet das coisas.For more information, see Internet of Things.

Análises em tempo realReal-time analytics

Série de tempo, os dados são, muitas vezes, tempo confidenciais — ou seja, ele deve ser analisados rapidamente, para detetar tendências em tempo real ou gerar alertas.Time series data is often time sensitive — that is, it must be acted on quickly, to spot trends in real time or generate alerts. Nestes cenários, qualquer atraso no insights pode causar tempo de inatividade e negócios impacto.In these scenarios, any delay in insights can cause downtime and business impact. Além disso, muitas vezes, há uma necessidade para correlacionar dados entre uma variedade de diferentes origens, como sensores.In addition, there is often a need to correlate data from a variety of different sources, such as sensors.

O ideal é que teria uma camada de processamento de fluxo que pode lidar com os dados de entrada em tempo real e processar tudo com alta precisão e de elevada granularidade.Ideally, you would have a stream processing layer that can handle the incoming data in real time and process all of it with high precision and high granularity. Isso nem sempre é possível, dependendo da sua arquitetura de transmissão em fluxo e os componentes do seu fluxo na memória intermédia e camadas de processamento de fluxo.This isn't always possible, depending on your streaming architecture and the components of your stream buffering and stream processing layers. Poderá ter de sacrificar alguns precisão dos dados de séries de tempo, reduzindo-lo.You may need to sacrifice some precision of the time series data by reducing it. Isto é feito ao processamento deslizante janelas de tempo (vários segundos, por exemplo), permitindo que a camada de processamento realizar cálculos em tempo hábil.This is done by processing sliding time windows (several seconds, for example), allowing the processing layer to perform calculations in a timely manner. Também poderá precisar de downsample e Agregue os seus dados quando se apresenta períodos de tempo, como o uso do zoom para exibir os dados capturados durante vários meses mais longos.You may also need to downsample and aggregate your data when displaying longer periods of time, such as zooming to display data captured over several months.

DesafiosChallenges

  • Dados de séries de tempo, muitas vezes, são muito elevado volume, especialmente em cenários de IoT.Time series data is often very high volume, especially in IoT scenarios. Armazenar, indexar, consultar, analisar e visualizar dados de séries de tempo podem ser um desafio.Storing, indexing, querying, analyzing, and visualizing time series data can be challenging.

  • Pode ser um desafio para encontrar a combinação certa de armazenamento de alta velocidade e operações para a manipulação de análise em tempo real, enquanto minimiza o tempo de comercialização e geral de computação poderosas investimento de custos.It can be challenging to find the right combination of high-speed storage and powerful compute operations for handling real-time analytics, while minimizing time to market and overall cost investment.

ArquiteturaArchitecture

Em muitos cenários que envolvam dados de séries de tempo, como IoT, os dados são capturados em tempo real.In many scenarios that involve time series data, such as IoT, the data is captured in real time. Como tal, um processamento em tempo real arquitetura é adequada.As such, a real-time processing architecture is appropriate.

Dados de um ou mais origens de dados são ingeridos no fluxo de colocação em memória intermédia camada por IoT Hub, dos Hubs de eventos, ou Kafka no HDInsight.Data from one or more data sources is ingested into the stream buffering layer by IoT Hub, Event Hubs, or Kafka on HDInsight. Em seguida, os dados são processados na camada de processamento de fluxo que pode, opcionalmente, a entregam os dados processados para um serviço machine learning para Análise Preditiva.Next, the data is processed in the stream processing layer that can optionally hand off the processed data to a machine learning service for predictive analytics. Os dados processados são armazenados num arquivo de dados analíticos, como HBase, do Azure Cosmos DB, o Azure Data Lake ou armazenamento de Blobs.The processed data is stored in an analytical data store, such as HBase, Azure Cosmos DB, Azure Data Lake, or Blob Storage. Um análises e relatórios de aplicação ou serviço, como o Power BI ou o OpenTSDB (se armazenados no HBase) podem ser usados para exibir os dados de séries de tempo para análise.An analytics and reporting application or service, like Power BI or OpenTSDB (if stored in HBase) can be used to display the time series data for analysis.

Outra opção é usar do Azure Time Series Insights.Another option is to use Azure Time Series Insights. O Time Series Insights é um serviço totalmente gerido para dados de séries de tempo.Time Series Insights is a fully managed service for time series data. Nesta arquitetura, o Time Series Insights executa as funções do fluxo de processamento, armazenamento de dados e análises e relatórios.In this architecture, Time Series Insights performs the roles of stream processing, data store, and analytics and reporting. Ele aceita a transmissão em fluxo de dados do IoT Hub ou Hubs de eventos e arquivos, processos, analisa e apresenta os dados em tempo real.It accepts streaming data from either IoT Hub or Event Hubs and stores, processes, analyzes, and displays the data in near real time. Ele não pré-agregar os dados, mas armazena os eventos não processados.It does not pre-aggregate the data, but stores the raw events.

O Time Series Insights é esquema adaptável, o que significa que não é necessário que fazer qualquer preparação de dados para iniciar a derivação de informações.Time Series Insights is schema adaptive, which means that you do not have to do any data preparation to start deriving insights. Isto permite-lhe explorar, comparar e correlacionar uma variedade de origens de dados de forma totalmente integrada.This enables you to explore, compare, and correlate a variety of data sources seamlessly. Ele também fornece filtros de tipo SQL e agregações, capacidade de construir, visualizar, comparam e sobrepor a vários padrões de série de tempo, mapas gráficos e a capacidade de guardar e partilhar consultas.It also provides SQL-like filters and aggregates, ability to construct, visualize, compare, and overlay various time series patterns, heat maps, and the ability to save and share queries.

Opções de tecnologiaTechnology choices