Anomali algılayıcısı API kullanımı için en iyi uygulamalarBest practices for using the Anomaly Detector API

Anomali algılayıcısı API'si, bir durum bilgisi olmayan anomali algılama hizmetidir.The Anomaly Detector API is a stateless anomaly detection service. Doğruluk ve performans sonuçlarını, tarafından etkilenebilir:The accuracy and performance of its results can be impacted by:

  • Zaman serisi verilerinin nasıl hazırlanır.How your time series data is prepared.
  • Kullanılan Anomali algılayıcısı API parametreler.The Anomaly Detector API parameters that were used.
  • Veri noktası, API isteği sayısı.The number of data points in your API request.

Verileriniz için en iyi sonuçları elde API kullanımı için en iyi uygulamalar hakkında bilgi edinmek için bu makaleyi kullanın.Use this article to learn about best practices for using the API getting the best results for your data.

Batch (Tümü) veya en son ne zaman kullanılacağını (son), anomali algılama noktasıWhen to use batch (entire) or latest (last) point anomaly detection

Anomali algılayıcısı API'nin batch algılama uç noktası aracılığıyla tüm zaman serisi verilerini anormallikleri algılamanızı sağlar.The Anomaly Detector API's batch detection endpoint lets you detect anomalies through your entire times series data. Bu algılama modunda, tek bir istatistik model oluşturulur ve veri kümesi her noktasında uygulanır.In this detection mode, a single statistical model is created and applied to each point in the data set. Zaman serisi varsa özellikleri, bir API çağrısında, verilerin önizlemesini görmek için batch algılama kullanılması önerilir.If your time series has the below characteristics, we recommend using batch detection to preview your data in one API call.

  • Bazen anomalileri ile dönemsel zaman serisi.A seasonal time series, with occasional anomalies.
  • Ara sıra ani/DIP ile bir düz eğilim zaman serisi.A flat trend time series, with occasional spikes/dips.

İzleme ya da özelliklere sahip olmayan bir zaman serisi verilerinde kullanarak gerçek zamanlı veriler için anomali algılama toplu kullanımı önerilmemektedir.We don't recommend using batch anomaly detection for real-time data monitoring, or using it on time series data that doesn't have above characteristics.

  • Batch algılama oluşturur ve yalnızca bir modeli uygular, algılama her nokta için tüm dizileri bağlamında gerçekleştirilir.Batch detection creates and applies only one model, the detection for each point is done in the context of whole series. Zaman serisi verileri eğilimleri yukarı ve aşağı mevsimsellik, bazı noktalarını olmadan (dıps ve veri artış) değiştirirseniz modeli tarafından eksik olabilir.If the time series data trends up and down without seasonality, some points of change (dips and spikes in the data) may be missed by the model. Benzer şekilde, daha az önemli olanları veri kümesindeki veriler daha sonra daha bazı noktalar değişikliğinin modele birleştirilmesi yeterince önemli olarak sayılması değil.Similarly, some points of change that are less significant than ones later in the data set may not be counted as significant enough to be incorporated into the model.

  • Batch algılama, gerçek zamanlı verileri izleme, çözümlenen noktalarının sayısı nedeniyle yaparken en son noktası durumunu anomali algılama daha yavaştır.Batch detection is slower than detecting the anomaly status of the latest point when doing real-time data monitoring, because of the number of points being analyzed.

Gerçek zamanlı verileri izleme için en son veri noktanız yalnızca anomali durumunu algılama öneririz.For real-time data monitoring, we recommend detecting the anomaly status of your latest data point only. Sürekli olarak en son noktası algılama uygulayarak, izleme verilerini akış daha verimli ve doğru bir şekilde gerçekleştirebilirsiniz.By continuously applying latest point detection, streaming data monitoring can be done more efficiently and accurately.

Aşağıdaki örnekte, bu algılama modları performansı olabilir gerçekleşen etkiyi açıklamaktadır.The example below describes the impact these detection modes can have on performance. İlk resim anomali durumu son noktası 28 önceden görülen veri noktaları boyunca sürekli olarak algılanıyor sonucunu gösterir.The first picture shows the result of continuously detecting the anomaly status latest point along 28 previously seen data points. Kırmızı noktalar anomalileri ' dir.The red points are anomalies.

En son noktası kullanarak anomali algılama gösteren görüntü

Batch anomali algılama özelliğiyle aynı veri kümesi aşağıdadır.Below is the same data set using batch anomaly detection. İşlem için oluşturulan model dikdörtgen tarafından işaretlenen birkaç anomalileri yoksaydı.The model built for the operation has ignored several anomalies, marked by rectangles.

Anomali algılama batch yöntemi kullanılarak gösteren görüntü

Veri hazırlamaData preparation

Zaman serisi Anomali algılayıcısı API kabul biçimlendirilmiş JSON istek nesnesine verileri.The Anomaly Detector API accepts time series data formatted into a JSON request object. Zaman serisi sırayla zaman içinde kayıtlı olan herhangi bir sayısal veri olabilir.A time series can be any numerical data recorded over time in sequential order. Zaman serisi verilerinin windows API'SİNİN performansını artırmak için Anomali algılayıcısı API uç noktası için gönderebilirsiniz.You can send windows of your time series data to the Anomaly Detector API endpoint to improve the API's performance. En az sayıda veri noktası gönderebilirsiniz 12, ve en fazla 8640 noktaları.The minimum number of data points you can send is 12, and the maximum is 8640 points. Ayrıntı düzeyi verilerinizi, örnek oranı olarak tanımlanır.Granularity is defined as the rate that your data is sampled at.

Veri noktaları Anomali algılayıcısı API'ye gönderilen geçerli Eşgüdümlü Evrensel Saat (UTC) zaman damgası ve sayısal değer olmalıdır.Data points sent to the Anomaly Detector API must have a valid Coordinated Universal Time (UTC) timestamp, and numerical value.

{
    "granularity": "daily",
    "series": [
      {
        "timestamp": "2018-03-01T00:00:00Z",
        "value": 32858923
      },
      {
        "timestamp": "2018-03-02T00:00:00Z",
        "value": 29615278
      },
    ]
}

Verilerinizi bir standart olmayan bir zaman aralığında örneklenir, onu ekleyerek belirtebilirsiniz customInterval isteğinizdeki özniteliği.If your data is sampled at a non-standard time interval, you can specify it by adding the customInterval attribute in your request. Örneğin, her 5 dakikada bir örneklenir seri, aşağıdaki JSON isteğiniz ekleyebilirsiniz:For example, if your series is sampled every 5 minutes, you can add the following to your JSON request:

{
    "granularity" : "minutely", 
    "customInterval" : 5
}

Veri noktalarıMissing data points

Veri noktaları eşit olarak dağıtılmış bir zaman serisi veri kümesi, ince bir ayrıntı düzeyi (küçük bir örnekleme aralığı. özellikle ettiklerinizi ortakMissing data points are common in evenly distributed time series data sets, especially ones with a fine granularity (A small sampling interval. For example, veri birkaç dakikada bir örneklenir).For example, data sampled every few minutes). Daha az % 10 beklenen veri noktası sayısı eksik algılama sonuçlarınız üzerinde olumsuz bir etkiye sahip olmamalıdır.Missing less than 10% of the expected number of points in your data shouldn't have a negative impact on your detection results. Özelliklerini veri noktalarından bir önceki süre, doğrusal enterpolasyon veya hareketli ortalama değiştirme gibi temel veri boşlukları doldurma göz önünde bulundurun.Consider filling gaps in your data based on its characteristics like substituting data points from an earlier period, linear interpolation, or a moving average.

Dağıtılmış veri toplamaAggregate distributed data

Anomali algılayıcısı API bir eşit olarak dağıtılmış zaman serisinde bulunan en iyi şekilde çalışır.The Anomaly Detector API works best on an evenly distributed time series. Verilerinizi rastgele dağıtılırsa, bu dakikalık, saatlik veya günlük gibi süre birimi örneğin toplama ölçütü.If your data is randomly distributed, you should aggregate it by a unit of time, such as Per-minute, hourly, or daily for example.

Dönemsel desenlerine sahip veriler üzerinde anomali algılamaAnomaly detection on data with seasonal patterns

Zaman serisi verilerinizle dönemsel desen (bir düzenli aralıklarla gerçekleşir) olduğunu biliyorsanız, doğruluk ve API yanıt süresini artırabilir.If you know that your time series data has a seasonal pattern (one that occurs at regular intervals), you can improve the accuracy and API response time.

Belirten bir period oluşturduğunuzda, JSON isteğiniz kadar % 50'ye anomali algılama gecikmeyi azaltabilir.Specifying a period when you construct your JSON request can reduce anomaly detection latency by up to 50%. period Desen yinelemek için kaç kabaca veri noktaları zaman serisi belirten bir tamsayı gerçekleştirir.The period is an integer that specifies roughly how many data points the time series takes to repeat a pattern. Örneğin, bir zaman serisi ile günlük bir veri noktası gerekir bir period olarak 7, ve bir zaman serisi (ile aynı haftalık deseni) saatte bir nokta ile olması gereken bir period , 7*24.For example, a time series with one data point per day would have a period as 7, and a time series with one point per hour (with the same weekly pattern) would have a period of 7*24. Veri desenlerini emin değilseniz, bu parametre belirtmeniz gerekmez.If you're unsure of your data's patterns, you don't have to specify this parameter.

En iyi sonuçlar için 4 sağlamak periodkullanıcının veri noktası yanı sıra, ek bir değerinde.For best results, provide 4 period's worth of data point, plus an additional one. Örneğin, haftalık desenle saatlik veri yukarıda açıklandığı gibi istek gövdesindeki 673 veri noktası sağlamanız gerekir (7 * 24 * 4 + 1).For example, hourly data with a weekly pattern as described above should provide 673 data points in the request body (7 * 24 * 4 + 1).

Gerçek zamanlı izleme için örnekleme verileriSampling data for real-time monitoring

Akış verilerinizi bir kısa aralıklarla (örneğin, saniyeler veya dakikalar içinde) örneklenir, önerilen veri noktalarının sayısını gönderme Anomali algılayıcısı API'nin en fazla izin verilen (8640 veri noktası sayısıdır) aşabilir.If your streaming data is sampled at a short interval (for example seconds or minutes), sending the recommended number of data points may exceed the Anomaly Detector API's maximum number allowed (8640 data points). Verilerinizi bir kararlı dönemsel deseni gösteriyorsa, saat gibi daha büyük bir zaman aralığı, zaman serisi verilerinin bir örnek gönderme göz önünde bulundurun.If your data shows a stable seasonal pattern, consider sending a sample of your time series data at a larger time interval, like hours. Bu şekilde, verilerinizi örnekleme, API yanıt süresi de fark edilir derecede artırabilir.Sampling your data in this way can also noticeably improve the API response time.

Sonraki adımlarNext steps