Ajánlott eljárások az anomáliadetektor egyváltozós API használatához

Fontos

2023. szeptember 20-tól nem hozhat létre új anomáliadetektor erőforrásokat. A anomáliadetektor szolgáltatás 2026. október 1-jén megszűnik.

A anomáliadetektor API állapot nélküli anomáliadetektálási szolgáltatás. Az eredmények pontosságát és teljesítményét a következő hatások befolyásolhatják:

  • Az idősor adatainak előkészítése.
  • A használt anomáliadetektor API-paraméterek.
  • Az API-kérés adatpontjainak száma.

Ebből a cikkből megtudhatja, hogyan használhatja az API-t az adatok legjobb eredményeinek eléréséhez.

Mikor érdemes kötegelt (teljes) vagy legújabb (utolsó) pont anomáliadetektálása

A anomáliadetektor API kötegészlelési végpontja lehetővé teszi az anomáliák észlelését a teljes idősoradatokon keresztül. Ebben az észlelési módban a rendszer egyetlen statisztikai modellt hoz létre és alkalmaz az adatkészlet minden pontára. Ha az idősor az alábbi jellemzőkkel rendelkezik, javasoljuk, hogy a kötegelt észlelés használatával tekintse meg az adatokat egy API-hívásban.

  • Szezonális idősor, alkalmi rendellenességekkel.
  • Egy sima trend idősor, alkalmi kiugrásokkal/visszaesésekkel.

Nem javasoljuk a kötegelt anomáliadetektálás használatát valós idejű adatmonitorozáshoz, vagy olyan idősoros adatokhoz való használatát, amelyek nem rendelkeznek a fenti jellemzőkkel.

  • A kötegészlelés csak egy modellt hoz létre és alkalmaz, az egyes pontok észlelése a teljes sorozat kontextusában történik. Ha az idősor adattrendje szezonalitás nélkül felfelé és lefelé változik, előfordulhat, hogy a modell kihagy néhány változási pontot (az adatok visszaesését és kiugrását). Hasonlóképpen előfordulhat, hogy az adathalmaz későbbi részeinél kevésbé jelentős változási pontok nem számítanak elég jelentősnek ahhoz, hogy beépüljenek a modellbe.

  • A kötegészlelés lassabb, mint a legutóbbi pont rendellenességi állapotának észlelése valós idejű adatmonitorozáskor, az elemzett pontok száma miatt.

Valós idejű adatmonitorozáshoz javasoljuk, hogy csak a legújabb adatpont rendellenességi állapotát észlelje. A legújabb pontészlelés folyamatos alkalmazásával a streamelési adatok monitorozása hatékonyabban és pontosabban végezhető el.

Az alábbi példa azt ismerteti, hogy ezek az észlelési módok milyen hatással lehetnek a teljesítményre. Az első képen az anomáliadetektálási állapot legújabb pontjának folyamatos észlelése látható 28 korábban látott adatpont mentén. A piros pontok anomáliák.

An image showing anomaly detection using the latest point

Az alábbiakban ugyanaz az adatkészlet látható, amely kötegelt anomáliadetektáltság-észlelést használ. A művelethez készült modell figyelmen kívül hagyott számos rendellenességet, amelyeket téglalapok jelölnek.

An image showing anomaly detection using the batch method

Adatok előkészítése

A anomáliadetektor API JSON-kérelemobjektummá formázott idősoradatokat fogad el. Az idősorok tetszőleges numerikus adatok lehetnek, amelyet az idő függvényében, szekvenciális sorrendben rögzítettek. Az idősor adatainak ablakait elküldheti a anomáliadetektor API-végpontnak az API teljesítményének javítása érdekében. Az elküldhető adatpontok minimális száma 12, a maximális érték pedig 8640 pont. A részletesség az adatok mintavételi gyakorisága.

Az anomáliadetektor API-nak küldött adatpontoknak érvényes utc időbélyegzővel és numerikus értékkel kell rendelkezniük.

{
    "granularity": "daily",
    "series": [
      {
        "timestamp": "2018-03-01T00:00:00Z",
        "value": 32858923
      },
      {
        "timestamp": "2018-03-02T00:00:00Z",
        "value": 29615278
      },
    ]
}

Ha az adatok mintavétele nem szabványos időközönként történik, az attribútum kérésben való hozzáadásával customInterval adhatja meg. Ha például a sorozatot 5 percenként mintavételezi, a következőt adhatja hozzá a JSON-kérelemhez:

{
    "granularity" : "minutely", 
    "customInterval" : 5
}

Hiányzó adatpontok

A hiányzó adatpontok gyakoriak az egyenletesen elosztott idősoros adathalmazokban, különösen azokban, amelyek részletesek (kis mintavételi időköz). Például néhány percenként mintavételezett adatok). A várt számú pont kevesebb mint 10%-ának hiánya nem befolyásolhatja negatívan az észlelési eredményeket. Fontolja meg az adatok hiányosságainak kitöltését olyan jellemzők alapján, mint az adatpontok helyettesítése egy korábbi időszakból, lineáris interpoláció vagy mozgó átlag.

Elosztott adatok összesítése

A anomáliadetektor API egyenletesen elosztott idősorokon működik a legjobban. Ha az adatok véletlenszerűen oszlanak el, azokat időegységek szerint kell összesíteni, például percenként, óránként vagy naponta.

Anomáliadetektálás szezonális mintákkal rendelkező adatokon

Ha tudja, hogy az idősor adatai szezonális mintázattal rendelkeznek (amelyek rendszeres időközönként fordulnak elő), javíthatja a pontosságot és az API-válaszidőt.

period A JSON-kérés létrehozásakor megadott beállítás akár 50%-kal is csökkentheti az anomáliadetektálási késést. Ez period egy egész szám, amely nagyjából azt határozza meg, hogy az idősor hány adatpontot vesz igénybe egy minta ismétléséhez. Például egy naponta egy adatponttal rendelkező idősornak a következőnek kellene period lennie 7, és egy óránként egy ponttal rendelkező idősornak (ugyanazzal a heti mintával) a következővel kellene rendelkeznie period7*24. Ha nem biztos az adatok mintáiban, nem kell megadnia ezt a paramétert.

A legjobb eredmény érdekében adjon meg négy periodadatpontot, valamint egy továbbiat. Például a fent leírt heti mintával rendelkező óránkénti adatoknak 673 adatpontot kell biztosítaniuk a kérelem törzsében (7 * 24 * 4 + 1).

Mintavételezési adatok valós idejű monitorozáshoz

Ha a streamelési adatok mintavétele rövid időközönként történik (például másodpercben vagy percben), az ajánlott adatpontok küldése meghaladhatja a anomáliadetektor API megengedett maximális számát (8640 adatpont). Ha az adatok stabil szezonális mintát mutatnak, érdemes lehet az idősor adataiból mintát küldeni nagyobb időközönként, például órákban. Az adatok ily módon történő mintavétele jelentősen javíthatja az API válaszidejének idejét is.

Következő lépések