Förstå dataströmmar

Slutförd

En dataström består av en evig serie data, vanligtvis relaterade till specifika tidpunktshändelser. En dataström kan till exempel innehålla information om meddelanden som skickas till en mikrobloggwebbplats för sociala medier eller en serie miljömätningar som registrerats av en internetansluten vädersensor. Strömmande dataanalys används oftast för att bättre förstå förändringar över tid. Till exempel kan en marknadsföringsorganisation utföra attitydanalys på meddelanden på sociala medier för att se om en reklamkampanj resulterar i mer positiva kommentarer om företaget eller dess produkter, eller om ett jordbruksföretag kan övervaka trender i temperatur och nederbörd för att optimera bevattning och skörd.

Vanliga mål för streamanalys är bland annat

  • Analysera data kontinuerligt för att rapportera problem eller trender.
  • Förstå komponent- eller systembeteende under olika förhållanden för att planera framtida förbättringar.
  • Utlöser specifika åtgärder eller aviseringar när vissa händelser inträffar eller tröskelvärden överskrids.

Egenskaper för dataströmbearbetningslösningar

Lösningar för dataströmbearbetning uppvisar vanligtvis följande egenskaper:

A diagram showing a stream of data including a date and time field being processed, aggregated by day, and visualized and stored.

  1. Källdataströmmen är obundna – data läggs till i dataströmmen kontinuerligt.
  2. Varje datapost i dataströmmen innehåller temporala (tidsbaserade) data som anger när händelsen som posten avser inträffade (eller registrerades).
  3. Aggregering av strömmande data utförs över tidsmässiga fönster – till exempel registrering av antalet inlägg på sociala medier per minut eller den genomsnittliga nederbörden per timme.
  4. Resultatet av bearbetning av strömmande data kan användas för att stödja automatisering eller visualisering i realtid (eller nära realtid) eller sparas i ett analyslager som ska kombineras med andra data för historisk analys. Många lösningar kombinerar dessa metoder för att stödja både realtidsanalys och historisk analys.