Diagnostisera en incident med hjälp av Metrics Advisor
Vad är en incident?
När det finns avvikelser som identifieras i flera tidsserier inom ett mått vid en viss tidsstämpel grupperar Metrics Advisor automatiskt avvikelser som delar samma rotorsak i en incident. En incident indikerar vanligtvis ett verkligt problem, Metrics Advisor utför analys ovanpå den och tillhandahåller automatiska rotorsaksanalysinsikter.
Detta tar avsevärt bort kundens arbete med att visa varje enskild avvikelse och snabbt hitta den viktigaste bidragande faktorn till ett problem.
En avisering som Metrics Advisor kan innehålla flera incidenter och varje incident kan innehålla flera avvikelser som har fångats in i olika tidsserier vid samma tidsstämpel.
Sökvägar för att diagnostisera en incident
Diagnostisera från ett aviseringsmeddelande
Om du har konfigurerat en hook av typen e-post/Teams och tillämpat minst en aviseringskonfiguration. Sedan får du kontinuerliga aviseringsmeddelanden som eskalerar incidenter som analyseras av Metrics Advisor. I meddelandet finns en incidentlista och en kort beskrivning. För varje incident finns knappen "Diagnostisera". Om du väljer den dirigeras du till sidan med incidentinformation för att visa diagnostiska insikter.
Diagnostisera från en incident i incidenthubben
Det finns en central plats i Metrics Advisor samlar in alla incidenter som har fångats in och gör det enkelt att spåra pågående problem. Om du väljer fliken Incidenthubb i det vänstra navigeringsfältet visas alla incidenter i de valda måtten. I listan över incidenter väljer du en av dem för att visa detaljerade diagnostikinsikter.
Diagnostisera från en incident som anges på måttsidan
På sidan med måttinformation finns det en flik med namnet Incidents (Incidenter) som visar de senaste incidenterna som har fångats in för det här måttet. Listan kan filtreras efter incidentens allvarlighetsgrad eller måttens dimensionsvärde.
Om du väljer en incident i listan dirigeras du till informationssidan för incidenter för att visa diagnostikinsikter.
Typiskt diagnostikflöde
När du har dirigerats till sidan med incidentinformation kan du dra nytta av de insikter som analyseras automatiskt av Metrics Advisor för att snabbt hitta rotorsaken till ett problem eller använda analysverktyget för att ytterligare utvärdera problemets påverkan. Det finns tre avsnitt på sidan med incidentinformation som motsvarar tre viktiga steg för att diagnostisera en incident.
Steg 1. Kontrollera sammanfattningen av den aktuella incidenten
Det första avsnittet innehåller en sammanfattning av den aktuella incidenten, inklusive grundläggande information, åtgärder & spårningar och en analyserad rotorsak.
Grundläggande information omfattar den "viktigaste serien" med ett diagram, "impact start & end time", "incident severity" och "total anomalies included". Genom att läsa detta kan du få en grundläggande förståelse för ett pågående problem och dess påverkan.
Åtgärder & spårningar används detta för att underlätta teamsamarbete i en pågående incident. Ibland kan en incident behöva omfatta teammedlemmars arbete för att analysera och lösa den. Alla som har behörighet att visa incidenten kan lägga till en åtgärd eller en spårningshändelse.
När till exempel en diagnostisering av incidenten och rotorsaken har identifierats kan en tekniker lägga till ett spårningsobjekt med typen "anpassad" och ange rotorsaken i kommentarsavsnittet. Lämna statusen "Aktiv". Sedan kan andra teammedlemmar dela samma information och veta att det finns någon som arbetar med korrigeringen. Du kan också lägga till ett "Azure DevOps"-objekt för att spåra incidenten med en viss uppgift eller bugg.
Den analyserade rotorsaken är ett resultat som analyseras automatiskt. Metrics Advisor alla avvikelser som fångas in i tidsserier inom ett mått med olika dimensionsvärden vid samma tidsstämpel. Utför sedan korrelation, klustring för att gruppera relaterade avvikelser och genererar rotorsaksråd.
För mått med flera dimensioner är det vanligt att flera avvikelser identifieras samtidigt. Dessa avvikelser kan dock ha samma rotorsak. I stället för att analysera alla avvikelser en i stället för en, bör det effektivaste sättet att diagnostisera den aktuella incidenten vara att använda den analyserade rotorsaken.
Steg 2. Visa diagnostikinsikter över flera dimensioner
När du har fått grundläggande information och automatiska analysinsikter kan du få mer detaljerad information om onormal status för andra dimensioner inom samma mått på ett holistiskt sätt med hjälp av "diagnostikträdet".
För mått med flera dimensioner Metrics Advisor tidsserien i en hierarki, som heter diagnostikträdet. Till exempel övervakas måttet "intäkter" med två dimensioner: "region" och "kategori". Trots konkreta dimensionsvärden måste det finnas ett aggregerat dimensionsvärde, till exempel "SUM". Sedan kategoriseras tidsserierna "region" = "SUM" och "category" = "SUM" som rotnoden i trädet. När det finns en avvikelse som avbildas vid "SUM"-dimension kan den öka detaljgranskas och analyseras för att hitta vilket specifikt dimensionsvärde som har bidragit mest till den överordnade nodens avvikelse. Markera varje nod för att expandera och visa detaljerad information.
Så här aktiverar du ett "aggregerat" dimensionsvärde i dina mått
Metrics Advisor stöd för att utföra "sammanslagning" på dimensioner för att beräkna ett "aggregerat" dimensionsvärde. Diagnostikträdet stöder diagnostisering på sammansättningarna "SUM", "AVG", "MAX","MIN","COUNT". Om du vill aktivera ett "aggregerat" dimensionsvärde kan du aktivera funktionen "Sammanslagning" under data onboarding. Kontrollera att dina mått är matematiskt välkända och att den aggregerade dimensionen har verkligt affärsvärde.
Om det inte finns något "aggregerat" dimensionsvärde i dina mått
Om det inte finns något "aggregerat" dimensionsvärde i dina mått och funktionen "Sammanslagning" inte är aktiverad under data onboarding. Det kommer inte att finnas något måttvärde beräknat för "aggregerad" dimension. Det visas som en grå nod i trädet och kan expanderas för att visa dess underordnade noder.
Förklaring av diagnostikträd
Det finns tre typer av noder i diagnostikträdet:
- Blå nod, som motsvarar en tidsserie med verkligt måttvärde.
- Grå nod, som motsvarar en virtuell tidsserie utan måttvärde, det är en logisk nod.
- Röd nod, som motsvarar den tidsserie som påverkas mest av den aktuella incidenten.
För varje nods onormala status beskrivs av färgen på nodens kantlinje
- Den röda kantlinjen innebär att en avvikelse har avbildats i tidsserien som motsvarar incidentens tidsstämpel.
- Icke-röd kantlinje innebär att ingen avvikelse avbildas i tidsserien som motsvarar incidentens tidsstämpel.
Visningsläge
Det finns två visningslägen för ett diagnostikträd: visa endast avvikelseserier eller visa större proportioner.
- Om du bara visar läget för avvikelseserier kan kunden fokusera på aktuella avvikelser som har fångats in i olika serier och diagnostisera rotorsaken till de mest påverkade serierna.
- Visa större proportioner gör det möjligt för kunden att kontrollera onormal status för större andelar av serien som påverkas mest. I det här läget skulle trädet visa båda serierna med avvikelse identifierad och serier utan avvikelse. Men mer fokus på viktiga serier.
Analysalternativ
Visa deltaförhållande
"Deltaförhållande" är procentandelen aktuell nod delta jämfört med överordnad nod delta. Här är formeln:
(verkligt värde för aktuell nod – förväntat värde för aktuell nod) / (verkligt värde för överordnad nod – förväntat värde för överordnad nod) * 100 %
Detta används för att analysera det huvudsakliga bidraget från den överordnade nodens delta.
Visa värdeandel
"Värdeandel" är procentandelen av det aktuella nodvärdet jämfört med det överordnade nodvärdet. Här är formeln:
(verkligt värde för aktuell nod/verkligt värde för överordnad nod) * 100 %
Detta används för att utvärdera andelen av den aktuella noden i helheten.
Med hjälp av "diagnostikträd" kan kunder hitta rotorsaken till den aktuella incidenten i en specifik dimension. Detta tar avsevärt bort kundens arbete med att visa varje enskild avvikelse eller pivotera genom olika dimensioner för att hitta det större avvikelsebidraget.
Steg 3. Visa diagnostikinsikter mellan mått med hjälp av "Måttdiagram"
Ibland är det svårt att analysera ett problem genom att kontrollera onormal status för ett enda mått, men det måste korrelera flera mått tillsammans. Kunder kan konfigurera ett måttdiagram, som anger relationen mellan mått. Kom igång genom att gå till Skapa ett måttdiagram.
Kontrollera avvikelsestatus för rotorsaksdimensionen i "Måttdiagram"
Med hjälp av ovanstående korsdimensionsdiagnostikresultat är rotorsaken begränsad till ett specifikt dimensionsvärde. Använd sedan måttdiagrammet och filtrera efter den analyserade rotorsaksdimensionen för att kontrollera avvikelsestatus för andra mått.
Till exempel om det finns en incident som fångas in av måtten "intäkter". Den serie som påverkas mest finns i den globala regionen med "region" = "SUM". Med hjälp av korsdimensionsdiagnostik har rotorsaken hittats i "region" = "Chi". Det finns ett förkonfigurerat måttdiagram, inklusive mått för "intäkter", "kostnad", "DAU", "PLT(sidinläsningstid)" och "CHR(cache träfffrekvens)".
Metrics Advisor automatiskt måttdiagrammet efter den bakomliggande orsaksdimensionen för "region" = "Chi" och visar avvikelsestatus för varje mått. Genom att analysera relationen mellan mått och avvikelsestatus kan kunderna få ytterligare insikter om vad som är den slutliga rotorsaken.
Autorelaterade avvikelser
Genom att använda dimensionsfiltret för rotorsaken i måttdiagrammet kommer avvikelser för varje mått vid tidsstämpeln för den aktuella incidenten att vara autorelaterade. Dessa avvikelser ska vara relaterade till den identifierade rotorsaken till den aktuella incidenten.