Een incident diagnosticeren met behulp van Metrics Advisor

Wat is een incident?

Wanneer er afwijkingen worden gedetecteerd in meerdere tijdreeksen binnen één metrische gegevens op een bepaald tijdstempel, groepeert Metrics Advisor automatisch afwijkingen die dezelfde hoofdoorzaak delen in één incident. Een incident duidt meestal op een echt probleem, Metrics Advisor voert een analyse uit en biedt automatische inzichten in de hoofdoorzaakanalyse.

Hierdoor wordt de inspanningen van de klant om elke afzonderlijke anomalie te bekijken aanzienlijk verminderd en wordt snel de belangrijkste factor voor een probleem gevonden.

Een waarschuwing die wordt gegenereerd Metrics Advisor kan meerdere incidenten bevatten en elk incident kan meerdere afwijkingen bevatten die zijn vastgelegd in verschillende tijdreeksen op hetzelfde tijdstempel.

Paden voor het diagnosticeren van een incident

  • Diagnose stellen vanuit een waarschuwingsmelding

    Als u een hook van het e-mail-/Teams en ten minste één waarschuwingsconfiguratie hebt toegepast. Vervolgens ontvangt u doorlopende waarschuwingsmeldingen die incidenten escaleren die worden geanalyseerd door Metrics Advisor. In de melding staat een lijst met incidenten en een korte beschrijving. Voor elk incident is er een knop Diagnose. Als u deze selecteert, wordt u door naar de detailpagina van het incident gebracht om diagnostische inzichten weer te geven.

    Diagnose stellen vanuit een waarschuwingsmelding

  • Diagnose van een incident in 'Incident hub'

    Er is een centrale plaats in Metrics Advisor die alle incidenten verzamelt die zijn vastgelegd en die het eenvoudig maken om lopende problemen bij te houden. Als u het tabblad Incident Hub selecteert in de linkernavigatiebalk, worden alle incidenten in de geselecteerde metrische gegevens weergegeven. Selecteer een van deze in de lijst met incidenten om gedetailleerde diagnostische inzichten weer te geven.

    Diagnose van een incident in incidenthub

  • Diagnose van een incident dat wordt vermeld op de pagina met metrische gegevens

    Op de detailpagina met metrische gegevens vindt u een tabblad met de naam Incidenten met de meest recente incidenten die zijn vastgelegd voor deze metrische gegevens. De lijst kan worden gefilterd op de ernst van de incidenten of de dimensiewaarde van de metrische gegevens.

    Als u één incident in de lijst selecteert, wordt u door sturen naar de detailpagina van het incident om diagnostische inzichten weer te geven.

    Diagnose van een incident dat wordt vermeld op de pagina met metrische gegevens

Typische diagnostische stroom

Nadat u bent omgeleid naar de detailpagina van het incident, kunt u profiteren van de inzichten die automatisch worden geanalyseerd door Metrics Advisor om snel de hoofdoorzaak van een probleem te vinden of het analysehulpprogramma te gebruiken om de impact van het probleem verder te evalueren. Er zijn drie secties op de detailpagina van het incident die overeenkomen met drie belangrijke stappen voor het diagnosticeren van een incident.

Stap 1. Samenvatting van het huidige incident controleren

De eerste sectie bevat een samenvatting van het huidige incident, met inbegrip van basisinformatie, acties & tracering en een geanalyseerde hoofdoorzaak.

  • Basisinformatie omvat de 'meest betrokken reeks' met een diagram, 'impact begin & eindtijd', 'ernst van incident' en 'totale opgenomen afwijkingen'. Door dit te lezen, krijgt u een basiskennis van een doorlopend probleem en de impact ervan.

  • Acties & tracering. Dit wordt gebruikt om teamsamenwerking bij een doorlopend incident mogelijk te maken. Soms moet één incident de inspanningen van teamleden in het analyseren en oplossen van dit probleem met zich mee brengen. Iedereen die de machtiging heeft om het incident weer te geven, kan een actie of traceringsgebeurtenis toevoegen.

    Nadat bijvoorbeeld het incident en de hoofdoorzaak zijn vastgesteld, kan een technicus een traceringsitem toevoegen met het type 'aangepast' en de hoofdoorzaak invoeren in de opmerkingssectie. Laat de status actief. Andere teamleden kunnen dan dezelfde informatie delen en weten dat er iemand aan de oplossing werkt. U kunt ook een Azure DevOps-item toevoegen om het incident bij te houden met een specifieke taak of bug.

  • De geanalyseerde hoofdoorzaak is een automatisch geanalyseerd resultaat. Metrics Advisor analyseert alle afwijkingen die zijn vastgelegd op tijdreeksen binnen één metrisch gegeven met verschillende dimensiewaarden op hetzelfde tijdstempel. Vervolgens wordt correlatie uitgevoerd, geclusterd om gerelateerde afwijkingen te groeperen en wordt advies over de hoofdoorzaak gegenereerd.

Incidentsamenvatting
Voor metrische gegevens met meerdere dimensies is het gebruikelijk dat er tegelijkertijd meerdere afwijkingen worden gedetecteerd. Deze afwijkingen kunnen echter dezelfde hoofdoorzaak delen. In plaats van alle afwijkingen één voor één te analyseren, moet het gebruik van de geanalyseerde hoofdoorzaak de meest efficiënte manier zijn om het huidige incident te diagnosticeren.

Stap 2. Diagnostische inzichten voor verschillende dimensies weergeven

Nadat u basisinformatie en automatische analyse-inzichten hebt gekregen, kunt u meer gedetailleerde informatie krijgen over abnormale statussen in andere dimensies binnen dezelfde metrische gegevens op een holistische manier met behulp van de 'Diagnostische structuur'.

Voor metrische gegevens met meerdere dimensies Metrics Advisor de tijdreeks gecategoriseerd in een hiërarchie, die de diagnostische structuur wordt genoemd. Een metrische 'omzet'-metrische gegevens worden bijvoorbeeld bewaakt door twee dimensies: 'regio' en 'categorie'. Ondanks concrete dimensiewaarden moet er een geaggregeerde dimensiewaarde zijn, zoals SUM. Vervolgens wordt de tijdreeks van "region" = "SUM" en "category" = "SUM" gecategoriseerd als het hoofd-knooppunt binnen de structuur. Wanneer er een anomalie wordt vastgelegd in de dimensie SUM, kan deze worden ingezoomd en geanalyseerd om te achterhalen welke specifieke dimensiewaarde het meest heeft bijgedragen aan de anomalie van het bovenliggende knooppunt. Selecteer elk knooppunt om uit te vouwen en gedetailleerde informatie weer te geven.

Diagnostische gegevens over verschillende dimensies met behulp van een diagnostische structuur

  • Een 'geaggregeerde' dimensiewaarde inschakelen in uw metrische gegevens

    Metrics Advisor ondersteunt het uitvoeren van 'Samengetteling' op dimensies om een 'geaggregeerde' dimensiewaarde te berekenen. De diagnostische structuur ondersteunt diagnoses voor aggregaties 'SUM', 'AVG', 'MAX', 'MIN', 'COUNT'. Als u een 'geaggregeerde' dimensiewaarde wilt inschakelen, kunt u de functie Roll-up inschakelen tijdens het onboarden van gegevens. Zorg ervoor dat uw metrische gegevens wiskundig kunnen worden gebruikt en dat de geaggregeerde dimensie echte zakelijke waarde heeft.

    Instellingen voor roll-up

  • Als uw metrische gegevens geen 'geaggregeerde' dimensiewaarde hebben

    Als uw metrische gegevens geen 'geaggregeerde' dimensiewaarde bevatten en de functie Roll-up niet is ingeschakeld tijdens het onboarden van gegevens. Er wordt geen metrische waarde berekend voor de 'geaggregeerde' dimensie. Deze wordt weergegeven als een grijs knooppunt in de structuur en kan worden uitgebreid om de onderliggende knooppunten weer te geven.

Legenda van diagnostische structuur

Er zijn drie soorten knooppunten in de diagnostische structuur:

  • Blauw knooppunt, dat overeenkomt met een tijdreeks met een werkelijke metrische waarde.
  • Grijs knooppunt, dat overeenkomt met een virtuele tijdreeks zonder metrische waarde, is een logisch knooppunt.
  • Rood knooppunt, dat overeenkomt met de meest betrokken tijdreeks van het huidige incident.

Voor elk knooppunt wordt de abnormale status beschreven door de kleur van de knooppuntrand

  • Rode rand betekent dat er een anomalie wordt vastgelegd in de tijdreeks die overeenkomt met de tijdstempel van het incident.
  • Niet-rode rand betekent dat er geen anomalie wordt vastgelegd in de tijdreeks die overeenkomt met de tijdstempel van het incident.

Weergavemodus

Er zijn twee weergavemodi voor een diagnostische structuur: alleen anomaliereeksen weergeven of grote verhoudingen weergeven.

  • Alleen de modus anomaliereeks tonen stelt de klant in staat om zich te richten op huidige afwijkingen die zijn vastgelegd op verschillende reeksen en de hoofdoorzaak van de belangrijkste beïnvloede reeksen te diagnosticeren.
  • Grote verhoudingen weergeven stelt de klant in staat om te controleren op abnormale status van de belangrijkste verhoudingen van de serie met de grootste impact. In deze modus toont de structuur zowel reeksen met anomalie gedetecteerd als reeksen zonder anomalie. Maar meer aandacht voor belangrijke reeksen.

Opties analyseren

  • Deltaverhouding tonen

    'Delta-verhouding' is het percentage van de huidige knooppuntdelta vergeleken met de delta van bovenliggend knooppunt. Dit is de formule:

    (werkelijke waarde van het huidige knooppunt - verwachte waarde van huidig knooppunt) / (werkelijke waarde van bovenliggend knooppunt - verwachte waarde van bovenliggend knooppunt) * 100%

    Dit wordt gebruikt om de belangrijkste bijdrage van bovenliggende knooppuntdelta te analyseren.

  • Waardeverhouding tonen

    'Waardeverhouding' is het percentage van de huidige knooppuntwaarde vergeleken met de waarde van het bovenliggende knooppunt. Dit is de formule:

    (werkelijke waarde van het huidige knooppunt/de werkelijke waarde van bovenliggend knooppunt) * 100%

    Dit wordt gebruikt om het aandeel van het huidige knooppunt in het geheel te evalueren.

Met behulp van 'Diagnostische structuur' kunnen klanten de hoofdoorzaak van het huidige incident in een specifieke dimensie vinden. Dit vermindert de inspanningen van de klant om elke afzonderlijke anomalie te bekijken of door verschillende dimensies te draaien om de belangrijkste afwijkingsbijdrage te vinden.

Stap 3. Diagnostische inzichten op verschillende metrische gegevens weergeven met behulp van 'Grafiek met metrische gegevens'

Soms is het moeilijk om een probleem te analyseren door de abnormale status van één metrische gegevens te controleren, maar meerdere metrische gegevens met elkaar te correleren. Klanten kunnen een grafiek met metrische gegevens configureren, waarmee de relatie tussen metrische gegevens wordt aangegeven. Raadpleeg Een grafiek met metrische gegevens maken om aan de slag te gaan.

Controleer de anomaliestatus van de hoofdoorzaakdimensie in grafiek met metrische gegevens

Door het bovenstaande diagnostische resultaat voor verschillende dimensies te gebruiken, is de hoofdoorzaak beperkt tot een specifieke dimensiewaarde. Gebruik vervolgens de grafiek met metrische gegevens en filter op de geanalyseerde hoofdoorzaakdimensie om de anomaliestatus van andere metrische gegevens te controleren.

Bijvoorbeeld als er een incident is vastgelegd op basis van metrische gegevens over 'omzet'. De meest beïnvloede reeks is de wereldwijde regio met 'regio' = 'SUM'. Door gebruik te maken van diagnostische gegevens over verschillende dimensies, bevindt de hoofdoorzaak zich in 'regio' = 'Moetenchi'. Er is een vooraf geconfigureerde grafiek met metrische gegevens, met inbegrip van metrische gegevens over 'omzet', 'kosten', 'DAU', 'PLT(laadtijd pagina's)' en 'KOSTEN(trefferfrequentie cache)'.

Metrics Advisor filtert automatisch de grafiek met metrische gegevens op de hoofdoorzaakdimensie van 'regio' = 'Hebtchi' en geeft de anomaliestatus van elk metrisch gegeven weer. Door de relatie tussen metrische gegevens en de anomaliestatus te analyseren, kunnen klanten meer inzicht krijgen in wat de uiteindelijke hoofdoorzaak is.

Analyse van metrische gegevens in verschillende metrische gegevens

Door het dimensiefilter hoofdoorzaak toe te passen op de grafiek met metrische gegevens, worden afwijkingen in elke metrische gegevens op het tijdstempel van het huidige incident automatisch gerelateerd. Deze afwijkingen moeten worden gerelateerd aan de geïdentificeerde hoofdoorzaak van het huidige incident.

Automatisch gerelateerde afwijkingen

Volgende stappen