De juiste bewakingsgegevens verzamelen

Artikel
02/21/2024

Door de status en beschikbaarheid van uw cloudoplossing te observeren, krijgt u inzicht in de signalen die u verwacht in uw systemen, zodat u kunt bepalen welke gegevens u moet verzamelen.

Dit artikel maakt deel uit van een reeks in de handleiding voor cloudbewaking.

Overwegingen voor gegevensverzameling

Stel uzelf deze vragen om criteria voor een bewakingsconfiguratie vast te stellen:

Servicesamenstelling: Wat is de samenstelling van de diensten? Worden deze afhankelijkheden vandaag bewaakt? Zo ja, zijn er meerdere hulpprogramma's betrokken en is er een mogelijkheid om te consolideren zonder extra risico's te introduceren?
Definieer voorspelbare foutstatussen: deze signalen zijn de symptomen van de fout, niet de oorzaak. De bewakingshulpprogramma's maken gebruik van metrische gegevens en logboeken voor geavanceerde diagnostische gegevens en analyse van hoofdoorzaak.
Service-SLA: Wat is de Service Level Agreement (SLA) van de service en hoe meet en rapporteert u deze?
Servicedashboardontwerp: Hoe moet het servicedashboard eruitzien bij het controleren van incidenten? Hoe moet het dashboard eruitzien voor de service-eigenaar en het team dat de service ondersteunt?
Metrische resourcegegevens: Welke metrische resourcegegevens worden geproduceerd door de oplossing die u moet bewaken?
Zoeken in logboeken: Hoe doorzoekt de service-eigenaar, ondersteuningsteams en andere medewerkers de logboeken?
Betrokkenheid van belanghebbenden: neem de eigenaar van de bewakingsservice, manager van IT-activiteiten en andere belanghebbenden tijdens de planningsfase op. Blijf deze gebruiken in de ontwikkelings- en releasecycli van uw bewakingsoplossingen.
Gevoelige gegevens: Welke gevoelige gegevens moet ik vermijden voor toepassingen die ik niet beschikbaar wil maken voor mijn operators?

Hoe u deze vragen beantwoordt en de criteria voor waarschuwingen bepaalt hoe u het bewakingsplatform gaat gebruiken.

Vereiste bewakingssignalen evalueren

Of u nu nieuwe workloads implementeert met een nieuwe bewakingsoplossing of migreert vanuit een bestaand bewakingsplatform of een set bewakingshulpprogramma's, het evalueren van de vereiste bewakingssignalen is essentieel. Zorgvuldig ontwerpen van de vereiste signalen helpen de verwachte resultaten te stimuleren en vermindert ruis.

Denk aan het volgende:

Actie mogelijk: houd er rekening mee dat bewakingsgegevens kunnen worden uitgevoerd om ruis en fout-positieven te verminderen.
Geoptimaliseerd: Optimaliseer de verzamelde gegevens om u een holistisch beeld te geven van de algehele status van de service.
Incident instrumentatie: de instrumentatie die is gedefinieerd om werkelijke incidenten te identificeren, moet zo eenvoudig, voorspelbaar en betrouwbaar mogelijk zijn.

Een bewakingsconfiguratie ontwikkelen

Normaal gesproken voldoen de eigenaar van een bewakingsservice en hun team aan een standaardset activiteiten om een bewakingsconfiguratie te maken. Deze activiteiten omvatten de planningsfasen, testen en valideren in een niet-productieomgeving en implementatie in productie.

Om bewakingsconfiguraties te ontwikkelen, maakt het team gebruik van bekende foutmodi, testresultaten van gesimuleerde fouten en de ervaring van verschillende personen binnen de organisatie, zoals de servicedesk, het operationele personeel, technici en ontwikkelaars.

Deze configuraties zijn ontworpen onder de veronderstelling dat de service al bestaat, een migratie naar de cloud ondergaat en niet is geherstructureerd. Om ervoor te zorgen dat de kwaliteitsresultaten op serviceniveau worden bereikt, is het essentieel om de status en beschikbaarheid van deze services vroeg in het ontwikkelingsproces te controleren. Als het bewaken van het ontwerp van de service of toepassing alleen als een nabeschouwing wordt beschouwd, zijn de resultaten waarschijnlijk minder succesvol.

Houd rekening met de volgende aanbevelingen om sneller het incident op te lossen:

Dashboards voor afzonderlijke onderdelen: definieer een dashboard voor elk serviceonderdeel om snel bekende problemen in een bepaald gebied van uw toepassingen en infrastructuur te identificeren.
Metrische gegevens gebruiken: gebruik de metrische signalen die zijn ingebouwd in de verschillende onderdelen om oplossingen of tijdelijke oplossingen te diagnosticeren en te identificeren als u een hoofdoorzaak niet kunt identificeren.
Dashboardaanpassingen inschakelen: ontwerp uw dashboards, zodat u eenvoudig kunt inzoomen op de gegevens van de bewakingsdashboards. Zorg ervoor dat u ondersteuning biedt voor het dynamisch aanpassen van de weergaven, zodat u eenvoudig kunt filteren en problemen kunt oplossen.

Door deze leidende set principes te omarmen, kunt u bijna realtime inzicht krijgen en uw service beter beheren.

Volgende stappen

Antwoordstrategie