Molnövervakningsguide: ObserverbarhetCloud monitoring guide: Observability

Den här artikeln är avsedd att hjälpa organisationer att implementera en konsekvent övervakningsstrategi snabbare genom att säkerställa att observerbarheten upprättas i Azure-landningszonen (det vill säga i varje minsta fungerande produkt) för varje övervakningslösning.This article is intended to help organizations implement a consistent monitoring strategy quicker by ensuring observability is established in the Azure landing zone (that is, in every minimum viable product) for each monitoring solution.

Som planerare formulerar du en övervakningsplan för en tjänst och inkluderar vissa övervakningsmål.As a planner, you formulate a monitoring plan for a service and include some monitoring objectives. Ett mål du vill ha är att övervakningskonsumenterna ska nå en nivå av bekvämlighet eller konfidens med den lösning som du planerar för dem så snart som möjligt.One objective you want is for the monitoring consumer(s) to reach a level of comfort or confidence with the solution you are planning for them, as soon as possible. Sedan kan du gå vidare till andra mål, till exempel att skapa rapporter och anpassade instrumentpaneler.Then you can move on to other objectives, like building reports and custom dashboards.

Vi kallar detta införande.We call this adoption.

Målet med den här artikeln är att ta rekommendationerna om övervakningsstrategin och skapa en övervakningsplan för att stödja målet att modernisera och utveckla organisationens IT-driftsstrategi.The goal of this article is to take the monitoring strategy recommendations, and create a monitoring plan to support the goal of modernizing and evolving your organizations IT operations strategy. Det andra målet är att öka den operativa mognaden genom att vara uppmärksam och ständigt iterera för att förbättra hur du övervakar dessa tjänster.The second goal is to drive operational maturity by being observant and constantly iterating to improve how you monitor those services.

Anteckning

I den här artikeln är en övervakningslösning den produktionsenhet som övervakar en tjänst i molnet och ett övervakningsmål är den tjänst eller det som övervakas.In this article, a monitoring solution is the unit of production doing the monitoring of a service in the cloud, and a monitoring target is the service or thing that is being monitored. En lösning omfattar alla aspekter av övervakning: verktyget, övervakningsdata, aviseringar, typ av svar, återställningsåtgärder, typ av visualisering, rollbaserad åtkomst och så vidare.A solution encompasses all aspects of monitoring: the tool, the monitoring data, alerts, type of response, recovery actions, type of visualization, role-based access, and so on.

Varför observerbarhet är viktigtWhy observability is important

Det är helt enkelt dess observerbarhet först som gör att övervakningskonsumenten förstår vad som anses eller uppfattas som normal drift av en tjänst.Simply, its observability first that drives the monitoring consumer to understand what is considered or perceived as normal operation of a service. Med andra ord söker du total synlighet, en nyckelövervakningsprincip så snart som möjligt.In other words, you seek total visibility, a key monitoring principle, as soon as possible. När den inledande observerbarheten har uppnåtts bygger du på den inledande synlighetsnivån för att utveckla användbara aviseringar, skapa användbara instrumentpaneler och utvärdera AIOps-lösningar.Once initial observability is achieved, then you build upon that initial level of visibility to develop actionable alerts, create useful dashboards, and evaluate AIOps solutions. På så sätt kan du lära dig mer om underliggande mått och loggövervakningsdata.This allows you time to get comfortable with the underlying metric and log monitoring data.

Anteckning

Det här är motsatsen till den tidigare metoden när teamen arbetade med att definiera alla övervakningskrav först på papper, innan de byggde, testar och distribuerar.This is the opposite of the approach used in the past, when teams worked to define all of the monitoring requirements first on paper, before build, test, and deploy.

Oavsett om planen (det vill säga mål) är mål för en Azure-resurstyp, till exempel Key Vault, en hel resursgrupp eller till och med Microsoft 365 Exchange Online, är det första steget att upprätta observerbarhet.Whether the plan (that is, objective) targets an Azure resource type such as Key Vault, an entire Resource Group, or even Microsoft 365 Exchange Online, the first step is to establish observability.

Den här metoden förenklar också dina planer.This approach also simplifies your plans. I samtliga fall innebär den totala synligheten att uppnå och upprätthålla tillräcklig synlighet över tre dimensioner eller aspekter:In all cases, total visibility means achieving and sustaining, sufficient visibility across three dimensions or aspects:

  • Djupgående övervakningMonitoring-in-depth
  • Övervakning i breddMonitoring in breadth
  • Övervakning över hälsomodellenMonitoring across the health model

Exempel på kub med tre sidor

Att vara uppmärksam är inte bara ett IT-fokus; kom ihåg att målet är att se till att slutanvändarna kan använda och att företagets förväntningar uppfylls.Being observant isn't just an IT focus; remember the goal is to ensure end users can consume and business expectations are met. Du kan inte övervaka vad du inte förstår eller vet, och därför kan du inte leverera den servicetillgänglighetsnivå som företaget har utlovat.You can't monitor what you don't understand or know, and as a result you won't able to deliver the level of service availability promised to the business. Före införandet av molnbaserad databehandling framhävde Microsoft analys av felläge under programdesignen och utvecklingen.Before the advent of cloud computing, Microsoft emphasized failure mode analysis during application design and development. Analys av felläge hjälpte utvecklare att överväga hur och när logik eller andra kritiska fel kan uppstå i koden.Failure mode analysis helped developers consider how and when logic or other critical errors could occur in their code. Och när det gör det exponerar du villkoret på ett meningsfullt sätt så att övervakningsverktyget inte bara kan identifiera det och agera på det, utan även ge utvecklare, operatörer eller systemtekniker användbar information för att bättre förstå programmets beteende och fatta datadrivna beslut.And when it does, expose the condition in a meaningful way to allow the monitoring tool not only detect it and act on it, but also provide developers, operators, or system engineers with useful information to help better understand the applications behavior and make data-driven decisions. I dag rekommenderar Cloud Adoption Framework att du följer den processen som en del av arkitektur- och designfaserna för att skapa återställning av Azure-tjänsterna i din design.Today, the Cloud Adoption Framework recommends you follow that process as part of the architecture and design phases to build recovery of the Azure services in your design.

Den nedre linjen är den observerbarhet du vill ha, tidigt och i din minsta fungerande produkt.Bottom line, it's the observability you want, early, and in your minimum viable product.

Övervakningssystem och observerbarhetMonitoring systems and observability

Infrastruktur- och programövervakning är komplicerat, det har alltid varit och förblir det även med introduktionen av molnbaserad databehandling.Infrastructure and application monitoring is complicated, it always has been and remains so even with the introduction of cloud computing. Affärsomvandling tillämpar teknik för att uppnå aktuell och hjälpa till att forma sin framtida strategi.Business transformation applies technology to achieve current, and help shape, its future strategy. Molnet har ytterligare påverkat övervakningens komplicerade natur.The cloud has further influenced the complicated nature of monitoring.

Detta visas på följande sätt:This is demonstrated in the following ways:

  • Arbetet med affärsomvandling (digital) övergår till hyperutnyttjande av molnteknik.Business (digital) transformation efforts shift toward hyper-exploitation of cloud technology.

  • Övervakningen bäddas in i Azure-resurser och resursgrupper jämfört med separata verktyg som du hanterar lokalt.Monitoring becomes embedded into Azure resources and resource groups versus separate tooling you manage on-premises.

  • Molnbaserade övervakningsarkitekturer är SIEM-liknande, till exempel Azure Monitor.Cloud-native monitoring architectures are SIEM-like, such as Azure Monitor. Det är alltså omfattande, loggdrivet och mycket mer flexibelt.So it's expansive, log-driven, and orders of magnitude more flexible.

För arkitekter utgör diagnostik kärnan i deras utnyttjande av mer kostnadseffektiva molnbaserade övervakningsstrukturer som gör att IT kan hantera tjänster holistiskt i de olika molnmodellerna.For architects, diagnostics form the core of their exploitation of more cost effective cloud-native monitoring structures that let IT manage services holistically across the different cloud models.

Arkitekter måste, precis som operatörer, förstå vilken diagnostikinformation en komponent eller ett program i IT-infrastrukturen ger.Architects must, like operators, understand what diagnostic information an IT infrastructure component or application emits. Att kombinera multivarierade, dynamiska, tidsserier, händelseriska, tillståndsfulla och telemetriska loggströmmar till värdefull intelligens beror på följande:Combining multivariate, dynamical, time-series, eventful, stateful, and telemetric log streams into valuable intelligence depends on the following:

  • Kunskaper och erfarenhet från utvecklaren eller systemteknikern, som har en djup förståelse för övervakningsmålet.The knowledge and experience of the developer or system engineer, who have a deep understanding of the monitoring target.

  • Faktisk support och felsökning med hjälp av data, för att hitta problem eller hitta orsaken till problemet.Actual support and troubleshooting experience using the data, to find trouble or locate the causes of trouble.

  • Granskning av tidigare incidenter för att hitta icke-tekniska orsaker, som senare kan automatiseras (automatisk reparation).Review of past incidents to find non-technology reasons, that later can be automated (auto remediation).

  • Vägledning i form av dokumentation, programvara, utbildning eller rådgivning av programvaru- eller maskinvaruleverantören.Guidance in the form of documentation, software, training, or consulting by the software or hardware vendor.

Om du är bekant med System Center Operations Manager tillhandahåller Microsoft och dess partner hanteringspaket.If you are familiar with System Center Operations Manager, Microsoft and its partners provide management packs. Hanteringspaket är teknikspecifika. Du kan till exempel importera ett SQL-hanteringspaket Operations Manager automatiskt identifiera och riktar in sig på servrar som SQL Server och börjar övervaka dem.Management packs are technology-specific; for example, you import a SQL management pack Operations Manager automatically discovers and targets servers hosting SQL Server and begins monitoring them. Här är observerbarheten mer eller mindre fördefinierad av produkttekniker på Microsoft och dussintals branscher.Here, observability is more or less pre-defined by the product engineers at Microsoft and dozens of industries. Med Operations Manager behöver du inte bekymra dig om beroenden mellan nord-syd och öst-väst, så att hälsotillståndet för SQL är en del av den större IT-tjänsten med nätverk, virtualisering och program som ingår.With Operations Manager, you don't need to worry about north-south and east-west dependencies, so that observing the health of SQL is part of the larger IT service with networking, virtualization, and applications included. På grund av ett gemensamt schema baserat på den välbekanta hälsomodellen i fyra delar Operations Manager är utformat för lokal infrastruktur.Owing to a common schema based on the familiar four-part health model, Operations Manager is designed for on-premises infrastructure. Arkitekturer för infrastrukturtjänster brukar vara fasta i komponenter och arkitekturmönster i förhållande till molntjänster.Infrastructure service architectures tend to be fixed in components and architectural patterns, relative to cloud services.

I molnet har du enorm flexibilitet vad gäller vilka typer av tjänster du kan välja.In the cloud, you have enormous flexibility in the types of services you can choose. Övervakning omfattar hur de ändras med tiden och de kan vara dynamiska, globala och motståndskraftiga.Monitoring includes how they change over time, and they can be dynamic, global, and resilient. Som molnarkitekt begränsas du inte av fasta, lokala tankesätt.As a cloud architect, you are not constrained by fixed, on-premises thinking. Operations Manager kan delta, men dess styrka är återigen traditionell lokal infrastruktur och program.Operations Manager can participate, but again, its strength is traditional on-premises infrastructure and applications. Däremot är Azure Monitor arkitektur mycket mer flexibel när det gäller stöd för alla tre molnmodeller.In contrast, Azure Monitor's architecture is much more flexible in supporting all three cloud models. För att uppnå målen för observerbarhet i Azure Monitor har du större frihet att besluta om resurser, var de ska placera dem geografiskt och hur du visualiserar komponenterna som arbetar tillsammans.To reach your observability goals in Azure Monitor, you have more freedom to decide on resources, where to place them geographically, and how to visualize the components working together.

Med Azure Monitor kan du dra nytta av befintliga arbetsböcker som ingår i Insights,som tillhandahåller liknande funktioner som ett hanteringspaket i Operations Manager gör.With Azure Monitor, you can take advantage of existing workbooks that are included in Insights, which provide similar functionality that a management pack in Operations Manager does. Annars måste du granska Azure-dokumentationen för var och en av Azure-tjänsterna för att förstå hur du kan övervaka och identifiera kända fel eller symptom som indikerar potentiella fel.Otherwise, you need to review the Azure documentation for each of the Azure services in order to understand how you can monitor and detect for known failures or symptoms that indicate potential failure.

Övervakning av områdenMonitoring disciplines

Följande bild visar området Observera till vänster och senare i det här avsnittet diskuterar vi hur Microsoft Azure spelar en central roll här.The following figure shows the Observe discipline on the left, and later in this section we discuss how Microsoft Azure plays a central role here.

Övervakning av områden

Observerbarhet och svarObservability and response

Observerbarhet är en kvalitativ indikator på att en övervakningslösning hjälper övervakningskonsumenten att uppnå en tillfredsställande kontrollnivå av en definierad tjänst.Observability is a qualitative indicator that a monitoring solution helps the monitoring consumer achieve the satisfactory level of control of a defined service. Där övervakning ger tjänstkonsumenter en lämplig mängd övervakningsfunktioner och perspektiv.Where monitoring provides service consumers with a suitable range of monitoring capabilities and perspectives.

Svaret är organisationens förmåga att snabbt fastställa signifikans för observerade övervakningsdata (identifierade händelser, telemetriska mönster, korrelerad information osv.) så att det vid negativa händelser snabbt kan återställas eller åtgärdas.Response is the organization's ability to quickly ascertain significance of observed monitoring data (detected events, telemetric patterns, correlated information, an so on) such that for negative events it can rapidly restore or remediate. För positiva händelser eller informationshändelser kan det hjälpa till att upprätthålla serviceavtal, förbättra tillförlitligheten och minska supportkostnaderna.For positive events or informational events, it can help to maintain service agreements, improve reliability, and reduce support costs. Händelser inträffar dynamiskt i systemet eller tjänsten, där övervakningslösningar tillhandahåller aviseringar, automatisering av kontrollslinga och säkerhetsproblem, problem eller ändringar i ett externt Hantering av IT-tjänster (ITSM)-system (ITSM).Events dynamically occur in the system or service, where monitoring solutions provide alerting, control loop automation, and raise incidents, problems, or changes in an external IT service management (ITSM) system. Kom ihåg att många händelser inte kan eller inte bör åtgärdas automatiskt.Realize that many events cannot or should not be automatically remediated.

Verktyg: I den här mening handlar observerbarhet (och svar) om användning eller användbarhet för övervakningslösningen.Utility: In this sense, observability (and response) is about the operational use or utility of the monitoring solution. Azure Monitor ger Microsofts perspektiv av våra tjänstresurser och ger dig liknande funktioner som ett lokalt övervakningssystem.Azure Monitor provides Microsoft's perspective of our service resources, and gives you similar capabilities as an on-premises monitoring system. En övervakningslösning behöver visualiseringar, till exempel instrumentpaneler och arbetsböcker, med rollbaserad åtkomst.A monitoring solution needs visualizations, such as dashboards and workbooks, with role-based access.

Ansvar: Både tjänstkonsumenten och tjänstleverantören delar i behovet av att lära sig och förbättra baserat på hårda data.Responsibility: Both the service consumer and service provider share in the need to learn and improve based on hard data. Därför måste du förstå molnleverantörens ansvar jämfört med kundens/konsumentens ansvar.As such, you need to understand the cloud provider's responsibility vs. the customer/consumer's responsibility. För varje Azure-resurs får du perspektiv baserade på loggar eller mått. Dessa data kan visas i resursspecifika instrumentpaneler eller anpassade visualiseringar baserat på dina behov och delas med nödvändiga personer i organisationen.For each Azure resource, you get perspectives based on logs or metrics, this data can be represented in resource-specific dashboards or custom visualizations based on your requirements, and shared with the necessary personas in the organization.

Anteckning

Observerbarhet är en egenskap hos ett system som härrör från systemkontrollteori.Observability is a property of a system, stemming from system control theory. Det är ett mått på hur väl systemets interna tillstånd kan härledas från systemets externa utdata, tillsammans med Controllability, en annan egenskap i ett system.It's a measure of how well the internal states of a system can be inferred from its system external outputs, along with Controllability, another property of a system. Dessutom mäter eller beräknar ett dynamiskt system systemets hälsotillstånd med tiden.In addition, a dynamical system also that over time, a state observer measures or estimates the health state of the system. Men i moderna tjänsthanteringstermer, se Microsoft Operations Framework (MOF) Tjänstövervakning och kontroll ," och ITIL (Information Technology Infrastructure Library) v3 Monitor och kontrollloop.But in modern service management terms, refer to the Microsoft Operations Framework (MOF) Service Monitoring and Control," and the Information Technology Infrastructure Library (ITIL) v3 Monitor and control loop.

Innan vi går in på detaljer om observerbarhet måste vi lyfta fram flera övervakningsrelaterade termer som vi kommer att använda:Before we go into details on observability, we need to highlight several monitoring-related terms we'll be using:

  • Tillgång: Digitala tillgångar som innehåll i filresurser, maskinvara och programvarutillgångar som även kallas mål.Asset: Digital assets such as content in file shares, hardware, and software assets that are also called targets.

  • Fokus: Ditt omfång för delmål: smal, bred, en enskild komponent, komponentklass, komponentgruppering, tjänst.Focus: Your scope in pursuit of objectives: narrow, broad, a single component, component class, component grouping, service.

  • Aspekt: Perspektiv, till exempel ur användarens perspektiv, företaget, tjänstägaren osv.Aspect: Perspectives, such as from the user's perspective, the business, service owner, etc.

  • Täckning: En indikator för synlighet och ett mål; för att se till att alla relevanta tillgångar ingår i övervakningsomfånget.Coverage: An indicator of visibility and a goal; to ensure all relevant assets are included in the monitoring scope.

  • Hanterbarhet: I vilken utsträckning en digital tillgång kan styras, självläkas, relaterad till förändringsrisker och åtgärdsgrupper som diagnostiserar eller automatiskt åtgärdar.Manageability: The extent that a digital asset can be controlled, self-heals, related to change risk and action groups that diagnose or auto remediate.

  • Datakälla Övervakningsdata för primär plats kommer från, till exempel ett Azure-lagringskonto, Azure Active Directory, anpassade källor osv.Data source The primary location monitoring data comes from, for example an Azure storage account, Azure Active Directory, custom sources, etc.

  • Frekvens Kontinuerlig eller tillfällig övervakning.Frequency Continuous vs. occasional monitoring.

Att vara uppmärksamThe art of being observant

Observerbarheten är beroende av vad som övervakas och hur.Observability relies on what is being monitored and how. I Azure finns det flera källor och var och en ger olika perspektiv på hur något beter sig.In Azure, there are multiple sources, and each delivers a different perspective of how something is behaving. Dessutom innehåller Azure flera verktyg som hjälper dig att analysera de olika aspekterna av dessa data.Not to mention, Azure includes multiple tools to help analyze the different aspects of this data. Att observera hälsa och prestanda för Azure-tjänster och icke-Azure-resurser är det huvudsakliga sättet att använda Azure Monitor och dess funktioner.Observing the health and performance of Azure services and non-Azure resources is the primary way you'll use Azure Monitor and its features. I Azure har Microsoft en omfattande katalog med tjänster, och virtuella datorer är inte det primära fokuset.In Azure, Microsoft has an extensive catalog of services, and virtual machines are not the primary focus. I Azure ger vi tjänstleverantörens perspektiv via olika plattformsloggar:In Azure, we provide the perspective of the service provider through different platform logs:

  • Service Health som rapporteras av Azure om tjänstincidenter och planerat underhåll.Service health reported by Azure about service incidents and planned maintenance.
  • Azure-aktivitetsloggen rapporterar händelser på prenumerationsnivå för alla resurser som distribueras i prenumerationen.Azure Activity log reports subscription-level events across all of the resources deployed in the subscription.
  • Azure Resource Health rapporter om dina resursers aktuella och tidigare hälsotillstånd.Azure Resource Health reports on the current and past health of your resources.
  • Azure Advisor få rekommenderade lösningar baserat på metodtips för att optimera dina Azure-distributioner.Azure Advisor to receive recommended solutions based on best practices to optimize your Azure deployments.

Alla andra perspektiv som baseras på mått och loggar levereras via de olika funktionerna i Azure Monitor.All other perspectives based on metrics and logs, are delivered through the various features of Azure Monitor. Eller, beroende på Azure-resursen, kan du visa dess plattformsmått direkt från den resursen i portalen.Or, depending on the Azure resource, you can view its platform metrics directly from that resource in the portal.

Observerbarhet är en term som är avsedd att ange förväntningen att Azure Monitor ger dig fullständig insyn i hälsa, prestanda och andra aspekter av Azure-tjänster på djupet och bredden.Observability is a term meant to set the expectation that Azure Monitor gives you total visibility of the health, performance, and other aspects of Azure services in depth and breadth. Men det finns andra aktiviteter eller fokus än övervakning av tjänster och komponenter.But, there are other activities or focus than service and component monitoring. Att vara uppmärksam bör inte betraktas som något som endast vissa personer utför efter behov, enligt deras roll eller funktion, eller som stöd för en process.Being observant shouldn't be considered something that only certain personas perform on an as-needed basis, as required by their role or function, or in support of a process. Det liknar astronomi.It's similar to astronomy. Observation är inte en gång och klar, utan du vill övervaka objekt i rymden ibland, under angivna tidsintervall eller kontinuerligt.Observation isn't once and done, rather you'll want to monitor objects in space occasionally, over set time intervals or continuously. Vissa objekt, till exempel svarta hål, är svåra att observera.Some objects, such as black holes are difficult to observe. Vilken typ av övervakning som behövs beror på konsumenten.The kind of monitoring needed depends on the consumer. Till exempel observerar astronomer av astronomer ibland, medan fysiker värdesätter långsiktig mätning och kontinuerlig övervakning av radiokoldioxidutsläpp.For example, amateur astronomers observe occasionally, while astrophysicists value the long-term measurement and continuous monitoring of radio emissions.

Med rätt planering kan du skapa en medelstor till komplex tjänst i Azure på några timmar, jämfört med veckor eller längre lokalt.With proper planning, you can create a medium to complex service in Azure in a few hours, versus weeks or longer on-premises. Om du gjorde det skulle du ordna en kombination av fler än ett dussin Azure-resurser (tjänstkomponenter) mellan regioner.If you did, you'd arrange a combination of more than a dozen Azure resources (service components) across regions. Du styr och hanterar dessa resurser med hjälp Azure Resource Manager och från att använda övervakning av resursgrupper i Azure får du en bild av tjänsten.You'll govern and manage these resources using Azure Resource Manager and from using resource group monitoring in Azure, you'll get a picture of the service. När tjänsten är i produktion är den dynamisk och flexibel.Once in production, the service is dynamical and flexible. Förbrukningen börjar öka och skala ut. Kapaciteten svarar på efterfrågan.Consumption starts to ramp up and scale out. Capacity responds to demand. Händelser inträffar och tjänstkonsumenter kan observera övervakningsdata, titta på trender och fastställa deras betydelse.Events will occur, and service consumers can observe monitoring data, look at trends, and establish their significance.

Tjänsten kan ändras på olika, oförutsägbara sätt över tid.The service can change in different, unpredictable ways over time. Därför kallar vi det här beteendet dynamiskt.Hence we refer to this behavior as dynamical. Chefer för molntjänster som observerar tjänsten över tid måste ta hänsyn till följande:Managers of cloud services observing the service over time needs to take into account that:

  • Resurser flyttas mellan platser eller geografiska platserResources move across locations or geography
  • Resurser läggs till, tas bort eller ändrasResources are added, deleted, or modified
  • Förbrukningen varierarConsumption varies

Som övervakningstjänstleverantör är ditt jobb att underlätta övervakningslösningar som ger värde som anges i följande prioritetsordning: 1) till tjänsten, 2) till intressenter och 3) till de primära konsumenterna.As a monitoring service provider, your job is to facilitate monitoring solutions that provide value listed in the following order of priority: 1) to the service, 2) to stakeholders, and 3) to the primary consumers.

Värdeströmmen måste ta hänsyn till tjänstens observerbarhet mycket tidigare och på följande sätt:Your value stream needs to consider service observability much earlier and in the following ways:

  • Den övervakar tillräckligt djup och bredd.It monitors in sufficient depth and breadth.
  • Den ger täckning över hälsomodellen (tillgänglighet, kapacitet/prestanda, säkerhet, överensstämmelse).It provides coverage across the health model (availability, capacity/performance, security, conformance).
  • Verktyget övervakar också vad tjänsten gör, inklusive slutanvändaren.It monitors utility also, what the service does, including the end-user experience.

I övervakningsstrategin rekommenderar vi att du upprättar en övervakningsplan som börjar med vad som är minimalt genomförbart eller viktigast att övervaka och observera.In the monitoring strategy, we recommend establishing a monitoring plan that starts with what is minimally viable or most important to monitor and observe. Detta kan baseras på rekommendationer från Microsoft, andra välkända källor och dina interna utvecklare eller systemtekniker beroende på resurs eller system.This can be based on recommendations from Microsoft, other reputable sources, and your internal developers or system engineers depending on the resource or system. Upprätta inledande synlighet för förbrukning, prestanda, säkerhet och tillgänglighet för resurserna i dina Azure-resursgrupper och din Azure Active Directory klientorganisation.Establish initial visibility of the consumption, performance, security, and availability of the resources in your Azure resource groups and your Azure Active Directory tenant. Genom observation lär du dig hur du tolkar data och lär dig vad som är viktigt för att finjustera och optimera hur tjänsten övervakas.Through observation, you learn how to interpret the data, and learn what's significant in order to fine-tune and optimize how the service is monitored. Värdet uppnås när värdet är inkrementellt och det finns ett samskapande av värde här eftersom konsumenterna arbetar med övervakningsteamet (eller i vissa fall tjänstleverantören) för att skapa värden tillsammans.Value is achieved when incremental, and there is a co-creation of value here in that the consumers are working with the monitoring team (or in some cases the service provider) on co-creation of value.

Observerbarheten utvecklas gradvis, med början i en minimalt fungerande övervakningsplan och arbetet med att integrera verktyg och processer pågår.Observability evolves gradually, starting with a minimally viable monitoring plan, and the effort to integrate tools and processes is underway. När du känner dig bekväm med data (det vill säga mått, loggar och transaktioner) kan du förstå beteendet och tecknen på symptom eller problem från dessa resurser eller program.As you get comfortable with the data (that is, metrics, logs, and transactions), you are able to understand the behavior and signs of symptoms or issues from those resources or applications. Genom att bekanta dig med data skapar du förtroende för att arbeta Azure Monitor och data.By getting familiar with the data, you build trust in working with Azure Monitor and the data. Genom observerbarhet får du förtroende och du kan inse orsaken och hitta svar som kan hjälpa dig:Through observability, you gain confidence and you are able to realize the cause and find answers that can help:

  • Minska övervakningsblinda prickar genom att säkerställa täckning av alla nödvändiga övervakningskomponenter.Reduce monitoring blind spots by ensuring coverage of all needed monitoring components.
  • Förbättra övervakningen av resurser och tjänster för att identifiera problemet i framtiden.Improve monitoring of resources and services to help identify the issue in the future. Fokusera på problem eller symptom som är förutsägbara och tillförlitliga.Focus on issues or symptoms that are predictable and reliable.
  • Utvärdera om detta inte förväntades, vad som kan göras för att förbättra infrastrukturen, programmet och så vidare.Evaluate if this wasn't anticipated, what can be done to improve the infrastructure, application, and so on.
  • Uteslut infrastrukturen eller programmet som källa och avgör om det kan vara en specifik webbläsare, webbläsarversion eller klientoperativsystemet som är det potentiella problemet.Rule out the infrastructure or application as the source, and determine whether a specific browser, browser version, or client operating system is the potential issue.
  • Identifiera och dokumentera eller implementera lösningar som kan användas för att minimera eventuella prestanda- eller tillgänglighetsproblem med programmet, infrastrukturen osv.Identify, and document or implement, workarounds that can be used to minimize any performance or availability issues with the application, infrastructure, etc.
  • Anpassa dig till ett programs dynamiska och komplexa karaktär.Adapt to the dynamical and complex nature of an application. Fortsätt lära dig dess normala beteendemönster för att kunna begränsa de ovanliga.Continue learning its normal behavior patterns in order to narrow in on the unusual ones.
  • Justera den typ av data som samlas in, aggregeras och varnas för för att minimera lagringskostnaden för data som du aldrig analyserar, varnar för eller visualiserar.Tune the type of data collected, aggregated, and alerted on to minimize storage cost for data you never analyze, alert on, or visualize.

Först behöver du inte längre bekymra dig om infrastrukturen eller programmet, vilket var fallet i en lokal värld. Du kan nu övervaka eller hämta övervakningsdata för att stödja behoven hos de som ansvarar för att hantera och hantera arbetsbelastningen.At first, you no longer need to worry about the infrastructure or application as was the case in an on-premises world; you are now free to monitor or obtain monitoring data to support the needs of those responsible for managing and operating the workload.

Precis som alla program- eller infrastrukturtjänster behöver en mängd olika intressenter och roller åtkomst till övervakningsfunktioner, data och rapporter.Like any application or infrastructure service, a diverse list of stakeholders and roles need access to the monitoring features, data and reports. Börja med de kärnsystemtekniker, driftleverantörer eller tjänstleverantörer som ansvarar för att stödja arbetsbelastningen innan du utökar åtkomsten till andra intressenter.Start with the core system engineers, operations, or service providers responsible for supporting the workload before extending access to other stakeholders.

Fast kontra dynamisk metodFixed versus dynamical approach

Lokal övervakning av tjänster i datacentret utförs traditionellt med en produkt som System Center Operations Manager.On-premises monitoring of services in the datacenter is traditionally undertaken with a product such as System Center Operations Manager. Operations Manager metod har en fast rot i infrastruktur och servrar, med agenter och operativsystem.Operations Manager's approach is firmly rooted in infrastructure and servers, with agents and operating systems. Programövervakning, oavsett om den är containeriserad eller inte, är upp-stack och beroende av infrastrukturövervakning av servrar i drift.Application monitoring, whether containerized or not, is up-stack and dependent on infrastructure monitoring of servers down-stack. Lodrätt ser du lösningens täckning nedifrån och upp, från nätverk och längst upp, övervakning av användarupplevelsen.Vertically, you see the solution coverage from bottom-up, starting with networking and at the top, user-experience monitoring.

Den långa historiken för IaaS-övervakning visar att observerbarheten kan fördefinieras, eller om du vill, förkompilerade.The long history of IaaS monitoring reveals that observability can be pre-defined, or if you wish, pre-engineered. En IaaS-baserad tjänst är en tjänst där produkttekniker kan skapa Operations Manager-hanteringspaket, i princip anpassa övervakningslösningen för de flesta användningsfall som stöds.An IaaS-based service is one where the product engineers can author Operations Manager management packs, in essence customizing the monitoring solution for most of the supported use cases.

I behovet av att kontrollera infrastrukturtjänster genom övervakningslösningar söker kunderna därför i de flesta fall mer av en fast metod.Thus in the need to control infrastructure services by monitoring solutions, customers seek more of a fixed approach in most cases.

En fast metod kan inte ske i molnet på grund av den nästan oändliga ordningen och kombinationerna av resurser både i utrymme och i tid.A fixed approach cannot occur in the cloud given the near infinite arrangement and combinations of resources both in space and in time. Varje tjänst kan vara unik.Each service can be unique. Tjänstobservabilitet i Azure måste byggas beroende på tjänstens flexibla natur (det vill säga dynamisk, global, motståndskraftig, användarcentrerad och så vidare) eller enligt en uppsättning arkitekturmallar som kanske inte finns ännu.Service observability in Azure must be built depending on the flexible nature of the service (that is, dynamical, global, resilient, user-centric, and so on) or according to some set of architectural templates, which may not yet exist.

Observerande är sedan först och främst avgörande för att holistiskt se hur alla komponenter fungerar tillsammans innan de etablerar händelse signifikans (aviseringar, sammanfattningar, arbetsböcker osv.).Observability then, is first and paramount to holistically seeing how all components are working together before establishing event significance (alerts, digests, workbooks, etc.).

Molntjänstövervakning är återigen mycket mer flexibel och dynamisk med snabbare ändringshastighet.Again, cloud service monitoring is much more flexible and dynamical with faster speed of change.

ÖvervakningsplanMonitoring plan

Du skapar en övervakningsplan för att beskriva mål, krav och annan viktig information.You create a monitoring plan to describe the goals and objectives, requirements, and other important details. Arbeta sedan med att begära ett avtal mellan alla relevanta intressenter i organisationen.Then work to solicit an agreement between all of the relevant stakeholders in the organization. En övervakningsplan bör förklara hur du utvecklar och använder en eller flera övervakningslösningar.A monitoring plan should explain how to develop and operate one or more monitoring solutions. Börja utveckla dina övervakningsplaner tidigt under projektets strategi- och planeringsfaser.Begin develop your monitoring plans early during the strategy and planning phases of the project.

När du skapar planen är det viktigt att tänka på de fem disciplinerna för modern övervakning – observera, mäta, svara och lära dig och förbättra.While creating the plan, it is important to keep in mind the five disciplines of modern monitoring - observe, measure, respond, and learn and improve.

Följande ger en rekommenderad översikt och anses vara de viktigaste övervägandena för en enskild plan för tjänster eller när du standardiserar molntjänstfunktioner som Azure-resurstyper eller Microsoft 365 tjänster.The following provides a recommended outline and are considered to be the primary considerations for an individual plan for services or when standardizing cloud service features such as Azure resource types or Microsoft 365 services. Grunden i planen är att definiera synlighetslinjen mellan tjänstleverantören (vem kommer att sätta in lösningar) och konsumenter (vem som ska driva eller härleda värde).The essence of the plan is to define the line of visibility between service provider (who will field solutions) and consumers (who will operate or derive value).

Schemat för när (och hur) är också viktigt att ta med för arbetshanteringsmetoden (till exempel DevOps kontra vattenfall).The schedule of when (and how) is also important to include for the work management approach (for example, DevOps vs. waterfall).

AffärsperspektivBusiness perspective

En omfattande övervakningsplan måste ta hänsyn till vad verksamheten behöver med och från övervakningen, och detta måste innehålla ett användarcentrerat fokus.A comprehensive monitoring plan needs to take into consideration what the business needs with and from monitoring, and this must include a user-centric focus. När du definierar planen är det viktigt att dokumentera och dela affärskraven, och följande föreslår omfattningen av den här delen av planen.While defining the plan, it's important to document and share the business requirements, and the following suggests the scope of this part of the plan.

  • Intressenter och konsumenterStakeholders and consumers
  • Dataströmmar och processer för affärsvärdenBusiness value streams and processes
  • Slutanvändarperspektiv och -verktygEnd-user perspective and utility
  • Krav för mätning och rapporteringMeasurement and reporting requirements
  • Identifierade risker och ramverk för efterlevnadskontrollIdentified risks and compliance control frameworks
  • Åtkomst- och kontrollkravAccess and control requirements
  • Risk för verksamhetenRisk to the business

TjänstperspektivService perspective

En omfattande övervakningsplan måste ta hänsyn till vad tjänstägarna behöver med och från övervakningen.A comprehensive monitoring plan needs to take into consideration what the service owners need with and from monitoring. När du definierar planen är det viktigt att dokumentera och dela deras krav, och följande föreslår omfattningen av den här delen av planen.While defining the plan, it's important to document and share their requirements, and the following suggests the scope of this part of the plan.

  • Intressenter och konsumenterStakeholders and consumers
  • Roller och ansvarRoles and accountability's
  • Definition av tjänstenDefinition of the service
  • Åtkomst- och kontrollkravAccess and control requirements
  • Arkitekturöverväganden?Architectural considerations?
  • Leverantör och partner som ligger till grund för kontraktSupplier and partner underpinning contracts
  • Serviceavtal (SLA, OLA)Service Agreements (SLAs, OLAs)
  • Identifiera täckning för servicegarantiIdentify Service Warranty coverage
  • Krav för mätning och rapporteringMeasurement and reporting requirements
  • RiskerRisks

TeknikperspektivTechnology perspective

Det här avsnittet av planen representerar övervakningslösningen med hjälp av information från affärs- och tjänstperspektivet.This section of the plan represents the monitoring solution using information from the business and service perspective.

  • Användarberättelser och scenarierUser stories and scenarios
  • Tekniska mål (till exempel nätverk)Technical targets (for example, networking)
  • Mappning av komponentberoendeComponent dependency mapping
  • Typer (till exempel molnbaserade, hybridbaserade, lokala)Types (for example, cloud native, hybrid, on-premises)
  • ObservationellaObservational
  • DynamiskResponsive
  • MåttMeasurement
  • Justering och optimeringTuning and Optimization

Viktiga övervägandenKey considerations

Sammanfatta planen för att säkerställa att den kommunicerar och informerar alla relevanta konsumenter, intressenter och hanteringsnivåer.Summarize the plan to ensure it communicates and informs all relevant consumers, stakeholders, and management levels.

  • Produktionssteg: Övervakningslösningen bör vara redo för värde när tjänsten är aktiv, så planering kan inkludera labb- eller förproduktionskonfiguration (det vill säga i en annan prenumeration som är dedikerad för att stödja detta) för att experimentera med och testa dina antaganden.Production stages: The monitoring solution should be ready for value when the service goes live, so planning can include lab or pre-production configuration (that is, in another subscription dedicated to supporting this) to experiment with and test your assumptions. I molnet är en produktionsklient vanligtvis säker baserat på den övergripande styrningen.In the cloud, a production tenant is usually safe based on the overall governance.

  • Strategi: Planer kan också mappa tillbaka till övervakning och IT-strategi så att övervakningsmålen spåras tillbaka till affärsidén eller verksamheten.Strategy: Plans can also map back to Monitoring and IT strategy so that the monitoring objectives trace back to the mission or business. Den är beroende av om arbetsbelastningen är ett inbyggt molnIt's dependent on if the workload is native cloud

  • Mål: I planen bör du beskriva och analysera de måltillgångar eller tjänster som övervägs och vid behov mappa alla komponenter som ska övervakas för att inkludera tjänstberoenden.Targets: In the plan, you should describe and analyze the target asset(s) or service(s) under consideration and if needed, map all of the components to be monitored to include service dependencies. Identifiera luckor i täckningen och ta reda på vem som äger delar av tjänsten.Identify coverage gaps and determine who owns parts of the service.

  • Lösning: Identifiera konsumenter, intressenter, leverantörer, partner, åtkomst och instrumentation för övervakningslösningen.Solution: For the monitoring solution, identify the consumers, stakeholders, suppliers, partners, access, and instrumentation. Övervakning av aspekter, fokus, svar, rapporter och instrumentpaneler (tillgänglighet, säkerhet, användarupplevelse och så vidare).Also monitoring aspects, focus, response, and reports and dashboards (availability, security, user experience, and so on).

Lean och flexibla övervägandenLean and agile considerations

  • Minsta fungerande produkt: Låt planen definiera den minsta fungerande produkten, det vill säga vad som ursprungligen behövs för att gå live, och fortsätt sedan att utveckla övervakningslösningen för att maximera värdet.Minimum viable product: Let the plan define the minimum viable product, that is what is initially needed to go live, then continue to evolve the monitoring solution to maximize value. Du kan till exempel definiera en framtida uppgift senare för att skapa andra loggbaserade arbetsböcker, fästa på Azure-instrumentpaneler och utöka intressenternas åtkomst till Azure Portal.For example, you may define a future task later to build other log-based workbooks, pinning to Azure dashboards, and expanding stakeholder access to the Azure portal.

  • Börja där du är och få ett värde snabbt: Experimentera snabbt och drastigt, utnyttja med SaaS utan problem, eftersom det är enkelt och värdefullt.Start where you are and get value fast: Rapidly and radically experiment, exploit with SaaS out of the box, because it's easy and valuable.

  • Känna till skyddsräcken: Molnet är nytt och osäkert, så låt experter vägleda dig så att du inte lägger till risker (till exempel exponera känsliga övervakningsdata).Know the guardrails: Cloud is new and uncertain, so let experts guide you so that you don't add risk (for example, expose sensitive monitoring data).

  • Microsoft 365 är beroende av Azure: En bra plan ser din Azure-klientorganisation Microsoft 365 en viktig aktör.Microsoft 365 depends on Azure: Any good plan considers your Azure tenant with Microsoft 365 as a major player. Microsoft 365 är beroende av Azure AD och Azure Monitor ger Microsoft 365 integrering med slutpunktshantering.Microsoft 365 depends on Azure AD, and Azure Monitor provides Microsoft 365 integration with endpoint management.

  • Observerande vinner: Fokusera på total synlighet innan aviseringar, eftersom aviseringar nu är en kostnad.Observability wins: Focus on total visibility before alerting, as alerting is now a cost.

  • Loggarkitektur: Utsändar, telemetri, signaler, AI och förpaketerade lösningar som Intelligent Security Graph.Log architecture: Emitters, telemetry, signals, AI, and prepackaged solutions such as the Intelligent Security Graph. Fokusera mer på en SIEM-metod, hur du samla in olika loggar i logglösningar, till exempel Azure Monitor loggar.Focus more on a SIEM approach, how to amass disparate logs into log solutions such as Azure Monitor Logs.

  • Flytta data: Mycket mer övervakning fokuserar på "emitter-to-dashboard" och var data skickas via Internet och i dina molnregioner, ExpressRoute-anslutningar och VPN:er.Moving data: Much more monitoring focus on emitter-to-dashboard and where data is going over the internet and across your cloud regions, ExpressRoute connections, and VPNs.

  • Aktivitetsövervakning: Granskning, inloggning och aktivitetsloggar är nu enkla att dela upp och dela upp för tjänstägare och säkerhet.Activity monitoring: Audit, sign in, and Activity Logs are now easy to slice and dice for service owners and security.

Nästa stegNext steps