Monitorování výkonu, stavu a využití Azure Průzkumník dat s metrikami

Metriky Azure Průzkumník dat poskytují klíčové indikátory pro stav a výkon prostředků clusteru Azure Průzkumník dat. Pomocí metrik, které jsou popsané v tomto článku, můžete monitorovat využití clusteru Azure Průzkumník dat, stav a výkon v konkrétním scénáři jako samostatné metriky. Metriky můžete použít také jako základ pro operační řídicí panely Azure a výstrahy Azure.

Další informace o službě Azure Průzkumník metrik najdete v tématu Průzkumník metrik.

Požadavky

Monitorování prostředků Azure Průzkumník dat pomocí metrik

  1. Přihlaste se k webu Azure Portal.
  2. V levém podokně clusteru Azure Průzkumník dat vyhledejte metriky.
  3. Vyberte metriky a otevřete podokno metriky a začněte analyzovat v clusteru. Vyhledejte a vyberte metriky v Azure Portal.

Práce v podokně metriky

V podokně metriky vyberte konkrétní metriky, které chcete sledovat, zvolte způsob agregace dat a vytvořte grafy metrik pro zobrazení na řídicím panelu.

Pro váš cluster Azure Průzkumník dat se předem vybraly výběry oboru názvů prostředků a metriky . Čísla na následujícím obrázku odpovídají číslovanému seznamu níže. Provede vás různými možnostmi při nastavování a zobrazování metrik.

Podokno metriky.

  1. Chcete-li vytvořit graf metriky, vyberte možnost název metriky a relevantní agregace na metriku. Další informace o různých metrikách najdete v tématu podporované metriky služby Azure Průzkumník dat.
  2. Výběrem Přidat metriku zobrazíte více metrik vykreslených ve stejném grafu.
  3. Vyberte + Nový graf pro zobrazení více grafů v jednom zobrazení.
  4. Pomocí nástroje pro výběr času můžete změnit časový rozsah (výchozí: posledních 24 hodin).
  5. Použijte přidejte filtr a použijte rozdělení pro metriky, které mají rozměry.
  6. Vyberte Připnout na řídicí panel , abyste mohli přidat konfiguraci grafu do řídicích panelů, abyste ho mohli znovu zobrazit.
  7. Nastavte nové pravidlo výstrahy pro vizualizaci metrik pomocí zadaných kritérií. Nové pravidlo upozorňování bude obsahovat cílový prostředek, metriku, rozdělení a filtrování dimenzí v grafu. Tato nastavení upravte v podokně vytvoření pravidla výstrahy.

Podporované metriky služby Azure Průzkumník dat

Metriky služby Azure Průzkumník dat poskytují přehled o celkovém výkonu i využití vašich prostředků a také informace o konkrétních akcích, jako je například ingestování nebo dotazování. Metriky v tomto článku byly seskupeny podle typu použití.

Typy metrik jsou:

Abecední seznam metrik Azure Monitor pro Průzkumníka dat Azure najdete v tématu podporované metriky clusterů azure Průzkumník dat.

Metriky clusteru

Metrika clusteru sleduje obecný stav clusteru. Například využití prostředků a příjmu a odezvy.

Metrika Jednotka Agregace Popis metriky Dimenze
Využití mezipaměti Procento Střední, Max, min Procento přidělených prostředků mezipaměti, které v clusteru jsou aktuálně používány. Mezipaměť je velikost jednotky SSD přidělená pro aktivity uživatelů podle definovaných zásad mezipaměti.

Průměrné využití mezipaměti na úrovni 80 % nebo méně znamená pro cluster udržitelný stav. Pokud je průměrné využití mezipaměti nad 80%, cluster by měl být
škálované na cenovou úroveň optimalizované pro úložiště nebo
škálované na více instancí. Další možností je upravit zásady mezipaměti (méně dní v mezipaměti). Pokud využití mezipaměti překračuje 100 %, znamená to, že velikost dat, která se mají ukládat podle zásad ukládání do mezipaměti, je větší než celková velikost mezipaměti v clusteru.
Žádné
Procesor Procento Střední, Max, min Procento přidělených výpočetních prostředků, které jsou aktuálně používány počítači v clusteru.

Průměrná hodnota CPU na úrovni 80 % nebo méně je pro cluster udržitelná. Maximální hodnota CPU je 100 %. Znamená, že nejsou k dispozici žádné další výpočetní prostředky pro zpracování dat.
Pokud cluster nefunguje dobře, zkontrolujte maximální hodnotu CPU, abyste zjistili, jestli jsou blokované konkrétní procesory.
Žádné
Využití příjmu dat Procento Střední, Max, min Procento prostředků využitých k příjmu dat z celkových prostředků pro realizaci příjmu dat přidělených v rámci zásad kapacity. Výchozími zásadami kapacity je maximálně 512 souběžných operací příjmu dat nebo 75 % prostředků clusteru zapojených do příjmu dat.

Průměrné využití příjmu dat na úrovni 80 % nebo méně znamená pro cluster udržitelný stav. Maximální hodnota využití příjmu dat je 100 %. Znamená, že se využívá veškerá schopnost clusteru ingestovat data a výsledkem může být fronta pro příjem dat.
Žádné
InstanceCount Počet Průměr Celkový počet instancí
Zachovat naživu Počet Průměr Sleduje rychlost odezvy clusteru.

Plně responzivní cluster vrátí hodnotu 1 a blokovaný nebo odpojený cluster vrátí hodnotu 0.
Celkový počet příkazů s omezením Počet Střední, Max, min, Sum Počet příkazů s omezením (zamítnutých) v clusteru, protože bylo dosaženo maximálního povoleného počtu souběžných (paralelních) příkazů. Žádné
Celkový počet rozsahů Počet Střední, Max, min, Sum Celkový počet rozsahů dat v clusteru.

Změny v této metrikě můžou znamenat obrovské změny struktury dat a vysoké zatížení clusteru, protože sloučení rozsahů dat je náročné na procesor.
Žádné

Exportovat metriky

Metriky exportu sledují obecný stav a výkon operací exportu, jako je opožděnost, výsledky, počet záznamů a využití.

Metrika Jednotka Agregace Popis metriky Dimenze
Průběžný export počtu exportovaných záznamů Počet Sum Počet exportovaných záznamů ve všech úlohách průběžného exportu. ContinuousExportName
Maximální zpoždění průběžného exportu Počet Maximum Zpoždění (v minutách) hlášené úlohami průběžného exportu v clusteru. Žádné
Počet nevyřízených položek průběžného exportu Počet Maximum Počet probíhajících úloh průběžného exportu. Tyto úlohy jsou připravené ke spuštění, ale čekají ve frontě, pravděpodobně z důvodu nedostatečné kapacity.
Výsledek průběžného exportu Počet Počet Výsledek selhání/úspěšnost každého spuštění průběžného exportu. ContinuousExportName
Využití exportu Procento Maximum Využitá kapacita exportu z celkové kapacity exportu v clusteru (mezi 0 a 100). Žádné

Metriky příjmu

Metriky příjmu sledují celkový stav a výkon operací přijímání, jako je latence, výsledky a objem. Upřesnění vaší analýzy:

  • Použijte filtry na grafy k vykreslení částečných dat podle dimenzí. Prozkoumejte například ingestování na konkrétní Database .
  • Použijte rozdělování do grafu pro vizualizaci dat podle různých komponent. Tento proces je užitečný při analýze metrik, které jsou hlášeny každým krokem kanálu přijímání, například Blobs received .
Metrika Jednotka Agregace Popis metriky Dimenze
Počet objektů BLOB dávky Počet Střední, Max, min Počet zdrojů dat v hotové dávce pro ingestování. databáze
Doba trvání dávky Sekundy Střední, Max, min Doba trvání fáze dávkování v toku přijímání. databáze
Velikost dávky Bajty Střední, Max, min Nekomprimovaná očekávaná velikost dat v agregované dávce pro přijímání. databáze
Zpracované dávky Počet Sum, Max, min Počet dávek dokončených pro přijímání.
Batching Type: Trigger pro zapečetění dávky.
Úplný seznam typů dávkování najdete v tématu typy dávkování.
Databáze, typ dávkování
Počet přijatých objektů BLOB Počet Sum, Max, min Počet objektů BLOB přijatých komponentou ze vstupního datového proudu.

Jednotlivé komponenty můžete analyzovat pomocí použít rozdělení .
Databáze, typ komponenty, název součásti
Zpracované objekty blob Počet Sum, Max, min Počet objektů BLOB zpracovaných součástí

Jednotlivé komponenty můžete analyzovat pomocí použít rozdělení .
Databáze, typ komponenty, název součásti
Vynechané objekty blob Počet Sum, Max, min Počet objektů BLOB trvale vyřazených součástí U každého takového objektu BLOB Ingestion result se pošle metrika s důvodem selhání.

Jednotlivé komponenty můžete analyzovat pomocí použít rozdělení .
Databáze, typ komponenty, název součásti
Latence zjišťování Sekundy Průměr Doba ze služby data až do zjišťování pomocí datových připojení. Tento čas není zahrnutý v latenci fáze nebo v metrikách latence příjmu. Typ komponenty, název součásti
Přijaté události Počet Sum, Max, min Počet událostí přijatých datovými připojeními ze vstupního datového proudu. Typ komponenty, název součásti
Zpracované události Počet Sum, Max, min Počet událostí zpracovaných datovými připojeními. Typ komponenty, název součásti
Vyřazené události Počet Sum, Max, Min Počet událostí trvale vyřazených datovými připojeními Typ komponenty, Název komponenty
Zpracované události (pro Event/IoT Hubs) Počet Max, Min, Sum Celkový počet událostí přečtených Event Hubs a zpracovaných clusterem. Tyto události jsou rozdělené do dvou skupin: odmítnuté události a události přijaté clusterovým strojem. Status
Latence příjmu dat Sekundy Avg, Max, Min Latence přijatých dat, od okamžiku, kdy byla data v clusteru přijata, až do doby, kdy jsou připravena pro dotazy. Období latence příjmu dat závisí na scénáři příjmu dat. Žádné
Výsledek příjmu dat Počet Sum Celkový počet zdrojů, u které došlo k selhání nebo úspěšnému ingestování.
Status: Status úspěšného příjmu dat nebo kategorie selhání v případě selhání. Úplný seznam možných kategorií selhání najdete v tématu Kódy chyb příjmu dat v Azure Data Explorer.
Failure Status Type: Jestli je selhání trvalé nebo přechodné. Pro úspěšný příjem dat je tato dimenze None .

Poznámka:
  • Event Hub a IoT Hub událostí příjmu dat se předem agregují do jednoho objektu blob a pak se zachází jako s jedním zdrojem, který se má ingestovat. Proto se události agregované předem zobrazují jako jeden výsledek příjmu dat po předběžné agregaci.

  • Přechodná selhání se interně opakují na omezený počet pokusů. Každé přechodné selhání se hlásí jako přechodný výsledek příjmu dat. Proto může jeden příjem dat vést k více než jednomu výsledku příjmu dat.
Stav, Typ stavu selhání
Objem příjmu dat (v MB) Počet Max, Sum Celková velikost dat ingestovaných do clusteru (v MB) před kompresí. databáze
Délka fronty Počet Průměr Počet čekajících zpráv ve vstupní frontě komponenty Typ komponenty
Nejstarší zpráva fronty Sekundy Průměr Čas v sekundách od vložení nejstarší zprávy ve vstupní frontě komponenty. Typ komponenty
Přijatá velikost dat – bajty Bajty Avg, Sum Velikost dat přijatých datovými připojeními ze vstupního streamu Typ komponenty, Název komponenty
Latence fáze Sekundy Průměr Čas od přijetí zprávy komponentou Azure Data Explorer, dokud komponenta pro příjem dat nepřijímá její obsah ke zpracování.

Pokud chcete zobrazit celkovoulatenci příjmu dat, použijte filtry a vyberte Typ komponenty StrojStorage.
Databáze, typ komponenty

Metriky ingestování streamování

Metriky příjmu streamování sledují data příjmu streamování a rychlost požadavků, dobu trvání a výsledky.

Metrika Jednotka Agregace Popis metriky Dimenze
Datová rychlost příjmu streamování Počet RateRequestsPerSecond Celkový objem dat ingestovaných do clusteru Žádné
Doba trvání příjmu streamování Milisekund Avg, Max, Min Celková doba trvání všech požadavků na příjem streamování Žádné
Četnost požadavků příjmu streamování Počet Count, Avg, Max, Min, Sum Celkový počet požadavků na příjem streamování Žádné
Výsledek příjmu streamování Počet Průměr Celkový počet požadavků na příjem streamování podle typu výsledku Výsledek

Metriky dotazů

Metriky výkonu dotazů sledují dobu trvání dotazu a celkový počet souběžných nebo omezování dotazů.

Metrika Jednotka Agregace Popis metriky Dimenze
Doba trvání dotazu Milisekund Avg, Min, Max, Sum Celková doba do přijetí výsledků dotazu (nezahrnuje latenci sítě). Stav dotazu
Dotazvýsledek Počet Počet Celkový počet dotazů Stav dotazu
Celkový počet souběžných dotazů Počet Avg, Max, Min, Sum Počet dotazů běžících paralelně v clusteru. Tato metrika je dobrým způsobem, jak odhadnout zatížení clusteru. Žádné
Celkový počet dotazů s omezením Počet Avg, Max, Min, Sum Počet omezení (zamítnutých) dotazů v clusteru. Maximální povolený počet souběžných (paralelních) dotazů je definovaný v zásadách omezení frekvence požadavků. Žádné

Metriky materializovaného zobrazení

Metrika Jednotka Agregace Popis metriky Dimenze
MaterializedViewHealth 1, 0 Průměr Hodnota je 1, pokud se zobrazení považuje za v pořádku, jinak 0. Database, MaterializedViewName
MaterializedViewAgeSeconds Sekundy Průměr Zobrazení je definováno aktuálním časem minus čas posledního příjmu dat age zpracovaným zobrazením. Hodnota metriky je čas v sekundách (nižší hodnota je, zobrazení je "healthier"). Database, MaterializedViewName
MaterializedViewResult 1 Průměr Metrika zahrnuje dimenzi určující výsledek posledního materializačního cyklu (podrobnosti o možných hodnotách najdete v metrikě ResultResult Hodnota metriky se vždy rovná 1. Database, MaterializedViewName, Result
MaterializedViewRecordsInDelta Počet záznamů Průměr Počet záznamů aktuálně v nezpracujené části zdrojové tabulky. Další informace najdete v článku o tom, jak materializovaná zobrazení fungují. Database, MaterializedViewName
MaterializedViewExtentsRebuild Počet rozsahů Průměr Počet rozsahů znovu sestavených v materializačním cyklu Database, MaterializedViewName
MaterializedViewDataLoss 1 Maximum Metrika se aktivuje, když se nezpracovaná zdrojová data blíží uchovávání. Označuje, že materializované zobrazení není v pořádku. Database, MaterializedViewName, Kind

Další kroky