Použití prohlížeče úloh a zobrazení úloh pro Azure Data Lake Analytics
Služba Azure Data Lake Analytics archivuje odeslané úlohy do úložiště dotazů. V tomto článku se naučíte, jak pomocí prohlížeče úloh a zobrazení úloh v Nástroje Azure Data Lake pro Visual Studio najít historické informace o úlohách.
Ve výchozím nastavení služba Data Lake Analytics archivuje úlohy po dobu 30 dnů. Dobu platnosti můžete nakonfigurovat z Azure Portal konfigurací přizpůsobených zásad vypršení platnosti. Po vypršení platnosti nebude možné získat přístup k informacím o úloze.
Požadavky
Požadavky sady Visual Studio najdete v tématu Data Lake Tools for Visual Studio.
Otevřete prohlížeč úloh.
Přístup k prohlížeči úloh prostřednictvím Průzkumník serveru>Azure>Data Lake Analytics>úloh v aplikaci Visual Studio. Pomocí prohlížeče úloh můžete získat přístup k úložišti dotazů účtu Data Lake Analytics. Prohlížeč úloh zobrazuje na levé straně úložiště dotazů, zobrazuje základní informace o úlohách a zobrazení úloh na pravé straně znázorňující podrobné informace o úlohách.
Zobrazení úlohy
Zobrazení úlohy zobrazuje podrobné informace o úloze. K otevření úlohy můžete dvakrát kliknout na úlohu v prohlížeči úloh nebo otevřít z nabídky Data Lake kliknutím na zobrazení úlohy. Měl by se zobrazit dialogové okno naplněné adresou URL úlohy.

Zobrazení úlohy obsahuje:
Souhrn úlohy
Aktualizujte zobrazení úlohy a podívejte se na nejnovější informace o spuštěných úlohách.
Stav úlohy (graf):
Stav úlohy popisuje fáze úlohy:

Příprava: nahrání skriptu do cloudu, kompilování a optimalizace skriptu pomocí služby kompilace.
Ve frontě: úlohy se zařadí do fronty, když čekají na dostatek prostředků, nebo úlohy překračují maximální počet souběžných úloh na účet. Nastavení priority určuje pořadí úloh ve frontě – čím nižší je číslo, tím vyšší je priorita.
Spuštěno: úloha je ve skutečnosti spuštěná v účtu Data Lake Analytics.
Finalizace: úloha se dokončuje (například finalizace souboru).
Úloha může selhat v každé fázi. Například chyby kompilace ve fázi přípravy, chyby časového limitu ve frontě a chyby spuštění ve fázi běhu atd.
Základní informace
Základní informace o úloze se zobrazí v dolní části panelu souhrnu úlohy.

- Výsledek úlohy: úspěch nebo neúspěch. Úloha se nemusí podařit v každé fázi.
- Celková doba trvání: hodiny na zdi (doba trvání) mezi odesláním času a časem ukončení.
- Celkový výpočetní čas: součet každého času spuštění vrcholu, můžete ho zvážit jako čas, kdy se úloha spustí jenom v jednom vrcholu. Další informace o vrcholu najdete v části celkový počet vrcholů.
- Čas odeslání/začátek/konec: čas, kdy služba Data Lake Analytics obdrží odeslání nebo spuštění úlohy, nebo se úloha úspěšně ukončí.
- Kompilace/Queueed/Running: doba na zdi strávená během fáze přípravy/zařazení do fronty/spuštění.
- Účet: účet Data Lake Analytics, který se používá ke spuštění úlohy.
- Autor: uživatel, který úlohu odeslal, může to být účet reálné osoby nebo systémový účet.
- Priorita: priorita úlohy. Čím nižší číslo, tím vyšší Priorita. Ovlivňuje jenom pořadí úloh ve frontě. Nastavením vyšší priority nedojde k přerušení spuštěných úloh.
- Paralelismus: požadovaný maximální počet souběžných Azure Data Lake Analyticsch jednotek (ADLAUs), označovaných také jako vrcholy. V současné době je jeden vrchol stejný jako jeden virtuální počítač se dvěma virtuálními jádry a šesti GB paměti RAM, ale můžete ho upgradovat v budoucích Data Lake Analytics aktualizacích.
- Zbývajících bajtů: bajtů, které je třeba zpracovat, dokud se úloha nedokončí.
- Přečtené a zapsané bajty: bajtů načtených/zapsaných od spuštění úlohy.
- Celkový počet vrcholů: úloha je rozdělená do mnoha pracovních částí, každá práce se nazývá vrchol. Tato hodnota popisuje, kolik částí práce se úloha skládá z. Můžete uvažovat o vrcholu jako na základní jednotce procesu, označované také jako Azure Data Lake Analytics jednotka (ADLAU) a vrcholy lze spustit paralelně.
- Dokončeno/spuštěno/selhalo: počet dokončených/spuštěných/neúspěšných vrcholů. Vrcholy mohou selhat z důvodu chyby v uživatelském kódu a systému, ale systém opakuje automaticky selhání vrcholů. Pokud se vrchol stále nezdařil po opakování, celá úloha selže.
Graf úlohy
Skript U-SQL představuje logiku transformace vstupních dat do výstupních dat. Skript je zkompilován a optimalizován pro fyzický plán spuštění ve fázi přípravy. Graf úlohy je zobrazit plán fyzického spuštění. Následující obrázek znázorňuje proces:

Úloha je rozdělená do mnoha částí práce. Každý díl práce se nazývá vrchol. Vrcholy jsou seskupené jako super vrcholy (označované také jako fáze) a vizuálů jako graf úlohy. Fáze zelené fáze placards v grafu úlohy zobrazují fáze.
Každý vrchol ve fázi má stejný druh práce s různými částmi stejných dat. Například pokud máte soubor s jedním z TB dat a z něj jsou čteny stovky vrcholů, každý z nich čte blok. Tyto vrcholy se seskupují ve stejné fázi a provádějí stejnou práci na různých kusech stejného vstupního souboru.
-
V určité fázi se na štítku zobrazí některá čísla.

SV1 Extract: název fáze pojmenovanou číslem a metodou operace.
84 vrcholů: celkový počet vrcholů v této fázi. Obrázek označuje, kolik pracovních částí je v této fázi rozděleno.
12,90 s/vrchol: Průměrná doba provádění vrcholu pro tuto fázi. Tento obrázek se vypočítá pomocí SUM (každý čas spuštění vrcholu)/(celkový počet vrcholů). To znamená, že pokud jste mohli přiřadit všechny vrcholy provedené paralelně, je celá fáze dokončena v 12,90 s. Také to znamená, že veškerá práce v této fázi se provádí po sériovém stavu, náklady budou #vertices × Průměrná doba.
850 895 řádků: celkový počet řádků napsaný v této fázi.
R/W: objem dat přečtených a zapsaných v této fázi v bajtech.
Barvy: ve fázi se používají barvy k označení jiného stavu vrcholu.
- Zelená značí, že vrchol byl úspěšný.
- Oranžová označuje opakování vrcholu. Vrchol opakovaného pokusu se nezdařil, ale systém byl automaticky opakován a úspěšně proveden a celková fáze byla úspěšně dokončena. Pokud se znovu pokusíte vrcholu, ale pořád se nezdařil, barva se změní na červenou a celá úloha se nezdařila.
- Červená signalizuje neúspěch, což znamená, že určitý vrchol byl systémem opakován několikrát, ale stále se nezdařil. Tento scénář způsobí selhání celé úlohy.
- Blue znamená, že je spuštěný určitý vrchol.
- Bílá indikuje, že vrchol čeká. Vrchol může čekat na naplánování, jakmile bude ADLAU k dispozici, nebo může čekat na vstup, protože vstupní data nemusí být připravena.
Další podrobnosti o této fázi najdete po přesunutí ukazatele myši na jeden stav:

Vrcholy: popisuje podrobnosti vrcholů, například počet vrcholů v celkovém počtu dokončených vrcholů, jejich selhání nebo stále spuštěný/čekající atd.
Čtení dat mezi/v: soubory a data se ukládají v systému souborů s více lusky. Hodnota zde popisuje, kolik dat bylo přečteno ve stejném nebo více pod.
Celkový výpočetní čas: součet všech časů provádění vrcholu ve fázi můžete zvážit jako čas, který by měl trvat, pokud se veškerá práce ve fázi spustí jenom v jednom vrcholu.
Zapsané/přečtené data a řádky: Určuje, kolik dat nebo řádků bylo přečteno/zapsáno nebo je nutné je přečíst.
Selhání čtení vrcholu: popisuje, kolik vrcholů se při čtení dat nezdařilo.
Duplicitní zahození vrcholu: Pokud je vrchol spuštěný příliš pomalu, systém může naplánovat spuštění stejné práce pomocí více vrcholů. Po úspěšném dokončení jednoho z vrcholů se odeberou vrcholy. Při duplicitním zahození vrcholu se zaznamenává počet vrcholů, které se ve fázi zahodí jako duplicity.
Odvolání vrcholů: vrchol byl úspěšně proveden, ale z nějakého důvodu jej znovu spusťte později. Pokud například u podřízeného vrcholu dojde ke ztrátě zprostředkujících vstupních dat, požádá o opětovné spuštění počátečního vrcholu.
Spuštění plánu vrcholu: celková doba, po kterou byly vrcholy naplánovány.
Minimum/průměr/maximum přečtených dat vrcholů: minimum/průměr/maximum každého vrcholu dat pro čtení.
Doba trvání: hodinová doba na zdi, kterou fáze trvá, musíte načíst profil a zobrazit tuto hodnotu.
Přehrávání úloh
Data Lake Analytics spouští úlohy a archivuje vrcholy, ve kterých se spouštějí informace o úlohách, například když jsou vrcholy spouštěny, zastaveny, selhání a způsob opakování, atd. Všechny informace se automaticky přihlásí do úložiště dotazů a uloží se do svého profilu úlohy. Profil úlohy si můžete stáhnout přes profil zatížení v zobrazení úloh a po stažení profilu úlohy si můžete zobrazit přehrávání úlohy.
Přehrávání úloh je epitomeá vizualizace toho, co se stalo v clusteru. Pomáhá sledovat průběh provádění úlohy a vizuálně zjistit anomálie výkonu a kritická místa v velmi krátké době (méně než 30 s obvykle).
Zobrazení Heat mapy úlohy
Heat mapa úlohy se dá vybrat prostřednictvím rozevíracího seznamu zobrazení v grafu úloh.

Zobrazuje vstupně-výstupní, časovou a propustnostní mapu úlohy, pomocí kterých můžete najít, kde se úloha ve většině času tráví, nebo jestli je úloha hranice vstupně-výstupních operací, a tak dále.

- Průběh: průběh provádění úlohy, viz informace v části informace o fázi.
- Čtení a zápis dat: Heat mapa celkových dat přečtených a zapsaných v každé fázi.
- Výpočetní čas: Heat mapa SOUČTu (každý čas spuštění vrcholu), můžete to vzít v úvahu, jak dlouho bude trvat, pokud se spustí veškerá práce ve fázi s pouze 1 vrcholem.
- Průměrná doba provádění na uzel: Heat mapa SOUČTu (každý čas spuštění vrcholu)/(číslo vrcholu). To znamená, že pokud byste mohli přiřadit všechny vrcholy provedené paralelně, bude v tomto časovém rámci provedena celá fáze.
- Vstupní/výstupní propustnost: Heat mapa propustnosti vstupu a výstupu v jednotlivých fázích, můžete potvrdit, jestli se jedná o úlohu s vstupně-výstupními operacemi.
-
Operace s metadaty
V rámci skriptu U-SQL můžete provádět některé operace s metadaty, jako je například vytvoření databáze, vyřazení tabulky atd. Tyto operace jsou po kompilaci zobrazeny v operaci s metadaty. Můžete najít kontrolní výrazy, vytvořit entity, sem přetáhněte entity.

Historie stavu
Historie stavu je také vizuálně shrnutá v souhrnu úlohy, ale tady můžete získat další podrobnosti. Můžete najít podrobné informace, jako je například při přípravě úlohy, ve frontě spuštěno, ukončeno. Můžete také zjistit, kolikrát byla úloha zkompilována (CcsAttempts: 1), kdy je úloha do clusteru skutečně odeslána (podrobnosti: odeslání úlohy do clusteru) atd.

Diagnostika
Nástroj diagnostikuje spouštění úlohy automaticky. Pokud dojde k nějakým chybám nebo problémům s výkonem v úlohách, zobrazí se upozornění. Nezapomeňte prosím, že pokud chcete získat úplné informace, musíte si stáhnout profil.

- Upozornění: tady se zobrazí výstraha s upozorněním kompilátoru. Kliknutím na odkaz počet problémů x můžete zobrazit další podrobnosti, jakmile se zobrazí výstraha.
- Běh vrcholu je moc dlouhý: Pokud dojde k vyzkoušení libovolného vrcholu (například 5 hodin), najdete tady problémy.
- Využití prostředků: Pokud jste přidělili více nebo nedostatečné Paralelismuy, než je potřeba, najdete tady problémy. Také můžete kliknout na využití prostředků a zobrazit další podrobnosti a scénáře, co když chcete najít lepší přidělení prostředků (Další informace najdete v této příručce).
- Kontroly paměti: Pokud libovolný vrchol používá více než 5 GB paměti, budou zde problémy nalezeny. Spuštění úlohy může být ukončeno systémem, pokud využívá více paměti, než je omezení systému.
Podrobnosti úlohy
Podrobnosti úlohy zobrazují podrobné informace o úloze, včetně skriptu, prostředků a zobrazení spouštění vrcholů.

Skript
Skript U-SQL úlohy je uložený v úložišti dotazů. V případě potřeby můžete zobrazit původní skript U-SQL a v případě potřeby ho znovu odeslat.
Zdroje informací
Výstupy kompilace úlohy uložené v úložišti dotazů můžete najít prostřednictvím prostředků. Například můžete najít "algebra.xml", který se používá k zobrazení grafu úlohy, vámi registrovaných sestavení atd.
Zobrazení spuštění vrcholu
Zobrazuje podrobnosti o spuštění vrcholů. Profil úlohy archivuje každý protokol spouštění vrcholů, jako je například celkový počet čtení/zápisu, doba běhu, stav atd. V tomto zobrazení můžete získat další podrobnosti o tom, jak byla úloha spuštěna. Další informace naleznete v tématu použití zobrazení spuštění vrcholu v nástroji Data Lake Tools for Visual Studio.
Další kroky
- Pokud chcete protokolovat diagnostické informace, přečtěte si téma Zobrazení protokolů diagnostiky pro Azure Data Lake Analytics.
- Pokud chcete zobrazit komplexnější dotaz, přejděte k tématu Analýza webových protokolů pomocí Azure Data Lake Analytics.
- Chcete-li použít zobrazení spuštění vrcholu, přečtěte si téma použití zobrazení spuštění vrcholu v nástroji Data Lake Tools for Visual Studio .