Použití uživatelského rozhraní kanálu k ladění selhání kanálů služby Azure Machine Learning

Po odeslání kanálu se v pracovním prostoru Azure Machine Learning zobrazí odkaz na úlohu kanálu. Odkaz se zobrazí na stránce úlohy kanálu v studio Azure Machine Learning, kde můžete zkontrolovat výsledek a úlohu kanálu ladit.

Tento článek představuje způsob použití stránky úlohy kanálu k ladění selhání kanálů strojového učení.

Důležité

Položky označené v tomto článku (Preview) jsou aktuálně ve verzi Public Preview. Verze Preview se poskytuje bez smlouvy o úrovni služeb a nedoporučuje se pro produkční úlohy. Některé funkce se nemusí podporovat nebo mohou mít omezené možnosti. Další informace najdete v dodatečných podmínkách použití pro verze Preview v Microsoft Azure.

Rychlé vyhledání uzlu pomocí osnovy

Na stránce podrobností úlohy kanálu je na plátně osnova, která ukazuje celkovou strukturu úlohy kanálu. Po najetí myší na libovolný řádek můžete vybrat tlačítko Najít a vyhledat tento uzel na plátně.

Snímek obrazovky znázorňující osnovu a umístění na plátně

Můžete filtrovat neúspěšné nebo dokončené uzly a pouze podle komponent nebo datové sady pro další hledání. V levém podokně se zobrazují odpovídající uzly s dalšími informacemi, včetně stavu, doby trvání a času vytvoření.

Snímek obrazovky znázorňující rychlé filtrování podle při hledání osnovy >

Filtrované uzly můžete také seřadit.

Snímek obrazovky s řazením výsledků hledání v osnově > hledání

Kontrola protokolů a výstupů komponenty

Pokud váš kanál selže nebo se zablokuje na uzlu, nejdřív si prohlédněte protokoly.

  1. Můžete vybrat konkrétní uzel a otevřít pravé podokno.

  2. Vyberte kartu Výstupy a protokoly a můžete prozkoumat všechny výstupy a protokoly tohoto uzlu.

    Složka user_logs obsahuje informace o protokolech generovaných uživatelským kódem. Tato složka je ve výchozím nastavení otevřená a je vybrán protokolstd_log.txt . V std_log.txt se zobrazují protokoly vašeho kódu (například příkazy tisku).

    Složka system_logs obsahuje protokoly vygenerované službou Azure Machine Learning. Přečtěte si další informace o zobrazení a stažení diagnostických protokolů.

    Snímek obrazovky znázorňuje, jak zkontrolovat protokoly uzlu

    Pokud tyto složky nevidíte, důvodem je to, že se do výpočetního clusteru ještě nevydá aktualizace za běhu výpočetního prostředí a můžete se nejdřív podívat na 70_driver_log.txt ve složce azureml-logs .

Porovnání různých kanálů za účelem ladění selhání nebo jiných neočekávaných problémů (Preview)

Porovnání kanálů identifikuje rozdíly (včetně topologie, vlastností komponent a vlastností úloh) mezi několika úlohami. Můžete například porovnat úspěšný kanál a kanál, který selhal, což vám pomůže zjistit, jaké úpravy můžou způsobit selhání kanálu.

Dva hlavní scénáře, ve kterých můžete s laděním pomoct pomocí porovnání kanálů:

  • Úlohu kanálu, která selhala, můžete ladit tak, že ji porovnáte s dokončenou.
  • Uzel, který selhal, můžete v kanálu ladit tak, že ho porovnáte s podobným dokončeným uzlem.

Povolení této funkce:

  1. Přejděte do uživatelského rozhraní studio Azure Machine Learning.
  2. Mezi ikonami v pravém horním rohu obrazovky vyberte Spravovat funkce preview (ikona megafonu).
  3. Na panelu funkcí Managed Preview přepněte funkci Porovnat úlohy kanálu pro selhání ladění nebo neočekávané problémy .

Snímek obrazovky se zapnutou správou funkcí Preview

Jak ladit neúspěšnou úlohu kanálu porovnáním s dokončenou úlohou kanálu

Během vývoje iterativního modelu můžete mít základní kanál a pak můžete provést určité změny, jako je například změna parametru, datové sady nebo výpočetního prostředku atd. Pokud váš nový kanál selhal, můžete pomocí porovnání kanálů zjistit, co se změnilo, a porovnat ho se základním kanálem, což může pomoct zjistit, proč selhal.

Porovnání kanálu s jeho nadřazeným objektem

První věcí, kterou byste měli zkontrolovat při ladění, je vyhledání uzlu, který selhal, a kontrola protokolů.

Může se například zobrazit chybová zpráva oznamující, že váš kanál selhal kvůli nedostatku paměti. Pokud je váš kanál naklonovaný z dokončeného nadřazeného kanálu, můžete pomocí porovnání kanálů zjistit, co se změnilo.

  1. Vyberte Zobrazit rodokmen.

  2. Vyberte odkaz v části Klonovaný od. Otevře se nová karta prohlížeče s nadřazeným kanálem.

    Snímek obrazovky znázorňující naklonovaný z odkazu se zvýrazněným tlačítkem rodokmenu v předchozím kroku

  3. Vyberte Přidat a porovnejte kanál, který selhal, a nadřazeného kanálu. Tím se přidají do seznamu kandidátů porovnání.

    Snímek obrazovky zobrazující seznam porovnání s přidaným nadřazeným a podřízeným kanálem

Porovnání topologie

Po přidání těchto dvou kanálů do seznamu porovnání máte dvě možnosti: Porovnat podrobnosti a Porovnat graf. Porovnání grafu umožňuje porovnat topologii kanálu.

Porovnání grafu ukazuje změny topologie grafu mezi kanálem A a B. Speciální uzly v kanálu A jsou zvýrazněné červeně a označeny pouze písmenem A. Speciální uzly v kanálu B jsou označené pouze zeleně a označeny znakem "pouze B". Sdílené uzly jsou šedé. Pokud na sdílených uzlech existují rozdíly, změny se zobrazí v horní části uzlu.

Na stránce podrobností jsou k dispozici tři kategorie změn se souhrny, změnou parametru, vstupním zdrojem a komponentou kanálu. Když se změní komponenta kanálu, znamená to, že došlo ke změně topologie uvnitř nebo parametru vnitřního uzlu. Můžete vybrat ikonu složky na uzlu komponenty kanálu a prozkoumat podrobnosti. Další změny lze zjistit zobrazením barevných uzlů v porovnávaném grafu.

Snímek obrazovky znázorňující změnu parametru a kartu informace o komponentě

Porovnání vlastností a metadat kanálu

Pokud prozkoumáte rozdíl mezi datovými sadami a zjistíte, že data nebo topologie nejsou hlavní příčinou selhání, můžete také zkontrolovat podrobnosti kanálu, jako jsou parametr kanálu, nastavení výstupu nebo spuštění.

Porovnání grafu se používá k porovnání topologie kanálu. Podrobnosti o porovnání vlastností kanálu slouží k porovnání metainformace nebo nastavení.

Pokud chcete získat přístup k podrobnému porovnání, přejděte do seznamu porovnání, vyberte Porovnat podrobnosti nebo vyberte Zobrazit podrobnosti porovnání na stránce porovnání kanálu.

Zobrazí se vlastnosti kanálu a vlastnosti Spustit.

  • Mezi vlastnosti kanálu patří parametry kanálu, nastavení spuštění a výstupu atd.
  • Mezi vlastnosti spuštění patří stav úlohy, čas odeslání a doba trvání atd.

Následující snímek obrazovky ukazuje příklad použití podrobného porovnání, kde výchozí nastavení výpočetních prostředků mohlo být příčinou selhání.

Snímek obrazovky s přehledem porovnání výchozích výpočetních prostředků

Pokud chcete rychle zkontrolovat porovnání topologie, vyberte název kanálu a vyberte Porovnat graf.

Snímek obrazovky s podrobným porovnáním se zvýrazněným srovnávacím grafem

Postup ladění neúspěšného uzlu v kanálu porovnáním s podobným dokončeným uzlem

Pokud jste pouze aktualizovali vlastnosti uzlu a v kanálu jste nic nezměnili, můžete uzel ladit porovnáním s úlohami, které se odesílají ze stejné komponenty.

Najít úlohu, se kterou chcete porovnat

  1. Najděte úspěšnou úlohu, se kterou chcete porovnat, zobrazením všech spuštění odeslaných ze stejné komponenty.
    1. Vyberte uzel, který selhal, a vyberte Zobrazit úlohy. Zobrazí se seznam všech úloh.

      Snímek obrazovky znázorňující uzel, který selhal, se zvýrazněnými úlohami zobrazení

    2. Jako cíl porovnání zvolte dokončenou úlohu.

  2. Jakmile najdete neúspěšnou a dokončenou úlohu, se kterou se dá porovnat, přidejte tyto dvě úlohy do seznamu kandidátů porovnání.
    1. U uzlu, který selhal, vyberte pravým tlačítkem a vyberte Přidat a porovnejte ho.
    2. V případě dokončené úlohy přejděte do jejího nadřazeného kanálu a vyhledejte dokončenou úlohu. Pak vyberte Přidat a porovnejte ho.
  3. Jakmile jsou tyto dvě úlohy v seznamu porovnání, vyberte Porovnat podrobnosti a zobrazte rozdíly.

Sdílení výsledků porovnání

Pokud chcete sdílet výsledky porovnání, vyberte Sdílet a zkopírujte odkaz. Můžete například zjistit, že rozdíl mezi datovými sadami může vést k selhání, ale nejste specialista na datové sady, můžete výsledek porovnání sdílet s datovým inženýrem ve vašem týmu.

Snímek obrazovky s tlačítkem sdílet a odkazem, který byste měli zkopírovat

Další kroky

V tomto článku jste zjistili, jak ladit selhání kanálu. Další informace o tom, jak můžete kanál používat, najdete v následujících článcích: