Kontroly a přijímání v Azure dosah

Tento článek obsahuje přehled funkcí kontroly a přijímání v Azure dosah. Tyto funkce propojí váš účet dosah s vašimi zdroji, aby mohli naplnit mapování dat a Data Catalog, abyste mohli začít zkoumat a spravovat data prostřednictvím dosah.

Prohledávání

Po registraci zdrojů dat ve vašem účtu dosah je dalším krokem kontrola zdrojů dat. Proces skenování naváže připojení ke zdroji dat a zachytí technická metadata, jako jsou názvy, velikost souborů, sloupce a tak dále. také extrahuje schéma strukturovaných zdrojů dat, používá klasifikace v schématech a používá popisky citlivosti, pokud je váš účet dosah připojený Microsoft 365 k centru zabezpečení a dodržování předpisů SCC (Security Center). Proces skenování se dá aktivovat tak, aby se spustil okamžitě, nebo se dá naplánovat jeho pravidelné spuštění, aby se Váš účet dosah udržoval v aktuálním stavu.

Pro každou kontrolu můžete použít vlastní nastavení, abyste mohli pouze vyhledat požadované informace ve svých zdrojích.

Zvolit metodu ověřování pro vaše kontroly

Dosah je ve výchozím nastavení zabezpečené. Žádná hesla ani tajné klíče se neukládají přímo v dosah, takže budete muset zvolit metodu ověřování pro vaše zdroje. Existují čtyři možné způsoby ověření účtu dosah, ale ne všechny metody jsou podporovány pro každý zdroj dat.

  • Spravovaná identita
  • Instanční objekt
  • Ověřování SQL
  • Klíč účtu nebo základní ověřování

Pokud je to možné, jedná se o upřednostňovanou metodu ověřování, protože se eliminuje nutnost ukládat a spravovat přihlašovací údaje pro jednotlivé zdroje dat. To může výrazně zkrátit dobu, po kterou váš tým stráví nastavení a řešení potíží s ověřováním pro kontroly. když pro svůj účet dosah povolíte spravovanou identitu, v Azure Active Directory se vytvoří identita, která je vázaná na životní cyklus vašeho účtu.

Určení rozsahu kontroly

Při skenování zdroje máte možnost kontrolovat celý zdroj dat, nebo vybrat pouze konkrétní entity (složky/tabulky), které se mají kontrolovat. Dostupné možnosti závisí na zdroji, který skenujete, a lze je definovat pro jednorázové i naplánované prohledávání.

když například vytvoříte a spustíte kontrolu Azure SQL Database, můžete vybrat, které tabulky se mají kontrolovat, nebo vybrat celou databázi.

Sada pravidel skenování

Sada pravidel skenování určuje typy informací, které bude kontrola Hledat, když je spuštěná na jednom ze svých zdrojů. Dostupná pravidla závisí na typu zdroje, který kontrolujete, ale mezi typy souborů , které byste měli zkontrolovat, a typy potřebných klasifikací .

Pro mnoho typů zdrojů dat jsou již k dispozici sady pravidel kontroly systému , ale můžete také vytvořit vlastní sady pravidel skenování pro přizpůsobení vašich kontrol vaší organizaci.

Naplánování kontroly

Dosah vám nabídne výběr týdně nebo měsíčně v konkrétní době, kterou si zvolíte. Týdenní kontroly můžou být vhodné pro zdroje dat se strukturami, které jsou aktivně vyvíjené nebo často se mění. Pro zdroje dat, které se mění zřídka, je hledání měsíčně vhodnější. Dobrým postupem je pracovat se správcem zdroje, který chcete vyhledat, abyste identifikovali čas, kdy jsou požadavky výpočetních požadavků na zdroj nízké.

Jak se při prohledávání zjišťují odstraněné prostředky

Katalog Azure dosah je vědomý jenom stavu úložiště dat při spuštění kontroly. Aby katalog věděl, jestli se odstranil soubor, tabulka nebo kontejner, porovná výstup poslední kontroly s aktuálním výstupem kontroly. předpokládejme například, že při poslední kontrole účtu Azure Data Lake Storage Gen2 zahrnula složku s názvem složku1. Po opětovném prohledání stejného účtu chybí složku1 . Katalog proto předpokládá, že se složka odstranila.

Zjištění odstraněných souborů

Logika zjišťování chybějících souborů funguje pro více kontrol stejného uživatele i pro různé uživatele. předpokládejme například, že uživatel spouští jednorázovou kontrolu Data Lake Storage Gen2 úložiště dat ve složkách a, B a C. Později jiný uživatel ve stejném účtu spustí jinou jednorázovou kontrolu ve složkách C, D a E stejného úložiště dat. Vzhledem k tomu, že se složka C prohledal dvakrát, katalog zkontroluje možné odstranění. Složky A, B, D a E se ale kontrolovaly jenom jednou a katalog je nekontroluje pro odstraněné prostředky.

Pokud chcete zachovat odstraněné soubory z katalogu, je důležité spustit pravidelné kontroly. Interval kontroly je důležitý, protože katalog nemůže detekovat odstraněné prostředky, dokud není spuštěná jiná kontrola. Pokud tedy spustíte prohledávání jednou měsíčně v konkrétním úložišti, katalog nebude moci detekovat žádné odstraněné datové prostředky v tomto úložišti, dokud nespustíte další kontrolu za měsíc později.

při vytváření výčtu rozsáhlých úložišť dat, jako je Data Lake Storage Gen2, existuje více způsobů (včetně chyb výčtu a vynechaných událostí) k neúspěšným informacím. Při konkrétní kontrole může dojít k neúspěšnému vytvoření nebo odstranění souboru. Takže pokud se v katalogu neodstraní určitý soubor, neodstraní se z katalogu. Tato strategie znamená, že může dojít k chybám, když soubor, který neexistuje v úložišti naskenovaných dat, existuje i v katalogu. V některých případech může být nutné před započetím některých odstraněných prostředků prohledat úložiště dat dvakrát nebo třikrát.

Poznámka

Prostředky označené k odstranění se po úspěšné kontrole odstraní. Odstraněné prostředky můžou být v katalogu ještě po určitou dobu viditelné, než se zpracují a odeberou.

Příjem dat

Technické metadata nebo klasifikace identifikované procesem skenování se pak odesílají do ingestování. Proces ingestování zodpovídá za naplnění mapování dat a spravuje ho dosah. Analýzy příjmu: vstup z kontroly, používá vzory sady prostředků, naplní dostupné informace o zástupných řádcích a pak automaticky načte mapování dat. Prostředky a schémata lze zjistit nebo obcházet až po dokončení příjmu. Pokud je vaše kontrola dokončená, ale neviděli jste své prostředky v mapě dat nebo katalogu, budete muset počkat na dokončení procesu ingestování.

Další kroky

Pokud chcete získat další informace nebo konkrétní pokyny ke skenování zdrojů, postupujte podle následujících odkazů.