Självstudie: registrera data till gångar i Azure Data Catalog

Viktigt

För uppdaterade Data Catalog funktioner använder du den nya Azure avdelningens kontroll -tjänsten, som erbjuder enhetlig data styrning för hela data fastigheten.

I den här självstudien använder du registrerings verktyget för att registrera data till gångar från databas exemplet med katalogen. Registreringen är den process där du extraherar viktiga strukturella metadata, t.ex. namn, typer och platser, från datakällan och dess tillgångar och kopierar dem till katalogen. Datakällan och datatillgångarna blir kvar där de är, men katalogen använder deras metadata för att göra det lättare att identifiera dem och förstå hur de kan användas.

I den här guiden får du lära dig att:

  • Registrera datatillgångar
  • Sök efter data till gångar
  • Kommentera datatillgångar
  • Ansluta till datatillgångar
  • Hantera datatillgångar
  • Ta bort data till gångar

Förutsättningar

För att komma igång måste du slutföra snabbstarten.

Om du vill konfigurera Data Catalog måste du vara ägare eller medägare till en Azure-prenumeration.

Registrera datatillgångar

Registrera en datakälla

Du registrerar data till gångar (tabeller) från ett databas exempel för Azure SQL Database, men du kan använda en data källa som stöds om du föredrar att arbeta med data som är välkända och relevanta för din roll. En lista över datakällor som stöds finns i Datakällor som stöds.

Det databas namn som vi använder i den här självstudien är RLSTest.

Du kan nu registrera data till gångar från databas exemplet genom att använda Azure Data Catalog.

  1. Gå till Azure Data Catalog start sida och välj publicera data.

    Azure Data Catalog – knappen Publicera data

  2. Välj starta program för att ladda ned, installera och köra registrerings verktyget på din dator.

    Azure Data Catalog – knappen Starta

  3. På sidan Välkommen väljer du Logga in och anger dina autentiseringsuppgifter.

    Azure Data Catalog – välkomstsida

  4. Välj SQL Server och nästa på sidan Microsoft Azure Data Catalog .

    Azure Data Catalog – datakällor

  5. Ange SQL Server anslutnings egenskaper för ditt databas exempel i Azure SQL Database och välj Anslut.

    Azure Data Catalog – SQL Server-anslutningsinställningar

  6. Registrera metadata för din datatillgång. I det här exemplet registrerar du produkt objekt från exempel namn området:

    1. I trädet för mapphierarkin expanderar du ditt databas exempel och väljer SalesLT.

    2. Välj produkt, ProductCategory, ProductDescription och ProductModel genom att trycka på CTRL + Select.

    3. Välj pilen för den flyttade-markerade pilen ( > ). Denna åtgärd flyttar alla markerade objekt till listan Objekt som ska registreras.

      Självstudiekurs om Azure Data Catalog – bläddra bland och välj objekt

    4. Välj Inkludera förhandsgranskning om du vill ta med en ögonblicksbild av data. Ögonblicks bilden innehåller upp till 20 poster från varje tabell och kopieras till katalogen.

    5. Välj Inkludera dataprofil om du vill ta med en ögonblicksbild av objektstatistiken för dataprofilen (till exempel lägsta, högsta och genomsnittliga värden för en kolumn, antalet rader osv.).

    6. I fältet Lägg till taggar anger du Sales, Product, Azure SQL. Denna åtgärd lägger till söktaggar för dessa datatillgångar. Taggar är ett bra sätt att hjälpa användarna att hitta en registrerad datakälla.

    7. Ange namnet på en expert här (valfritt).

      Självstudiekurs om Azure Data Catalog – objekt som ska registreras

    8. Välj register. De objekt som du har valt registreras i Azure Data Catalog. I den här övningen registreras de valda objekten från databas exemplet. Registreringsverktyget extraherar metadata från datatillgången och kopierar dessa data till Azure Data Catalog-tjänsten. Informationen är kvar där den är kvar. Data förblir övervakare av administratörer och principer för ursprungs systemet.

      Azure Data Catalog – registrerade objekt

    9. Välj Visa Portal om du vill se dina registrerade data käll objekt. I Azure Data Catalog-portalen bekräftar du att du ser alla fyra tabeller och databasen i diagramvyn (kontrol lera att Sök fältet är tydligt).

      Objekt på Azure Data Catalog-portalen

I den här övningen registrerade du objekt från databas exemplet för Azure SQL Database så att de enkelt kan identifieras av användare i organisationen.

I nästa övning kommer du att lära dig att identifiera registrerade datatillgångar.

Identifiera datatillgångar

Azure Data Catalog-identifieringen använder två primära mekanismer: sökning och filtrering.

Sökningen har utformats att vara både intuitiv och kraftfull. Som standard matchas sökvillkor mot en egenskap i katalogen, inklusive kommentarer av användaren.

Filtreringen är avsedd att komplettera sökningen. Du kan välja specifika egenskaper som experter, typ av datakälla, objekttyp och taggar för att visa matchande datatillgångar och för att begränsa sökresultaten till matchande tillgångar.

Genom att använda en kombination av sökning och filtrering kan du snabbt navigera i de data källor som är registrerade med Azure Data Catalog.

I den här övningen använder du Azure Data Catalog-portalen för att identifiera de datatillgångar som du registrerade i den föregående övningen. Mer information om söksyntaxen finns i referens för söksyntax i Data Catalog.

Följande är några få exempel på hur du kan identifiera datatillgångar i katalogen.

Du kan använda en enkel sökning för att söka igenom en katalog med hjälp av ett eller flera sökvillkor. Resultatet returnerar tillgångar där ett eller flera av de angivna villkoren matchar en egenskap.

  1. Välj Start i Azure Data Catalog portalen. Om du har stängt webbläsaren går du till Azure Data Catalog start sida.

  2. Skriv product i sökrutan och tryck på Retur.

    Azure Data Catalog – enkel textsökning

  3. Bekräfta att du ser alla fyra tabeller och databasen i resultaten. Du kan växla mellan rutnätsvy och listvy genom att välja knappar i verktygsfältet, som du ser i följande bild. Observera att sökordet markeras i sökresultatet eftersom alternativet Markera har inställningen . Du kan också ange antalet resultat per sida i sökresultatet.

    Azure Data Catalog – resultat från en enkel textsökning

    Panelen Sökningar visas till vänster och panelen Egenskaper till höger. På panelen Sökningar kan du ändra sökvillkoren och filtrera resultatet. Panelen Egenskaper innehåller egenskaperna för ett valt objekt i listan eller rutnätet.

  4. Välj produkt i Sök resultaten. Välj flikarna för för hands version, kolumner, data profil och dokumentation eller Välj pilen för att expandera det nedre fönstret.

    Azure Data Catalog – det nedre fönstret

    På fliken Förhandsgranska ser du en förhandsgranskning av data i tabellen Product.

  5. Välj fliken kolumner om du vill visa information om kolumner (t. ex. namn och datatyp) i data till gången.

  6. Välj fliken data profil för att se profilering av data (till exempel: antal rader, data storlek eller minimalt värde i en kolumn) i data till gången.

Identifiera datatillgångar med egenskapsomfång

Egenskapsomfång hjälper dig att identifiera datatillgångar där sökvillkoret matchar den angivna egenskapen.

  1. Rensa tabellfiltret under Objekttyp i Filter.

  2. Skriv tags:product i sökrutan och tryck på Retur. En lista med alla egenskaper som du kan använda för att söka i datakatalogen finns i Data Catalog Search-syntaxreferensen.

  3. Bekräfta att du ser tabellerna och databasen i resultaten.

    Data Catalog – resultat från sökning med egenskapsomfång

  1. I fönstret sökningar i avsnittet aktuell sökning anger du ett namn för sökningen och väljer Spara.

    Azure Data Catalog – spara sökning

  2. Bekräfta att den sparade sökningen visas under Sparade sökningar.

  3. Välj en av de åtgärder som du kan utföra med den sparade sökningen (Byt namn, Ta bort eller Spara som standard).

Gruppera med parenteser

Genom att gruppera med parenteser kan du gruppera delar av frågan för att skapa en logisk isolering, särskilt tillsammans med booleska operatorer.

  1. Skriv name:product AND (tags:product AND objectType:table) i sökrutan och tryck på Retur.

  2. Kontrollera att endast tabellen Product visas i sökresultatet.

    Azure Data Catalog – gruppera sökning

Jämförelseoperatorer

Med jämförelseoperatorer kan du använda andra jämförelser än ”lika med” för egenskaper som har numeriska datatyper och datum.

  1. Skriv lastRegisteredTime:>"06/09/2016" i sökrutan.

  2. Rensa tabellfiltret under Objekttyp.

  3. Tryck på RETUR.

  4. Bekräfta att du ser tabellerna Product, ProductCategory och ProductDescription och den SQL-databas som du registrerade i Sök resultaten.

    Azure Data Catalog – resultat från en jämförelsesökning

Se identifiera data till gångar för detaljerad information om identifiering av data till gångar. Mer information om Söksyntaxen finns i referens för Data Catalog söksyntax.

Kommentera datatillgångar

I den här övningen använder du Azure Data Catalog Portal för att kommentera (lägga till information som beskrivningar, taggar eller experter) befintliga data till gångar i katalogen. Anteckningarna kompletterar de strukturella metadata som extraherats från data källan under registreringen. Anteckningar gör data till gångarna mycket lättare att identifiera och förstå.

I den här övningen kommenterar du en enskild datatillgång (ProductPhoto). Du lägger till ett eget namn och en beskrivning till ProductPhoto-datatillgången.

  1. Gå till Azure Data Catalog start sida och Sök med tags:product för att hitta de data till gångar som du har registrerat.

  2. Välj ProductModel i Sök resultat.

  3. Skriv Product images som Eget namn och Product photos for marketing materials som Beskrivning.

    Azure Data Catalog – beskrivning för ProductPhoto

    Beskrivningen hjälper andra att identifiera och förstå varför och hur den valda datatillgången ska användas. Du kan också lägga till fler taggar och visningskolumner. Du kan söka efter och filtrera data källor med hjälp av de beskrivande metadata som du har lagt till i katalogen.

Du kan också utföra följande steg på den här sidan:

  • Lägg till experter för datatillgången. Välj Lägg till i expert -avsnittet.

  • Lägg till taggar på datauppsättningsnivå. Välj Lägg till i avsnittet taggar . En tagg kan vara en användartagg eller en ordlistetagg. Standard Edition av Data Catalog innehåller en företagsordlista som hjälper katalogadministratörer att definiera en central taxonomi för företaget. Katalogens användare kan sedan lägga till anteckningar i datatillgångar med termer från ordlistan. Mer information finns i så här konfigurerar du företags ord listan för styrt märkord

  • Lägg till taggar på kolumnnivå. Välj Lägg till under taggar för den kolumn som du vill kommentera.

  • Lägg till en beskrivning på kolumnnivå. Skriv en beskrivning för en kolumn. Du kan också visa beskrivningens metadata som extraherats från datakällan.

  • Lägg till information för Begär åtkomst som visar användare hur de ska begära åtkomst till datatillgången.

  • Välj fliken Dokumentation och ange dokumentation för datatillgången. Med Azure Data Catalog-dokumentation kan du använda datakatalogen som en innehållsdatabas med komplett information om dina datatillgångar.

Du kan också lägga till en anteckning till flera datatillgångar. Du kan till exempel välja alla datatillgångar som du har registrerat och ange en expert för dem.

Azure Data Catalog – kommentera flera datatillgångar

Azure Data Catalog stöder kommentarer via crowdsourcing. Alla Data Catalog användare kan lägga till taggar (användare eller ord lista), beskrivningar och andra metadata. Genom att göra det kan användarna lägga till perspektiv på en data till gång och dess användning och dela detta perspektiv med andra användare.

Detaljerad information om hur du kommenterar datatillgångar finns i Kommentera datatillgångar.

Ansluta till datatillgångar

I den här övningen öppnar du datatillgångar i ett integrerat klientverktyg (Excel) och ett icke-integrerat verktyg (SQL Server Management Studio) med hjälp av anslutningsinformation.

Anteckning

Det är viktigt att komma ihåg att Azure Data Catalog inte ger åtkomst till själva datakällan. Tjänsten gör det bara enklare för dig att identifiera och förstår den. När du ansluter till en datakälla så använder det klientprogram som du väljer dina Windows-autentiseringsuppgifter eller uppmanar dig att ange dina autentiseringsuppgifter om det behövs. Om du inte tidigare har beviljats åtkomst till datakällan måste du beviljas åtkomst innan du kan ansluta.

Ansluta till en datatillgång från Excel

  1. Välj Product i sökresultatet. Välj Öppna i i verktygsfältet och välj Excel.

    Azure Data Catalog – anslut till datatillgång

  2. Välj Öppna i popup-fönstret Hämta. Hur detta ser ut kan variera något beroende på webbläsaren.

  3. I fönstret säkerhets meddelande i Microsoft Excel väljer du Aktivera.

    Azure Data Catalog – popup-fönster med säkerhetsmeddelande i Excel

  4. Behåll standardinställningarna i dialog rutan Importera data och välj OK.

    Azure Data Catalog – importera data i Excel

  5. Visa datakällan i Excel.

    Azure Data Catalog – produkttabell i Excel

SQL Server Management Studio

I den här övningen anslöt du till datatillgångar som identifierades med hjälp av Azure Data Catalog. På Azure Data Catalog-portalen kan du ansluta direkt med hjälp av klientprogrammen som är integrerade i Öppna i-menyn. Du kan också ansluta med valfria program som du väljer med hjälp av informationen om anslutningsplatsen som finns i datatillgångarnas metadata. Du kan till exempel använda SQL Server Management Studio för att ansluta till Azure SQL Database för att komma åt data i data till gångar som registrerats i den här självstudien.

  1. Öppna SQL Server Management Studio.

  2. I dialogrutan Anslut till server anger du servernamnet från rutan Egenskaper på Azure Data Catalog-portalen.

  3. Använd lämplig autentisering och relevanta autentiseringsuppgifter för åtkomst till datatillgången. Om du inte har åtkomst använder du informationen i fältet Begär åtkomst för att få det.

    Azure Data Catalog – begär åtkomst

Välj Visa anslutnings strängar för att visa och kopiera anslutnings strängar för ADO.net, ODBC och OLEDB till Urklipp för användning i programmet.

Hantera datatillgångar

I det här steget konfigurerar du säkerheten för dina datatillgångar. Data Catalog ger inte användare åtkomst till själva data. Datakällans ägare styr dataåtkomsten.

Med Data Catalog kan du identifiera datakällor och visa metadata relaterade till de datakällor som registrerats i katalogen. Det kan dock finnas situationer då datakällor endast bör visas för särskilda användare eller för medlemmar i vissa grupper. I dessa scenarier kan du använda Data Catalog för att bli ägare till registrerade data till gångar och kontrol lera synligheten för de till gångar du äger.

Anteckning

De hanteringsfunktioner som beskrivs i den här övningen är bara tillgängliga i Standard Edition av Azure Data Catalog, inte i den kostnadsfria versionen. I Azure Data Catalog kan du överta ägarskapet för datatillgångar, lägga till medägare till datatillgångar och ange datatillgångars synlighet.

Bli ägare av datatillgångar och begränsa synligheten

  1. Gå till startsidan för Azure Data Catalog. I text rutan Sök skriver du tags:cycles och trycker på RETUR.

  2. Markera ett objekt i resultat listan och välj bli ägare i verktygsfältet.

  3. I avsnittet hantering på panelen Egenskaper väljer du bli ägare.

    Azure Data Catalog – bli ägare

  4. Om du vill begränsa synligheten väljer du ägare & dessa användare i avsnittet synlighet och väljer Lägg till. Ange användarnas e-postadresser i textrutan och tryck på Retur.

    Azure Data Catalog – begränsa åtkomst

Ta bort datatillgångar

I den här övningen tar du bort förhandsgranskningsdata från registrerade datatillgångar samt datatillgångar från katalogen med hjälp av Azure Data Catalog-portalen.

I Azure Data Catalog kan du ta bort enstaka eller flera tillgångar.

  1. Gå till startsidan för Azure Data Catalog.

  2. I text rutan Sök skriver du tags:cycles och väljer RETUR.

  3. Markera ett objekt i resultat listan och välj ta bort i verktygsfältet, som du ser i följande bild:

    Azure Data Catalog – ta bort rutnätsobjekt

    Om du använder listvyn visas kryss rutan till vänster om objektet, som du ser i följande bild:

    Azure Data Catalog – ta bort objekt i lista

    Du kan också markera flera datatillgångar och ta bort dem samtidigt, som du ser i följande bild:

    Azure Data Catalog – ta bort flera datatillgångar

Anteckning

Som standard tillåter katalogen att alla användare registrerar valfri datakälla och att alla användare tar bort alla datatillgångar som har registrerats. Hanteringsfunktionerna i standardutgåvan av Azure Data Catalog tillhandahåller ytterligare alternativ för ägarskap av tillgångar samt för att begränsa vem som kan identifiera och ta bort tillgångar.

Rensa resurser

Följ stegen för att ta bort data till gångar för att rensa alla till gångar som du kan ha använt när du följer den här kursen.

Sammanfattning

I den här självstudiekursen har du utforskat grundläggande funktioner i Azure Data Catalog, till exempel registrering, kommentarer, identifiering och hantering av datatillgångar på ett företag. Nu har du slutfört självstudiekursen, så det är dags att komma igång. Du kan börja i dag genom att registrera de datakällor som du och ditt team använder och bjuda in kollegor att använda katalogen.

Nästa steg