Vad är Azure Data Catalog?
Viktigt
För uppdaterade Data Catalog funktioner använder du den nya Azure avdelningens kontroll -tjänsten, som erbjuder enhetlig data styrning för hela data fastigheten.
Azure Data Catalog är en fullständigt hanterad molntjänst. Det gör att användarna kan identifiera de datakällor som de behöver och förstå de datakällor som de hittar. På samma gång hjälper Data Catalog organisationer att få ut mer av sina befintliga investeringar.
Med Data Catalog kan alla användare (analytiker, IT-forskare eller utvecklare) identifiera, förstå och använda datakällor. Data Catalog innehåller en gemensam modell för metadata och kommentarer. Det är en gemensam, central plats där hela organisationens användare kan bidra med sina kunskaper och skapa en databaserad gemenskap och kultur för data.
Det är svårt för datakonsumenterna att hitta rätt
Traditionellt har man identifierat företagets datakällor genom en organisk process baserad på gruppens kunskaper. Detta medför stora utmaningar för företag som vill få ut största möjliga värde av sina informationstillgångar:
- Användarna kanske inte vet att det finns en datakälla om de inte kommer i kontakt med den som en del av en annan process. Det finns ingen central plats där datakällorna registreras.
- Om användarna vet platsen för en datakälla, kan de inte ansluta till data med hjälp av ett klientprogram. Dataförbrukningsupplevelser gör att användarna måste känner till anslutningssträngen eller sökvägen.
- Om användarna inte känner till datakällans plats kan de inte förstå dess avsedda användningsområde. Datakällor och dokumentation kanske befinner sig på olika platser och används via en mängd olika upplevelser.
- Om användare har frågor om en informationsresurs måste de hitta experten eller teamet som ansvarar för data och prata med dem offline. Det finns ingen uttrycklig koppling mellan data och experter som har perspektiv på dess användning.
- Om användare inte känner till hur man begär åtkomst till datakällan, kan de inte komma åt de data som behövs trots att de har identifierat datakällan och dess dokumentation.
Det är svårt för dataproducenterna att hitta rätt
Datakonsumenterna står inför vissa svårigheter, medan användarna som ansvarar för att producera och upprätthålla informationstillgångar står inför andra svårigheter:
- Det är ofta en onödig ansträngning att kommentera datakällor med beskrivande metadata. Klientprogram ignorerar vanligtvis beskrivningar som lagrats i datakällan.
- Det är ofta en onödig ansträngning att skapa dokumentation för datakällor. Att hålla dokumentationen synkroniserad med datakällor är ett kontinuerligt ansvar. Användare kanske saknar förtroende för dokumentation som uppfattas som in date.
- Det är komplicerat och tidskrävande att skapa och upprätthålla dokumentationen för en datakälla. Det är ofta ännu svårare att göra dokumentationen lättillgänglig för alla som använder datakällan.
- Det är en ständig utmaning att begränsa tillgången till datakällan och samtidigt se till att datakonsumenterna vet hur de begär tillgång.
I kombination utgör dessa svårigheter ett stort hinder för företag som vill uppmuntra och främja användning och förståelse av företagsdata.
Azure Data Catalog kan hjälpa dig
Data Catalog är utformad för att åtgärda dessa problem och hjälpa företagen att få ut så mycket som möjligt av sina befintliga informationstillgångar. Data Catalog underlättar genom att göra det enkelt för användare som behöver data att identifiera och förstå datakällorna.
Data Catalog är en molnbaserad tjänst där du kan registrera datakällor. Dina data blir kvar där du har dem, men en kopia av deras metadata läggs till i Data Catalog tillsammans med en referens till platsen där datakällan finns. Dessa metadata indexeras också för att det ska bli enkelt att identifiera alla datakällor och för att användare som identifierar dem ska förstå dem.
När en datakälla har registrerats kan dess metadata berikas. Metadata kan läggas till antingen av den användare som registrerade den eller av andra användare i företaget. Alla användare kan kommentera en datakälla genom att ange beskrivningar, taggar eller andra metadata, till exempel dokumentation och processer för att begära åtkomst till datakällan. Dessa beskrivande metadata kompletterar strukturella metadata (till exempel kolumnnamn och datatyper) som registrerats från datakällan.
Huvudsyftet med registrering av källorna är att identifiera och förstå datakällor och deras användningsområden. Företagsanvändare behöver data för business intelligence, programutveckling, datavetenskap eller andra uppgifter där rätt data krävs. De kan använda sökfunktionen i Data Catalog för att snabbt hitta data som motsvarar deras behov, förstå datakällan för att utvärdera dess lämplighet och använda data genom att öppna datakällan i önskat verktyg.
På samma gång kan användarna bidra till katalogen genom att tagga, dokumentera och kommentera datakällor som redan har registrerats. De kan också registrera nya datakällor som kan sedan identifieras, förstås och användas av kataloganvändare.

Mer information om Data Catalog
Här finns mer information om funktionerna i Data Catalog:
- Så här registrerar du datakällor
- Så här identifierar du datakällor
- Så här kommenterar du datakällor
- Så här dokumenterar du datakällor
- Så här ansluter du till datakällor
- Så här arbetar du med stordata
- Hantera datatillgångar
- Så här konfigurerar du företagsordlistan
- Vanliga frågor och svar
Nästa steg
Så här kommer du igång med Data Catalog: