Anslut till och hantera Azure Synapse Analytics arbetsytor i Azure Purview
Den här artikeln beskriver hur du registrerar Azure Synapse Analytics arbetsytor och hur du autentiserar och interagerar med Azure Synapse Analytics arbetsytor i Azure Purview. Mer information om Azure Purview finns i introduktionsartikeln.
Funktioner som stöds
| Extrahering av metadata | Fullständig genomsökning | Inkrementell sökning | Begränsad genomsökning | Klassificering | Åtkomstprincip | Ursprung |
|---|---|---|---|---|---|---|
| Ja | Ja | Ja | Ja | Ja | No | Ja – Synapse-pipelines |
Förutsättningar
Ett Azure-konto med en aktiv prenumeration. Skapa ett konto utan kostnad.
En aktiv Purview-resurs.
Du måste vara datakällsadministratör och dataläsare för att registrera en källa och hantera den i Purview Studio. Mer information finns på sidan Azure Purview Permissions (Behörigheter för Azure Purview).
Registrera dig
Det här avsnittet beskriver hur du registrerar Azure Synapse Analytics arbetsytor i Azure Purview med hjälp av Purview Studio.
Autentisering för registrering
Endast användare med minst en läsarroll på arbetsytan Azure Synapse som också är datakälladministratörer i Azure Purview kan registrera en Azure Synapse arbetsyta.
Steg för att registrera
Gå till ditt Azure Purview-konto.
I den vänstra rutan väljer du Källor.
Välj Register (Registrera).
Under Registrera källor väljer du Azure Synapse Analytics (flera).
Välj Fortsätt.
På sidan Registrera källor (Azure Synapse Analytics) gör du följande:
a. Ange ett Namn för datakällan som ska visas i datakatalogen.
b. Du kan också välja en prenumeration att filtrera ned till.
c. I listrutan Arbetsytenamn väljer du den arbetsyta som du arbetar med.
d. I listrutan slutpunkter fylls slutpunkterna SQL automatiskt i baserat på ditt val av arbetsyta.
e. I listrutan Välj en samling väljer du den samling som du arbetar med eller, om du vill, skapa en ny.
f. Välj Registrera för att slutföra registreringen av datakällan.
Genomsöka
Följ stegen nedan för att söka Azure Synapse Analytics arbetsytor för att automatiskt identifiera tillgångar och klassificera dina data. Mer information om genomsökning i allmänhet finns i vår introduktion till genomsökningar och inmatning.
Du måste först konfigurera autentisering för uppräkning för dina dedikerade eller serverlösa resurser. Detta gör att Purview kan räkna upp dina arbetsytetillgångar och utföra begränsade genomsökningar.
Sedan måste du tillämpa behörigheter för att genomsöka innehållet i arbetsytan.
Autentisering för att räkna upp dedikerade SQL databasresurser
I Azure Portal du till resursen Azure Synapse arbetsytan.
I den vänstra rutan väljer du Access Control (IAM).
Anteckning
Du måste vara ägare eller administratör för användaråtkomst för att kunna lägga till en roll för resursen.
Välj knappen Lägg till.
Ange rollen Läsare och ange namnet på ditt Azure Purview-konto, som representerar dess hanterade tjänstidentitet (MSI).
Välj Spara för att slutföra tilldelning av rollen.
Anteckning
Om du planerar att registrera och skanna flera Azure Synapse-arbetsytor i ditt Azure Purview-konto kan du även tilldela rollen från en högre nivå, till exempel en resursgrupp eller en prenumeration.
Autentisering för att räkna upp serverlösa SQL databasresurser
Det finns tre platser där du måste ange autentisering så att Purview kan räkna upp dina serverlösa SQL-databasresurser: Synapse-arbetsytan, den associerade lagringen och på de serverlösa databaserna. Stegen nedan anger behörigheter för alla tre.
I Azure Portal du till resursen Azure Synapse arbetsytan.
I den vänstra rutan väljer du Access Control (IAM).
Anteckning
Du måste vara ägare eller administratör för användaråtkomst för att kunna lägga till en roll för resursen.
Välj knappen Lägg till.
Ange rollen Läsare och ange namnet på ditt Azure Purview-konto, som representerar dess hanterade tjänstidentitet (MSI).
Välj Spara för att slutföra tilldelning av rollen.
I Azure Portal du till den resursgrupp eller prenumeration som Azure Synapse arbetsytan finns i.
I den vänstra rutan väljer du Access Control (IAM).
Anteckning
Du måste vara ägare eller administratör för användaråtkomst för att kunna lägga till en roll i fälten Resursgrupp eller Prenumeration.
Välj knappen Lägg till.
Ange Storage för blobdataläsare och ange namnet på ditt Azure Purview-konto (som representerar dess MSI) i rutan Välj.
Välj Spara för att slutföra tilldelning av rollen.
Gå till Azure Synapse arbetsyta och öppna Synapse Studio.
Välj fliken Data på den vänstra menyn.
Välj ellipsen (...) bredvid en av dina databaser och starta sedan ett nytt SQL skript.
Lägg till Azure Purview-kontots MSI (representeras av kontonamnet) på den serverlösa SQL databaserna. Det gör du genom att köra följande kommando i SQL skript:
CREATE LOGIN [PurviewAccountName] FROM EXTERNAL PROVIDER;
Tillämpa behörigheter för att genomsöka innehållet i arbetsytan
Du kan konfigurera autentisering för en Azure Synapse på något av två sätt:
- Använda en hanterad identitet
- Använda tjänstens huvudnamn
Viktigt
De här stegen för serverlösa databaser gäller inte för replikerade databaser. För närvarande är serverlösa databaser som replikeras från Spark-databaser skrivskyddade i Synapse. Mer information finns här.
Anteckning
Du måste konfigurera autentisering för varje dedikerad databas SQL din Azure Synapse som du vill registrera och skanna. De behörigheter som anges i följande avsnitt för serverlös databas SQL gäller för alla databaser på din arbetsyta. Det innebär att du bara behöver konfigurera autentisering en gång.
Använda en hanterad identitet för dedikerade SQL databaser
Gå till din Azure Synapse arbetsyta.
Gå till avsnittet Data och leta sedan efter en av dina dedikerade SQL databaser.
Välj ellipsen (...) bredvid den och starta sedan ett nytt SQL skript.
Anteckning
Om du vill köra kommandona i följande procedur måste du vara Azure Synapse administratör på arbetsytan. Mer information om Azure Synapse Analytics finns i: Konfigurera åtkomstkontroll för din Azure Synapse arbetsyta.
Lägg till Azure Purview-kontots MSI (representeras av kontonamnet) som db_datareader på den dedikerade SQL databasen. Det gör du genom att köra följande kommando i SQL skript:
CREATE USER [PurviewAccountName] FROM EXTERNAL PROVIDER GO EXEC sp_addrolemember 'db_datareader', [PurviewAccountName] GO
Använda en hanterad identitet för serverlösa SQL databaser
- Gå till Azure Synapse arbetsyta.
- Gå till avsnittet Data och följ nästa steg för varje databas som du vill genomsöka.
- Välj ellipsen (...) bredvid databasen och starta sedan ett nytt SQL skript.
- Lägg till Azure Purview-kontots MSI (representeras av kontonamnet) som db_datareader på de serverlösa SQL databaserna. Det gör du genom att köra följande kommando i SQL skript:
CREATE USER [PurviewAccountName] FOR LOGIN [PurviewAccountName]; ALTER ROLE db_datareader ADD MEMBER [PurviewAccountName];
Bevilja behörighet att använda autentiseringsuppgifter för externa tabeller
Om arbetsytan Azure Synapse externa tabeller måste den hanterade Azure Purview-identiteten ges behörigheten Referenser för autentiseringsuppgifterna för den externa tabellen. Med behörigheten Referenser kan Azure Purview läsa data från externa tabeller.
GRANT REFERENCES ON DATABASE SCOPED CREDENTIAL::[scoped_credential] TO [PurviewAccountName];
Använda tjänstens huvudnamn för dedikerade SQL databaser
Anteckning
Du måste först konfigurera en ny autentiseringsuppgifterna av typen Tjänstens huvudnamn genom att följa anvisningarna i Autentiseringsuppgifter för källautentisering i Azure Purview.
Gå till din Azure Synapse arbetsyta.
Gå till avsnittet Data och leta sedan efter en av dina dedikerade SQL databaser.
Välj ellipsen (...) bredvid den och starta sedan ett nytt SQL skript.
Lägg till ID:t för tjänstens huvudnamn db_datareader den dedikerade SQL databasen. Det gör du genom att köra följande kommando i SQL skript:
CREATE USER [ServicePrincipalID] FROM EXTERNAL PROVIDER GO EXEC sp_addrolemember 'db_datareader', [ServicePrincipalID] GO
Anteckning
Upprepa föregående steg för alla dedikerade SQL databaser på Synapse-arbetsytan.
Använda tjänstens huvudnamn för serverlösa SQL databaser
Gå till Azure Synapse arbetsyta.
Gå till avsnittet Data och leta sedan efter en av dina serverlösa SQL databaser.
Välj ellipsen (...) bredvid den och starta sedan ett nytt SQL skript.
Lägg till ID:t för tjänstens huvudnamn på den serverlösa SQL databaserna. Det gör du genom att köra följande kommando i SQL skript:
CREATE LOGIN [ServicePrincipalID] FROM EXTERNAL PROVIDER;Lägg till ID för tjänstens huvudnamn db_datareader på var och en av de serverlösa SQL som du vill genomsöka. Det gör du genom att köra följande kommando i SQL skript:
CREATE USER [ServicePrincipalID] FOR LOGIN [ServicePrincipalID]; ALTER ROLE db_datareader ADD MEMBER [ServicePrincipalID];
Konfigurera brandväggsåtkomst Azure Synapse arbetsytan
I arbetsytan Azure Portal du till Azure Synapse arbetsyta.
I den vänstra rutan väljer du Brandväggar.
För Tillåt Azure-tjänster och resurser att komma åt den här arbetsytekontrollen väljer du PÅ.
Välj Spara.
Skapa och köra genomsökning
Gör följande för att skapa och köra en ny genomsökning:
Välj fliken Data Map i det vänstra fönstret i Purview Studio.
Välj den datakälla som du registrerade.
Välj Visa information och välj sedan Ny genomsökning. Du kan också välja ikonen Sök snabbåtgärd på källpanelen.
Ange ett namn för genomsökningen i rutan Namn i fönstret Genomsökningsinformation.
I listrutan Typ väljer du de typer av resurser som du vill genomsöka inom den här källan. SQL Database är den enda typ som vi för närvarande stöder inom Azure Synapse arbetsyta.
I listrutan Autentiseringsuppgifter väljer du autentiseringsuppgifterna för att ansluta till resurserna i datakällan.
Inom varje typ kan du välja att genomsöka antingen alla resurser eller en delmängd av dem efter namn.
Fortsätt genom att välja Fortsätt.
Välj Sök igenom regeluppsättningar av typen Azure Synapse SQL. Du kan också skapa infogade genomsökningsregeluppsättningar.
Välj din sökningsutlösare. Du kan schemalägga körningen varje vecka/månad eller en gång.
Granska genomsökningen och välj sedan Spara för att slutföra installationen.
Visa dina genomsökningar och genomsökningskörningar
Om du vill visa befintliga genomsökningar gör du följande:
Gå till Purview Studio. Välj Data Map under den vänstra rutan.
Välj önskad datakälla. Du ser en lista över befintliga genomsökningar på datakällan under Senaste genomsökningar, eller så kan du visa alla genomsökningar på fliken Genomsökningar.
Välj den genomsökning som har resultat som du vill visa.
Den här sidan visar alla tidigare genomsökningskörningar tillsammans med status och mått för varje genomsökningskörning. Den visar också om genomsökningen har schemalagts eller manuellt, hur många tillgångar som hade tillämpade klassificeringar, hur många totala tillgångar som identifierades, start- och sluttiden för genomsökningen samt den totala genomsökningstiden.
Hantera genomsökningar – redigera, ta bort eller avbryta
Om du vill hantera eller ta bort en genomsökning gör du följande:
Gå till Purview Studio. Välj Data Map under den vänstra rutan.
Välj önskad datakälla. Du ser en lista över befintliga genomsökningar på datakällan under Senaste genomsökningar, eller så kan du visa alla genomsökningar på fliken Genomsökningar.
Välj den genomsökning som du vill hantera. Du kan redigera genomsökningen genom att välja Redigera genomsökning.
Du kan avbryta en pågående genomsökning genom att välja Avbryt genomsökningskörning.
Du kan ta bort genomsökningen genom att välja Ta bort genomsökning.
Anteckning
- Om du tar bort genomsökningen tas inte katalogtillgångar som skapats från tidigare genomsökningar bort.
- Tillgången uppdateras inte längre med schemaändringar om källtabellen har ändrats och du genomsöker källtabellen på nya sätt när du har redigerat beskrivningen på schemafliken i Purview.
Nästa steg
Nu när du har registrerat din källa följer du guiderna nedan för att lära dig mer om Purview och dina data.