Serverlös SQL-pool i Azure Synapse Analytics

Varje Azure Synapse Analytics-arbetsyta levereras med serverlösa SQL-poolslutpunkter som du kan använda för att fråga efter data i Azure Data Lake (Parquet, Delta Lake, avgränsade textformat), Cosmos DBeller Dataverse.

Serverlös SQL-pool är en frågetjänst över data i din datasjö. Det gör att du kan komma åt dina data via följande funktioner:

  • En välbekant T-SQL-syntax för att köra frågor mot data på plats utan att behöva kopiera eller läsa in data i ett speciallager.
  • Integrerad anslutning via T-SQL-gränssnittet som erbjuder en mängd business intelligence och ad hoc-frågeverktyg, inklusive de mest populära drivrutinerna.

Serverlös SQL-pool är ett distribuerat databearbetningssystem som skapats för storskaliga data och beräkningsfunktioner. Med en serverlös SQL-pool kan du analysera dina stordata på några sekunder och minuter, beroende på arbetsbelastningen. Tack vare den inbyggda feltoleransen för frågekörning ger systemet hög tillförlitlighet och framgång även för långvariga frågor som rör stora datamängder.

Serverlös SQL-pool är serverlös, och därför finns det ingen infrastruktur att konfigurera eller kluster att underhålla. En standardslutpunkt för den här tjänsten tillhandahålls i varje Azure Synapse arbetsyta, så du kan börja fråga efter data så fort arbetsytan har skapats.

Det finns ingen avgift för reserverade resurser, du debiteras bara för de data som bearbetas av frågor som du kör. Därför är den här modellen en verklig betala per användning-modell.

Om du använder Apache Spark för Azure Synapse i din datapipeline för förberedelse av data, rensning eller berikning kan du fråga externa Spark-tabeller som du har skapat i processen direkt från en serverlös SQL-pool. Använd Private Link för att föra in slutpunkten för din serverlösa SQL-pool i det virtuella nätverket för din hanterade arbetsyta.

Fördelar med serverlös SQL-pool

Om du behöver utforska data i datasjön, få insikter från den eller optimera din befintliga pipeline för datatransformering kan du dra nytta av att använda en serverlös SQL-pool. Det är lämpligt för följande scenarier:

  • Grundläggande identifiering och utforskning – Du kan snabbt få en orsak till data i olika format (Parquet, CSV, JSON) i din datasjö, så att du kan planera hur du ska extrahera insikter från den.
  • Logiskt informationslager – Tillhandahåll en relationsabstrahering ovanpå rådata eller skilda data utan att behöva flytta och transformera data, vilket gör att du alltid kan se dina data. Läs mer om hur du skapar ett logiskt informationslager.
  • Datatransformering – Enkelt, skalbart och performant sätt att transformera data i lake med T-SQL, så att de kan matas till BI och andra verktyg eller läsas in i ett relationsdatalager (Synapse SQL-databaser, Azure SQL Database osv.).

Olika professionella roller kan dra nytta av serverlös SQL-pool:

  • Datatekniker kan utforska lake, transformera och förbereda data med hjälp av den här tjänsten och förenkla sina pipelines för datatransformering. Mer information finns i den här självstudien.
  • Dataexperter kan snabbt få en orsak till innehållet och strukturen för data i en lake, tack vare funktioner som OPENROWSET och automatisk schemainferens.
  • Dataanalytiker kan utforska data och externa Spark-tabeller som skapats av dataforskare eller datatekniker med hjälp av välbekanta T-SQL-språk eller deras favoritverktyg, som kan ansluta till en serverlös SQL-pool.
  • BI-proffs kan snabbt Power BI rapporter ovanpå data i lake- och Spark-tabeller.

Så här börjar du använda en serverlös SQL-pool

Serverlös slutpunkt för SQL-pool tillhandahålls i varje Azure Synapse arbetsyta. Du kan skapa en arbetsyta och börja köra frågor mot data direkt med hjälp av verktyg som du är bekant med.

Se till att du använder metodtipsen för att få bästa prestanda.

Klientverktyg

Serverlös SQL-pool gör det möjligt att använda befintliga AD HOC-frågor och business intelligence sql-verktyg för att utnyttja datasjön. Eftersom det tillhandahåller välbekant T-SQL-syntax kan alla verktyg som kan upprätta TDS-anslutning till SQL-erbjudanden ansluta till och fråga Synapse SQL. Du kan ansluta med Azure Data Studio och köra ad hoc-frågor eller ansluta med Power BI för att få insikter på bara några minuter.

Stöd för T-SQL

Serverlös SQL-pool erbjuder T-SQL-frågeyta, vilket är något förbättrat/utökat i vissa aspekter för att tillgodose upplevelsen av att köra frågor mot halvstrukturerade och ostrukturerade data. Dessutom stöds inte vissa aspekter av T-SQL-språket på grund av utformningen av en serverlös SQL-pool. DML-funktioner stöds till exempel inte för närvarande.

  • Arbetsbelastningen kan organiseras med hjälp av välbekanta begrepp:
  • Databaser – serverlös slutpunkt för SQL-pool kan ha flera databaser.
  • Scheman – I en databas kan det finnas en eller flera objektägarskapsgrupper som kallas scheman.
  • Vyer, lagrade procedurer, infogade tabellvärdesfunktioner
  • Externa resurser – datakällor, filformat och tabeller

Säkerhet kan framtvingas med hjälp av:

  • Inloggningar och användare
  • Autentiseringsuppgifter för att kontrollera åtkomsten till lagringskonton
  • Bevilja, neka och återkalla behörigheter per objektnivå
  • Azure Active Directory-integrering

T-SQL som stöds:

  • Fullständigt SELECT-ytområde stöds, inklusive en majoritet av SQL-funktionerna
  • CETAS – SKAPA EXTERN TABELL SOM SELECT
  • DDL-instruktioner som endast rör vyer och säkerhet

Serverlös SQL-pool har ingen lokal lagring, endast metadataobjekt lagras i databaser. Därför stöds inte T-SQL som är relaterat till följande begrepp:

  • Tables
  • Utlösare
  • Materialiserade vyer
  • Andra DDL-instruktioner än sådana som rör vyer och säkerhet
  • DML-uttryck

Tillägg

För att ge en smidig upplevelse för frågor om data som finns i filer i Data Lake utökar serverlös SQL-pool den befintliga OPENROWSET-funktionen genom att lägga till följande funktioner:

Fråga flera filer eller mappar

Frågefilformat för PARQUET

Fråge-DELTA-format

Olika format för avgränsad text (med anpassad fältavgränsare, radavgränsare, escape-tecken)

Cosmos DB analysarkiv

Läsa en vald delmängd av kolumner

Schemaferens

filename-funktion

filepath-funktion

Arbeta med komplexa typer och kapslade eller upprepade datastrukturer

Säkerhet

Serverlös SQL-pool erbjuder mekanismer för säker åtkomst till dina data.

Azure Active Directory-integrering och multifaktorautentisering

Med serverlös SQL-pool kan du centralt hantera identiteter för databasanvändare och andra Microsoft-tjänster med Azure Active Directory integrering. Den här funktionen förenklar hanteringen av behörighet och ger ökad säkerhet. Azure Active Directory (Azure AD) stöder multifaktorautentisering (MFA) för att öka säkerheten för data och program och samtidigt stödja en process för enkel inloggning.

Autentisering

Serverlös SQL-poolautentisering syftar på hur användare bevisar sin identitet vid anslutning till slutpunkten. Två typer av autentisering stöds:

  • SQL-autentisering

    Den här autentiseringsmetoden använder ett användarnamn och lösenord.

  • Azure Active Directory autentisering:

    Den här autentiseringsmetoden använder identiteter som hanteras av Azure Active Directory. För Azure AD-användare kan multifaktorautentisering aktiveras. Använd Active Directory-autentisering (integrerad säkerhet) närhelst det går.

Auktorisering

Auktorisering avser vad en användare kan göra i en serverlös SQL-pooldatabas och styrs av ditt användarkontos databasrollmedlemskap och behörigheter på objektnivå.

Om SQL-autentisering används finns SQL-användaren bara i en serverlös SQL-pool och behörigheterna är begränsade till objekten i en serverlös SQL-pool. Åtkomst till rekursbara objekt i andra tjänster (till exempel Azure Storage) kan inte beviljas till SQL-användare direkt eftersom den bara finns i omfånget för en serverlös SQL-pool. SQL-användaren måste använda någon av de auktoriseringstyper som stöds för att komma åt filerna.

Om Azure AD-autentisering används kan en användare logga in på en serverlös SQL-pool och andra tjänster, till exempel Azure Storage, och kan bevilja behörigheter till Azure AD-användaren.

Åtkomst till lagringskonton

En användare som är inloggad på den serverlösa SQL-pooltjänsten måste ha behörighet att komma åt och fråga filerna i Azure Storage. serverlös SQL-pool stöder följande auktoriseringstyper:

  • Signatur för delad åtkomst (SAS) ger delegerad åtkomst till resurser i lagringskontot. Med en SAS kan du ge klienter åtkomst till resurser i lagringskontot utan att dela kontonycklar. En SAS ger dig detaljerad kontroll över vilken typ av åtkomst du beviljar till klienter som har SAS: giltighetsintervall, beviljad behörighet, acceptabelt IP-adressintervall, godkänt protokoll (https/http).

  • Användaridentitet (kallas även "direkt") är en auktoriseringstyp där identiteten för den Azure AD-användare som är inloggad i en serverlös SQL-pool används för att auktorisera åtkomst till data. Innan du kommer åt data måste Azure Storage bevilja behörigheter till Azure AD-användaren för åtkomst till data. Den här auktoriseringstypen använder den Azure AD-användare som loggade in på en serverlös SQL-pool, och därför stöds den inte för SQL-användartyper.

  • Identitet för arbetsyta är en auktoriseringstyp där identiteten för Synapse-arbetsytan används för att ge åtkomst till data. Innan du kommer åt data måste Azure Storage bevilja behörigheter till arbetsytans identitet för åtkomst till data.

Åtkomst till Cosmos DB

Du måste skapa autentiseringsuppgifter på servernivå eller databasomfång med den skrivskyddade Cosmos DB för att komma åt Cosmos DB analysarkiv.

Nästa steg

Mer information om slutpunktsanslutning och frågefiler finns i följande artiklar: