Share via


Hvad er datawarehousing i Microsoft Fabric?

Gælder for: SQL Analytics-slutpunkt og warehouse i Microsoft Fabric

Microsoft Fabric giver kunderne et samlet produkt, der håndterer alle aspekter af deres databeboing ved at tilbyde en komplet SaaS-ified Data, Analytics og AI-platform, som er lake-centreret og åben. Grundlæggelsen af Microsoft Fabric gør det muligt for nybegyndere til den erfarne bruger at udnytte arbejdsbelastningerne Database, Analytics, Messaging, Data Integration og Business Intelligence via en omfattende, brugervenlig SaaS-oplevelse med Microsoft OneLake som det centrale element.

En søcentreret SaaS-oplevelse, der er bygget til ethvert kvalifikationsniveau

Microsoft Fabric introducerer et lake-centreret data warehouse, der er baseret på et distribueret behandlingsprogram i virksomhedsklasse, der giver branchens førende ydeevne i stor skala, samtidig med at behovet for konfiguration og administration fjernes. Ved hjælp af en brugervenlig SaaS-oplevelse, der er tæt integreret med Power BI, så det er nemt at analysere og rapportere, konvergerer Warehouse i Microsoft Fabric verden af datasøer og lagre med et mål om i høj grad at forenkle en organisations investering i deres analyseområde. Datawarehousing-arbejdsbelastninger drager fordel af SQL-motorens omfattende funktioner i et åbent dataformat, så kunderne kan fokusere på dataforberedelse, analyse og rapportering via en enkelt kopi af deres data, der er gemt i deres Microsoft OneLake.

Warehouse er udviklet til ethvert kompetenceniveau – fra udvikleren af borgeren til den professionelle udvikler, DBA eller datatekniker. Det omfattende sæt af oplevelser, der er indbygget i Microsoft Fabric-arbejdsområdet, gør det muligt for kunderne at reducere deres tid til indsigt ved at have en semantisk model, der er let at forbruge, og som altid er forbundet, og som er integreret med Power BI i DirectLake-tilstand. Dette giver mulighed for brancheførende ydeevne, der sikrer, at en kundes rapport altid har de nyeste data til analyse og rapportering. Forespørgsler på tværs af databaser kan udnyttes til hurtigt og problemfrit at bruge flere datakilder, der strækker sig over flere databaser, for at få hurtig indsigt og ingen dataduplikering.

Virtuelle lagre med forespørgsler på tværs af databaser

Microsoft Fabric giver kunderne mulighed for at stå op virtuelle lagre, der indeholder data fra stort set alle kilder, ved hjælp af genveje. Kunder kan bygge et virtuelt lager ved at oprette genveje til deres data, uanset hvor de er placeret. Et virtuelt lager kan bestå af data fra OneLake, Azure Data Lake Storage eller et andet cloudleverandørlager inden for en enkelt grænse uden duplikering af data.

Lås uden problemer op for værdi fra en lang række datakilder via den omfattende forespørgsel på tværs af databaser i Microsoft Fabric. Forespørgsler på tværs af databaser giver kunderne mulighed for hurtigt og problemfrit at bruge flere datakilder for at få hurtig indsigt og uden dataduplikering. Data, der er gemt i forskellige kilder, kan nemt sammenføjes, så kunderne kan levere omfattende indsigt, der tidligere krævede en betydelig indsats fra dataintegrations- og teknikerteams.

Forespørgsler på tværs af databaser kan oprettes via Visual Query-editoren, som giver indsigt i flere tabeller uden kode. SQL Query-editoren eller andre velkendte værktøjer, f.eks. SQL Server Management Studio (SSMS), kan også bruges til at oprette forespørgsler på tværs af databaser.

Administration af autonome arbejdsbelastninger

Lagre i Microsoft Fabric udnytter et brancheførende distribueret forespørgselsbehandlingsprogram, som giver kunderne arbejdsbelastninger, der har en naturlig isolationsgrænse. Der er ingen knapper til at dreje med den autonome tildeling og frafald af ressourcer til at tilbyde bedst i race ydeevne med automatisk skala og samtidighed indbygget. Sand isolation opnås ved at adskille arbejdsbelastninger med forskellige egenskaber og sikre, at ETL-job aldrig forstyrrer deres ad hoc-analyser og rapporteringsarbejdsbelastninger.

Åbent format til problemfri motorkompatibilitet

Data i lageret gemmes i parquetfilformatet og publiceres som Delta Lake Logs, hvilket muliggør ACID-transaktioner og interoperabilitet på tværs af motorer, der kan udnyttes via andre Microsoft Fabric-arbejdsbelastninger, f.eks. Spark, Pipelines, Power BI og Azure Data Explorer. Kunder behøver ikke længere at oprette flere kopier af deres data for at gøre det muligt for datateknikere med forskellige færdigheder. Datateknikere, der er vant til at arbejde i Python, kan nemt bruge de samme data, der blev modelleret og betjent af en data warehouse-professionel, der er vant til at arbejde i SQL. Samtidig kan BI-teknikere hurtigt og nemt bruge de samme data til at oprette et omfattende sæt visualiseringer i Power BI med postydeevne og ingen duplikering af data.

Adskillelse af lager og beregning

Beregning og lagring afkobles i et lager, hvilket gør det muligt for kunderne at skalere næsten øjeblikkeligt for at imødekomme kravene i deres virksomhed. Dette gør det muligt for flere beregningsprogrammer at læse fra enhver understøttet lagerkilde med robust sikkerhed og komplette ACID-transaktionsgarantier.

Det er nemt at indtage, indlæse og transformere i stor skala

Data kan overføres til lageret via pipelines, dataflow, forespørgsler på tværs af databaser eller kommandoen KOPIÉR IND. Når dataene er indtaget, kan de analyseres af flere forretningsgrupper via funktionalitet, f.eks. deling og forespørgsler på tværs af databaser. Tid til indsigt fremskyndes via en fuldt integreret BI-oplevelse via grafisk datamodellering, der er nem at bruge weboplevelsen til forespørgsler i Warehouse Editor.

Datawarehousing items i Microsoft Fabric

Der er to forskellige datawarehousing-elementer: SQL-analyseslutpunktet for Lakehouse og Warehouse.

SQL Analytics-slutpunktet for Lakehouse

Et SQL Analytics-slutpunkt er et lager, der automatisk genereres fra en Lakehouse i Microsoft Fabric. En kunde kan skifte fra visningen "Lake" i Lakehouse (som understøtter datakonstruktion og Apache Spark) til visningen "SQL" for det samme Lakehouse. SQL-analyseslutpunktet er skrivebeskyttet, og data kan kun ændres via visningen "Lake" i Lakehouse ved hjælp af Spark.

Via SQL Analytics-slutpunktet for Lakehouse har brugeren et undersæt af SQL-kommandoer, der kan definere og forespørge om dataobjekter, men ikke manipulere dataene. Du kan udføre følgende handlinger i SQL Analytics-slutpunktet:

  • Forespørg de tabeller, der refererer til data i Delta Lake-mapperne i søen.
  • Opret visninger, indbyggede TVF'er og procedurer for at indkapsle din semantik og forretningslogik i T-SQL.
  • Administrer tilladelser til objekterne.

I et Microsoft Fabric-arbejdsområde er et SQL Analytics-slutpunkt navngivet "SQL Analytics-slutpunkt" under kolonnen Type . Hver Lakehouse har et automatisk genereret SQL-analyseslutpunkt, der kan udnyttes via velkendte SQL-værktøjer, f.eks. SQL Server Management Studio, Azure Data Studio, Microsoft Fabric SQL Power Query-editor.

Skærmbillede, der viser SQL Analytics-slutpunktstypen i arbejdsområdet.

Hvis du vil i gang med SQL Analytics-slutpunktet, skal du se Bedre sammen: lakehouse og warehouse i Microsoft Fabric.

Synapse-datawarehouse

I et Microsoft Fabric-arbejdsområde er et Synapse Data Warehouse eller Warehouse mærket som 'Warehouse' under kolonnen Type . Et lager understøtter transaktioner, DDL- og DML-forespørgsler.

Skærmbillede, der viser lagertypen i arbejdsområdet.

I modsætning til et SQL Analytics-slutpunkt, der kun understøtter skrivebeskyttede forespørgsler og oprettelse af visninger og TVF'er, har et lager fuld DDL- og DML-understøttelse af transaktioner og oprettes af en kunde. Et lager udfyldes af en af de understøttede dataindtagelsesmetoder, f.eks . COPY INTO, Pipelines, Dataflows eller indstillinger for dataindtagelse på tværs af databaser, f.eks . CREATE TABLE AS SELECT (CTAS), INSERT.. SELECT eller SELECT INTO.

Hvis du vil i gang med lageret, skal du se Opret et lager i Microsoft Fabric.

Sammenlign lageret og SQL Analytics-slutpunktet for Lakehouse

I dette afsnit beskrives forskellene mellem warehouse- og SQL-analyseslutpunktet i Microsoft Fabric.

Diagram over Fabric-arbejdsområdet til datawarehousing, herunder SQL Analytics-slutpunktet og Warehouse.

SQL Analytics-slutpunktet er et skrivebeskyttet lager, der genereres automatisk ved oprettelse fra en Lakehouse i Microsoft Fabric. Delta-tabeller, der oprettes via Spark i en Lakehouse, kan automatisk registreres i SQL Analytics-slutpunktet som tabeller. SQL Analytics-slutpunktet gør det muligt for datateknikere at bygge et relationslag oven på fysiske data i Lakehouse og vise dem for analyse- og rapporteringsværktøjer ved hjælp af SQL-forbindelsesstreng. Dataanalytikere kan derefter bruge T-SQL til at få adgang til Lakehouse-data ved hjælp af Synapse Data Warehouse. Brug SQL Analytics-slutpunktet til at designe dit lager til BI-behov og betjene data.

Synapse Data Warehouse eller Warehouse er et "traditionelt" data warehouse og understøtter alle T-SQL-transaktionsfunktioner som f.eks. et virksomhedsdata warehouse. I modsætning til SQL Analytics-slutpunktet, hvor tabeller og data oprettes automatisk, har du fuld kontrol over, hvordan du opretter tabeller, indlæser, transformerer og forespørger dine data i data warehouse ved hjælp af enten Microsoft Fabric-portalen eller T-SQL-kommandoerne.

Du kan finde flere oplysninger om at forespørge om dine data i Microsoft Fabric under Forespørg SQL Analytics-slutpunktet eller Warehouse i Microsoft Fabric.

Sammenlign forskellige lagerfunktioner

For bedst muligt at kunne håndtere dine analyseanvendelsessager er der en række funktioner tilgængelige for dig. Generelt kan lageret opfattes som en delmængde af alle andre funktioner, hvilket giver en synergistisk relation mellem alle andre analysetilbud, der leverer T-SQL.

Inden for stof er der brugere, der muligvis skal beslutte mellem et lager, Lakehouse og endda en Power BI-datamart.

Microsoft Fabric-tilbud

Lageragersted

SQL Analytics-slutpunktet for Lakehouse

Power BI-datamart


Licenser

Fabric eller Power BI Premium

Fabric eller Power BI Premium

Kun Power BI Premium


Primære egenskaber

ACID-kompatibel, fuld datawarehousing med transaktionsunderstøttelse i T-SQL.

Skrivebeskyttet, systemoprettede SQL-analyseslutpunkt for Lakehouse til T-SQL-forespørgsler og -servering. Understøtter analyser på Lakehouse Delta-tabellerne og de Delta Lake-mapper, der refereres til via genveje.

Datawarehousing og T-SQL-forespørgsler uden kode


Udviklerprofil

SQL-udviklere eller borgerudviklere

Dataudvikler eller SQL Developers

Kun borgerudvikler


Anbefalet brugscase

  • Datawarehousing til virksomhedsbrug
  • Datawarehousing understøttende afdelings-, forretningsenheds- eller selvbetjeningsbrug
  • Struktureret dataanalyse i T-SQL med tabeller, visninger, procedurer og funktioner og avanceret SQL-understøttelse af BI
  • Udforskning og forespørgsel af deltatabeller fra lakehouse
  • Midlertidige data og arkiveringszone til analyse
  • Medallion lakehouse arkitektur med zoner til bronze, sølv og guld analyse
  • Parring med Warehouse til virksomhedsanalyseanvendelsessager
  • Brugscases for små afdelings- eller forretningsenheder
  • Use cases for selvbetjent datawarehousing
  • Landingszone for Power BI-dataflow og enkel SQL-understøttelse af BI

Udviklingsoplevelse

  • Warehouse Editor med fuld understøttelse af T-SQL-dataindtagelse, modellering, udvikling og forespørgsler om brugergrænsefladeoplevelser i forbindelse med dataindtagelse, modellering og forespørgsel
  • Understøttelse af læse-/skriveadgang til værktøjer fra 1. og 3. part
  • Lakehouse SQL Analytics-slutpunkt med begrænset T-SQL-understøttelse af visninger, tabelværdifunktioner og SQL-forespørgsler
  • Brugergrænsefladeoplevelser til udformning og forespørgsel
  • Begrænset T-SQL-understøttelse af værktøjer fra 1. og 3. part
  • Datamart Editor med understøttelse af brugergrænsefladeoplevelser og forespørgsler
  • Brugergrænsefladeoplevelser til dataindtagelse, modellering og forespørgsel
  • Skrivebeskyttet understøttelse af værktøjer fra 1. og 3. part

T-SQL-funktioner

Fuld DQL-, DML- og DDL T-SQL-understøttelse, fuld transaktionssupport

Fuld DQL, ingen DML, begrænset DDL T-SQL-understøttelse, f.eks. SQL-visninger og TVF'er

Kun fuld DQL


Dataindlæsning

SQL, pipelines, dataflow

Spark, pipelines, dataflow, genveje

Kun dataflow


Understøttelse af deltatabel

Læser og skriver Delta-tabeller

Læser deltatabeller

I/T


Lagerlag

Åbn dataformat – Delta

Åbn dataformat – Delta

I/T


Automatisk genereret skema i SQL Analytics-slutpunktet for Lakehouse

SQL Analytics-slutpunktet administrerer de automatisk genererede tabeller, så brugerne af arbejdsområdet ikke kan ændre dem. Brugerne kan forbedre databasemodellen ved at tilføje deres egne SQL-skemaer, visninger, procedurer og andre databaseobjekter.

For hver Delta-tabel i Lakehouse genererer SQL-analyseslutpunktet automatisk én tabel.

Tabeller i SQL Analytics-slutpunktet oprettes med en forsinkelse. Når du har oprettet eller opdateret Delta Lake-mappen/-tabellen i søen, oprettes/opdateres den lagertabel, der refererer til dataene i søen, ikke med det samme. Ændringerne anvendes på lageret efter 5-10 sekunder.

Du kan finde automatisk genererede skemadatatyper for SQL-analyseslutpunktet under Datatyper i Microsoft Fabric.