Størrelse af datagateway i det lokale miljø

Denne artikel er målrettet Power BI-administratorer, der skal installere og administrere datagatewayen i det lokale miljø.

Gatewayen er påkrævet, når Power BI skal have adgang til data, der ikke er tilgængelige direkte via internettet. Den kan installeres på en server i det lokale miljø eller på en VM-hostet IaaS (Infrastruktur som en service).

Gateway-arbejdsbelastninger

Datagatewayen i det lokale miljø understøtter to arbejdsbelastninger. Det er vigtigt, at du først forstår disse arbejdsbelastninger, før vi kommer ind på gatewaystørrelsen og -anbefalingerne.

Arbejdsbelastning for cachelagrede data

Arbejdsbelastningen for cachelagrede data henter og transformerer kildedata til indlæsning i Power BI-datasæt. Det gør den i tre trin:

  1. Forbindelse: Gatewayen opretter forbindelse til kildedata
  2. Datahentning og transformation: Dataene hentes og transformeres om nødvendigt. Når det er muligt, sender Power Query-miksprogrammet transformationstrin til datakilden – hvilket kaldes forespørgselsdelegering . Hvis det ikke er muligt, skal transformationer udføres af gatewayen. I dette tilfælde forbruger gatewayen flere CPU- og hukommelsesressourcer.
  3. Overfør: Data overføres til Power BI-tjenesten – det er vigtigt med en pålidelig og hurtig internetforbindelse, især ved store datamængder

Diagram over cachelagrede data, der viser datagatewayen i det lokale miljø, som opretter forbindelse til kilder i det lokale miljø.

Direkte forbindelse- og DirectQuery-arbejdsbelastninger

Arbejdsbelastningen Direkte forbindelse og DirectQuery bruges mest i pass-through-tilstand. Power BI-tjenesten sender forespørgsler, og gatewayen svarer med forespørgselsresultater. Generelt fylder forespørgselsresultater ikke ret meget.

Denne arbejdsbelastning kræver CPU-ressourcer til routing af forespørgsler og forespørgselsresultater. Der er normalt meget mindre CPU-efterspørgsel end det, der kræves af arbejdsbelastningen for cachelagrede data – især når det er nødvendigt for at transformere data til cachelagring.

Sikker, hurtig og konsekvent forbindelse er vigtig for at sikre, at rapportbrugerne får en dynamisk oplevelse.

Diagram over direkte forbindelse og DirectQuery, der viser data gatewayen i det lokale miljø, som opretter forbindelse til datakilder i det lokale miljø.

Overvejelser i forbindelse med størrelse

Det kan afhænge af følgende variabler, hvordan du bestemmer den korrekte størrelse for din gateway computer:

  • For arbejdsbelastning for cachelagrede data:
    • Antallet af samtidige datasæt, der opdateres
    • Typerne af datakilder (relationsdatabase, analytisk database, datafeeds eller filer)
    • Den mængde data, der skal hentes fra datakilder
    • De transformationer, der skal udføres af Power Query-miksprogrammet
    • Den mængde data, der skal overføres til Power BI-tjenesten
  • For Direkte forbindelse- og DirectQuery-arbejdsbelastninger:
    • Antallet af samtidige rapportbrugere
    • Antallet af visuals på rapportsider (hvert enkelt visual sender mindst én forespørgsel)
    • Frekvensen af opdateringer af forespørgselscache for Power BI-dashboard
    • Antallet af rapporter i realtid, der bruger funktionen Automatisk sideopdatering
    • Angiver, om datasæt gennemtvinger sikkerhed på rækkeniveau (RLS)

Generelt kræver direkte forbindelse og DirectQuery-arbejdsbelastninger tilstrækkelige CPU-ressourcer, mens arbejdsbelastninger for cachelagede data kræver mere CPU og hukommelse. Begge arbejdsbelastninger afhænger af, at der er en god forbindelse til Power BI-tjenesten og datakilderne.

Bemærk

Power BI-kapaciteter sætter grænser for parallelle modelopdateringer og Direkte forbindelse- og DirectQuery-gennemløb. Der er ingen grund til at tilpasse gatewaystørrelsen, så den leverer mere end det, Power BI-tjenesten understøtter. Der gælder andre begrænsninger med Premium SKU (og A SKU med en tilsvarende størrelse). Du kan finde flere oplysninger i Hvad er Power BI Premium? (kapacitetsnoder).

Anbefalinger

Anbefalingerne for gatewaystørrelsen afhænger af mange variabler. I dette afsnit giver vi dig generelle anbefalinger, som du kan tage med i overvejelserne.

Startstørrelse

Det kan være svært at beregne den rigtige størrelse nøjagtigt. Vi anbefaler, at du starter med en maskine med mindst 8 CPU-kerner, 8 GB RAM og flere Gigabit-netværkskort. Du kan derefter måle en typisk gatewaybelastning ved at logføre tællerresultater for CPU- og hukommelsessystem. Du kan finde flere oplysninger under Overvåg og optimer ydeevne for data gateways i det lokale miljø.

Forbindelser

Planlæg den bedst mulige forbindelse mellem Power BI-tjenesten og din gateway samt din gateway og datakilderne.

  • Tilstræb pålidelighed, hurtige hastigheder og lave, ensartede ventetider
  • Fjern – eller reducer – maskinhop mellem gatewayen og dine datakilder
  • Fjern alle netværksbegrænsninger, der pålægges af firewall-proxy-laget. Du kan finde flere oplysninger om Power BI's slutpunkter i Føj Power BI URL-adresser til din hvidliste.
  • Konfigurer Azure ExpressRoute til at oprette en privat, administreret forbindelse til Power BI
  • Ved datakilder i Azure VM'er, skal du sikre, at VM'er er placeret sammen med Power BI-tjenesten
  • Sørg for, at der er en god forbindelse mellem gatewaymaskinen og Active Directory i det lokale miljø for arbejdsbelastninger for direkte forbindelser til SQL Server Analysis Services (SSAS), der involverer dynamisk sikkerhed på rækkeniveau

Clustering

I forbindelse med udrulninger i stor skala kan du oprette en gateway med flere klyngemedlemmer. Med klynger undgås enkelte fejlpunkter, og der kan udføres belastningsjustering af trafik på tværs af gateways. Du kan:

  • Installere en eller flere gateways i en klynge
  • Isolere arbejdsbelastninger til separate gateways eller klynger af gatewayservere

Du kan finde flere oplysninger under Administrer klynger med høj tilgængelighed og belastningsjustering for datagateways i det lokale miljø.

Datasætdesign og -indstillinger

Datasætdesign og deres indstillinger kan påvirke arbejdsbelastningen for gatewayen. Hvis du vil reducere gatewaybelastningen, kan du overveje følgende handlinger.

For importdatasæt:

  • Konfigurer mindre hyppig opdatering af data
  • Konfigurer trinvis opdatering for at minimere den mængde data, der skal overføres
  • Når det er muligt, skal du sørge for, at der foretages forespørgselsdelegering
  • Konverter designet til en DirectQuery-model eller sammensat model, især ved store datamængder eller behov for resultater med kort ventetid

For DirectQuery-datasæt:

  • Optimere datakilder samt model- og rapportdesign – du kan finde flere oplysninger under Vejledning til DirectQuery-modeller i Power BI Desktop
  • Opret sammenlægninger for at cachelagre resultater på højere niveauer og dermed reducere antallet af DirectQuery-anmodninger
  • Begræns intervaller for Automatisk sideopdatering i rapportdesign og kapacitetsindstillinger
  • Begræns opdateringsfrekvensen for dashboardcachen, især når der gennemtvinges dynamisk sikkerhed på rækkeniveau
  • Konverter designet til en importmodel eller sammensat model, især ved mindre datamængder eller i forbindelse med ikke-midlertidige data

For Direkte forbindelse-datasæt:

  • Begræns opdateringsfrekvensen for dashboardcachen, især når der gennemtvinges dynamisk sikkerhed på rækkeniveau

Næste trin

Du kan finde flere oplysninger, der er relateret til denne artikel, i følgende ressourcer: