Dimensionering av lokal datagateway

Den här artikeln riktar sig till Power BI-administratörer som behöver installera och hantera en lokal datagateway.

Gatewayen krävs när Power BI behöver få åtkomst till data som inte är direkt tillgängliga via Internet. Den kan installeras på en lokal server eller en VM-baserad infrastruktur som en tjänst (IaaS).

Gateway-arbetsbelastningar

Den lokala datagatewayen stöder två arbetsbelastningar. Det är viktigt att du först förstår dessa arbetsbelastningar innan vi diskuterar gatewaydimensionering och rekommendationer.

Cachelagrad dataarbetsbelastning

Arbetsbelastningen Cachelagrade data hämtar och transformerar källdata för inläsning till Power BI-datamängder. Den gör detta i tre steg:

  1. Anslutning: Gatewayen ansluter till källdata
  2. Datahämtning och transformering: Data hämtas och transformeras när så behövs. Närhelst det är möjligt skickar Power Query-kombinationsmotorn transformeringssteg till datakällan. Detta kallas frågedelegering . När det inte är möjligt måste transformeringarna göras av gatewayen. I det här fallet förbrukar gatewayen mer processor- och minnesresurser.
  3. Överföring: Data överförs till Power BI-tjänsten – en tillförlitlig och snabb Internet-anslutning är viktig, särskilt för stora datavolymer

Diagram med cachedata som visar hur den lokala datagatewayen ansluter till lokala källor.

Live-anslutning och DirectQuery-arbetsbelastningar

Live-anslutningen och DirectQuery-arbetsbelastningen fungerar huvudsakligen i genomgångsläge. Power BI-tjänsten skickar frågor och gatewayen svarar med frågeresultat. Frågeresultaten är vanligtvis små till storleken.

Den här arbetsbelastningen kräver CPU-resurser för routning av frågor och frågeresultat. Vanligtvis är CPU-efterfrågan betydligt mindre än vad som krävs av cachedataarbetsbelastningen, i synnerhet när den måste transformera data för cachelagring.

En tillförlitlig, snabb och konsekvent anslutning är viktig för att säkerställa att rapportanvändarna får dynamiska upplevelser.

Diagram med Live-anslutning och DirectQuery som visar hur den lokala datagatewayen ansluter till lokala källor.

Överväganden för dimensionering

Att fastställa rätt dimensionering för din gatewaydator kan bero på följande variabler:

  • För cachedataarbetsbelastningar:
    • Antalet uppdateringar av samtidiga datamängder
    • Typer av datakällor (relationsdatabas, analysdatabas, dataflöden eller filer)
    • Den mängd data som ska hämtas från datakällor
    • Alla transformeringar som krävs av Power Query-kombinationsmotorn
    • Den mängd data som ska överföras till Power BI-tjänsten
  • För live-anslutning och DirectQuery-arbetsbelastningar:
    • Antal samtidiga rapportanvändare
    • Antalet visuella objekt på rapportsidor (varje visuellt objekt skickar minst en fråga)
    • Frekvensen för uppdateringar av Power BI-instrumentpanelens frågecache
    • Antalet rapporter i realtid som använder funktionen Automatisk siduppdatering
    • Huruvida datamängder ska tvinga säkerhet på radnivå (RLS) eller inte

Vanligtvis är CPU-kapaciteten tillräcklig för live-anslutning och DirectQuery-arbetsbelastningar, medan cachedataarbetsbelastningar kräver mer CPU-kraft och minne. Båda arbetsbelastningarna beror på en lämplig anslutning till Power BI-tjänsten och datakällorna.

Anteckning

Power BI-kapaciteterna begränsar modelluppdateringsparallellitet och dataflödet för live-anslutning och DirectQuery. Det finns ingen mening med att dimensionera dina gatewayar till mer än vad Power BI-tjänsten stöder. Gränserna skiljer sig från Premium-SKU:n (och lika stora A-SKU:n). Mer information finns i Vad är Power BI Premium? (Kapacitetsnoder).

Rekommendationer

Rekommendationerna för gatewaydimensionering beror på flera variabler. I det här avsnittet får du allmänna rekommendationer att överväga.

Ursprunglig dimensionering

Det kan vara svårt att bedöma rätt storlek korrekt. Vi rekommenderar att du börjar med en dator med minst 8 CPU-kärnor, 8 GB RAM-minne och flera Gigabit-nätverkskort. Du kan sedan mäta en typisk gatewayarbetsbelastning genom att logga CPU- och minnessystemsräknare. Mer information finns i Övervaka och optimera lokala datagatewayprestanda.

Anslutning

Planera för bästa möjliga anslutning mellan Power BI-tjänsten och din gateway, och mellan din gateway och datakällorna.

  • Sträva efter tillförlitlighet, snabba hastigheter och låga konsekventa fördröjningar
  • Eliminera – eller minska – datorhopp mellan gatewayen och dina datakällor
  • Ta bort eventuella nätverksbegränsningar som införts av brandväggsproxyns lager. Mer information om Power BI-slutpunkter finns i Lägg till Power BI-URL:er till listan över tillåtna.
  • Konfigurera Azure ExpressRoute för att upprätta en privat, hanterad anslutning till Power BI
  • När det gäller datakällor på virtuella Azure-datorer, så se till att de virtuella datorerna samplaceras med Power BI-tjänsten
  • När det gäller de live-anslutningsarbetsbelastningar till SQL Server Analysis Services (SSAS) som involverar dynamisk RLS, så säkerställ en lämplig anslutning mellan gatewaydatorn och Active Directory lokalt

Klustring

För storskaliga distributioner kan du skapa en gateway med flera klustermedlemmar. Kluster undviker enskilda felpunkter, och kan belastningsutjämna trafik mellan gatewayer. Du kan:

  • Installera en eller flera gatewayar i ett kluster
  • Isolera arbetsbelastningar till fristående gatewayar eller gatewayserverkluster

Mer information finns i Hantera lokala datagatewaykluster med hög tillgänglighet och belastningsutjämning.

Datamängdsdesign och inställningar

Datamängdsdesignen och dess inställningar kan påverka gatewayarbetsbelastningar. Du kan minska gatewayarbetsbelastningen med hjälp av följande åtgärder.

För importdatamängder:

  • Konfigurera mindre frekvent uppdatering av data
  • Konfigurera stegvis uppdatering så att mängden data som överförs minimeras
  • Närhelst det är möjligt bör du se till att frågedelegering äger rum
  • I synnerhet när det gäller stora datavolymer, eller då det finns behov av resultat med låg latens, så konvertera designen till en DirectQuery-modell eller en sammansatt modell

För DirectQuery-datamängder:

  • Optimera datakällor, modell och rapportdesign. Mer information finns i DirectQuery-modellvägledning i Power BI Desktop
  • Skapa aggregeringar om du vill cachelagra högnivåresultat och därmed minska antalet DirectQuery-begäranden
  • Begränsa intervallerna för automatisk siduppdatering i rapportdesigner och kapacitetsinställningar
  • I synnerhet när dynamisk RLS tillämpas, bör du begränsa uppdateringsfrekvensen för instrumentpanelens cache
  • I synnerhet när det gäller mindre datavolymer eller beständiga data, så konvertera designen till en importmodell eller en sammansatt modell

För live-anslutningsdatamängder:

  • I synnerhet när dynamisk RLS tillämpas, bör du begränsa uppdateringsfrekvensen för instrumentpanelens cache

Nästa steg

Mer information om ämnet i den här artikeln finns i följande resurser: