Nastavení velikosti místní brány datOn-premises data gateway sizing

Tento článek je určen správcům Power BI, kteří potřebují nainstalovat a spravovat místní bránu dat.This article targets Power BI administrators who need to install and manage the on-premises data gateway.

Brána je potřeba pokaždé, když musí Power BI přistupovat k datům, která nejsou přístupná přímo po internetu.The gateway is required whenever Power BI must access data that isn't accessible directly over the Internet. Může být nainstalovaná na místním serveru nebo na virtuálním počítači, kde bude hostovaná jako IaaS (infrastruktura jako služba).It can be installed on a server on-premises, or VM-hosted Infrastructure-as-a-Service (IaaS).

Úlohy brányGateway workloads

Místní brána dat podporuje dvě úlohy.The on-premises data gateway supports two workloads. Než se budeme věnovat velikosti brány a dalším doporučením, je potřeba napřed porozumět těmto úlohám.It's important you first understand these workloads before we discuss gateway sizing and recommendations.

Úloha ukládání dat do mezipamětiCached data workload

Úloha Data v mezipaměti načítá a transformuje zdrojová data, aby bylo možné je načíst do datových sad Power BI.The Cached data workload retrieves and transforms source data for loading into Power BI datasets. Děje se to ve třech krocích:It does so in three steps:

  1. Připojení: Brána se připojí ke zdrojovým datům.Connection: The gateway connects to source data
  2. Načítání dat a jejich transformace: Data se načtou, a pokud je to potřeba, transformují se.Data retrieval and transformation: Data is retrieved, and when necessary, transformed. Pokud je to možné, mashupový modul Power Query nabídne zdroji dat transformační kroky. Tento postup se označuje jako posouvání dotazů .Whenever possible, the Power Query mashup engine pushes transformation steps to the data source—it's known as query folding. Pokud to není možné, provede transformace brána.When it's not possible, transformations must be done by the gateway. V takovém případě brána spotřebovává více procesorových a paměťových prostředků.In this case, the gateway will consume more CPU and memory resources.
  3. Přenos: Data se přenášejí do služby Power BI. K tomu je důležité spolehlivé a rychlé internetové připojení. Platí to zvlášť u velkých objemů dat.Transfer: Data is transferred to the Power BI service—a reliable and fast Internet connection is important, especially for large data volumes

Diagram dat mezipaměti znázorňující místní bránu dat připojenou k místním zdrojům

Úlohy živého připojení a DirectQueryLive Connection and DirectQuery workloads

Úlohy živého připojení a DirectQuery fungují většinou v předávacím režimu.The Live Connection and DirectQuery workload works mostly in pass-through mode. Služba Power BI odešle dotazy a brána odpoví výsledky dotazů.The Power BI service sends queries, and the gateway responds with query results. Obecně platí, že výsledky dotazů jsou co do velikosti malé.Generally, query results are small in size.

Ke směrování dotazů a výsledků dotazů vyžaduje tato úloha prostředky procesoru.This workload requires CPU resources for routing queries and query results. Požadavky na procesor jsou obvykle mnohem menší, než vyžaduje úloha ukládání dat do mezipaměti – zvlášť pokud je kvůli ukládání do mezipaměti potřeba data transformovat.Usually there's much less demand for CPU than is required by the Cache data workload—especially when it's required to transform data for caching.

K zajištění rychlé odezvy prostředí pro uživatele sestavy je důležité spolehlivé, rychlé a nepřerušované připojení.Reliable, fast, and consistent connectivity is important to ensure report users have responsive experiences.

Diagram živého připojení a DirectQuery znázorňující místní bránu dat připojenou k místním zdrojům

Důležité informace o velikostiSizing considerations

Při volbě správné velikosti počítače se síťovou bránou je potřeba vzít v úvahu následující proměnné:Determining the correct sizing for your gateway machine can depend on the following variables:

  • Úlohy ukládání dat do mezipaměti:For Cache data workloads:
    • Počet současných aktualizací datových sadThe number of concurrent dataset refreshes
    • Typy zdrojů dat (relační databáze, analytická databáze, datové kanály nebo soubory)The types of data sources (relational database, analytic database, data feeds, or files)
    • Objem dat načítaných ze zdrojů datThe volume of data to be retrieved from data sources
    • Požadované transformace prováděné mashupovým modulem Power QueryAny transformations required to be done by the Power Query mashup engine
    • Objem dat přenášených do služby Power BIThe volume of data to be transferred to the Power BI service
  • Úlohy živého připojení a DirectQuery:For Live Connection and DirectQuery workloads:
    • Počet současných uživatelů sestavyThe number of concurrent report users
    • Počet vizuálů na stránkách sestavy (každý vizuál odešle alespoň jeden dotaz)The number of visuals on report pages (each visual sends at least one query)
    • Frekvence aktualizací mezipaměti dotazů pro Řídicí panel Power BIThe frequency of Power BI dashboard query cache updates
    • Počet sestav, které v reálném čase využívají funkci Automatická aktualizace stránkyThe number of real-time reports using the Automatic page refresh feature
    • Zda datové sady vyžadují zabezpečení na úrovni řádků (RLS)Whether datasets enforce Row-level Security (RLS)

Obecně sice platí, že úlohy živého připojení a DirectQuery vyžadují dostatečný procesor, ale úlohy ukládání dat do mezipaměti vyžadují větší procesor a více paměti.Generally, Live Connection and DirectQuery workloads require sufficient CPU, while Cache data workloads require more CPU and memory. U obou úloh záleží na dobrém připojení ke službě Power BI a na zdrojích dat.Both workloads depend on good connectivity with the Power BI service, and the data sources.

Poznámka

Kapacita Power BI má určitý limit, co se týče paralelních aktualizací modelu a propustnosti živého připojení a připojení DirectQuery.Power BI capacities impose limits on model refresh parallelism, and Live Connection and DirectQuery throughput. Proto je zbytečné nastavovat kvůli většímu výkonu větší brány, než jaké podporuje služba Power BI.There's no point sizing your gateways to deliver more than what the Power BI service supports. Tyto limity se liší podle SKU úrovně Premium (a skladových jednotek A odpovídající velikosti).Limits differ by Premium SKU (and equivalently sized A SKU). Další informace najdete v tématu Co je Power BI Premium? (uzly kapacity).For more information, see What is Power BI Premium? (Capacity nodes).

DoporučeníRecommendations

Doporučení týkající se velikosti brány závisejí na mnoha proměnných.Gateway sizing recommendations depend on many variables. V této části nabízíme obecná doporučení, která můžete vzít v úvahu.In this section, we provide you with general recommendations that you can take into consideration.

Počáteční velikostInitial sizing

Přesný odhad správné velikosti může být obtížný.It can be difficult to accurately estimate the right size. Doporučujeme začít počítačem, který má alespoň 8 jader CPU, 8 GB paměti RAM a síťové adaptéry o rychlosti několika gigabitů.We recommend that you start with a machine with at least 8 CPU cores, 8 GB of RAM, and multiple Gigabit network adapters. K měření úlohy typické brány můžete použít protokolování systémových čítačů procesoru a paměti.You can then measure a typical gateway workload by logging CPU and memory system counters. Další informace najdete v tématu Monitorování a optimalizace výkonu místní brány dat.For more information, see Monitor and optimize on-premises data gateway performance.

PřipojeníConnectivity

Mezi službou Power BI a branou a mezi branou a zdroji dat naplánujte co nejlepší připojení.Plan for the best possible connectivity between the Power BI service and your gateway, and your gateway and the data sources.

  • Snažte se, aby spojení bylo spolehlivé, rychlé a mělo nízkou konzistentní latenci.Strive for reliability, fast speeds, and low, consistent latencies
  • Úplně vylučte nebo omezte počítačové směrování mezi branou a vašimi zdroji dat.Eliminate—or reduce—machine hops between the gateway and your data sources
  • Odstraňte omezování šířky pásma sítě způsobené vrstvou brány firewall na proxy serveru.Remove any network throttling imposed by your firewall proxy layer. Další informace o koncových bodech Power BI najdete v tématu Přidání adres URL Power BI do seznamu povolených.For more information about Power BI endpoints, see Add Power BI URLs to your allow list.
  • Nakonfigurujte službu Azure ExpressRoute, která slouží k vytvoření privátních spravovaných připojení k Power BI.Configure Azure ExpressRoute to establish private, managed connections to Power BI
  • U zdrojů dat na virtuálních počítačích Azure ověřte, že jsou tyto virtuální počítače umístěné společně se službou Power BI.For data sources in Azure VMs, ensure the VMs are colocated with the Power BI service
  • U úloh živého připojení ke službě SQL Server Analysis Services (SSAS), které zahrnují dynamické zabezpečení na úrovni řádků, zajistěte dobré spojení mezi počítačem, na kterém je brána, a místní službou Active Directory.For Live Connection workloads to SQL Server Analysis Services (SSAS) involving dynamic RLS, ensure good connectivity between the gateway machine and the on-premises Active Directory

ClusteringClustering

Při velkokapacitním nasazení můžete vytvořit bránu clusterových instalací.For large-scale deployments, you can create a gateway of cluster installations. Clustery brání vzniku kritických prvků způsobujících selhání a vyrovnávají zatížení mezi branami.Clusters avoid single points of failure, and can load balance traffic across gateways. Další možnosti:You can:

  • Nainstalujte jednu nebo více bran, které tvoří cluster.Install one or more gateways in a cluster
  • Oddělte úlohy do samostatných bran nebo do clusterů serverů s branami.Isolate workloads to standalone gateways, or clusters of gateway servers

Další informace najdete v tématu Správa místních vysoce dostupných clusterů bran dat a vyrovnávání zatížení.For more information, see Manage on-premises data gateway high-availability clusters and load balancing.

Návrh a nastavení datové sadyDataset design and settings

Zatížení brány ovlivňuje návrh a nastavení datové sady.Dataset design, and their settings, can impact on gateway workloads. Pokud chcete zmenšit zatížení brány úlohami, můžete zvážit následující akce.To reduce gateway workload, you can consider the following actions.

U importovaných datových sad:For Import datasets:

  • Nakonfigurujte méně častou aktualizaci dat.Configure less frequent data refresh
  • Nakonfigurujte přírůstkovou aktualizaci, která minimalizuje množství přenášených dat.Configure incremental refresh to minimize the amount of data to transfer
  • Pokud je to možné, používejte posouvání dotazů.Whenever possible, ensure query folding takes place
  • Zejména u velkých objemů dat nebo pokud potřebujete dosáhnout nízké latence, převeďte návrh na model DirectQuery nebo na složený model.Especially for large data volumes or a need for low-latency results, convert the design to a DirectQuery or Composite model

U datových sad DirectQuery:For DirectQuery datasets:

  • Optimalizujte návrhy zdrojů dat, modelů a sestav. Další informace najdete v tématu Pokyny k modelu DirectQuery v Power BI Desktopu.Optimize data sources, model, and report designs—for more information, see DirectQuery model guidance in Power BI Desktop
  • Vytvořte agregace, aby bylo možné uložit souhrnné výsledky do mezipaměti, a snížit tak počet požadavků DirectQuery.Create aggregations to cache higher-level results to reduce the number of DirectQuery requests
  • V navržených sestavách a nastavených kapacitách omezte intervaly automatické aktualizace stránky.Restrict Automatic page refresh intervals, in report designs and capacity settings
  • Pokud se vyžaduje dynamické zabezpečení na úrovni řádků (RLS), omezte frekvenci aktualizace mezipaměti řídicího panelu.Especially when dynamic RLS is enforced, restrict dashboard cache update frequency
  • V případě menších objemů dat nebo u nekolísajících dat převeďte návrh na model importu nebo na složený model.Especially for smaller data volumes or for non-volatile data, convert the design to an Import or Composite model

U datových sad s živým připojením:For Live Connection datasets:

  • Pokud se vyžaduje dynamické zabezpečení na úrovni řádků (RLS), omezte frekvenci aktualizace mezipaměti řídicího panelu.Especially when dynamic RLS is enforced, restrict dashboard cache update frequency

Další krokyNext steps

Další informace související s tímto článkem najdete v následujících tématech:For more information related to this article, check out the following resources: