Vzorkovanie s vysokou hustotou v bodových grafoch v Power BI

Algoritmus vzorkovania v službe Power BI zlepšuje spôsob zobrazenia bodových grafov s údajmi s vysokou hustotou.

Môžete napríklad vytvoriť bodový graf aktivity predaja organizácie, pričom každý obchod bude mať desiatky tisíc údajových bodov za rok. Bodový graf týchto informácií bude vzorkovať údaje z zmysluplného vyjadrenia týchto údajov na ilustráciu výskytu predaja v priebehu času. Podrobnosti o vzorkovaní s vysokou hustotou sú popísané v tomto článku.

Screenshot of a scatter chart, showing the high-density sampling data.

Poznámka

Algoritmus vzorkovania s vysokou hustotou popísaný v tomto článku je k dispozícii v bodových grafoch v aplikácii Power BI Desktopaj v služba Power BI.

Ako fungujú bodové grafy s vysokou hustotou

V minulosti sa bodový graf v službe Power BI vytváral tak, že sa vybrala kolekcia vzorových údajových bodov v plnom rozsahu základných údajov deterministickým spôsobom. Konkrétne by Power BI vybral prvý a posledný riadok údajov v rade bodových grafov a potom rovnomerne rozdelil zostávajúce riadky tak, aby sa do bodového grafu vykreslilo celkovo 3 500 údajových bodov. Ak mala napríklad vzorka 35 000 riadkov, na vykreslenie sa vybral prvý a posledný riadok a potom sa vykreslil každý desiaty riadok (35 000/10 = každý desiaty riadok = 3 500 údajových bodov). V minulosti sa takisto nezdalo zobraziť hodnoty null ani body, ktoré sa nedali vykreslenie, napríklad textové hodnoty v rade údajov, a preto sa nezovážili pri generovaní vizuálu. Pri takomto vzorkovaní bola vnímaná hustota bodového grafu založená na reprezentatívnych údajových bodoch, a preto bola implicitná vizuálna hustota závisiaca od týchto bodov, a nie od úplnej kolekcie základných údajov.

Keď povolíte vzorkovanie s vysokou hustotou, Power BI implementuje algoritmus, ktorý eliminuje prekrývajúce sa body a zabezpečí, aby boli body vo vizuáli pri interakcii dostupné. Algoritmus tiež zaisťuje, aby boli všetky body z množiny údajov zastúpené vo vizuáli, a dodáva kontext k významu vybratých bodov – nie len vykreslenie reprezentatívnej vzorky.

Podľa definície sú údaje s vysokou hustotou vzorkované na vytvorenie vizualizácií, ktoré reagujú na interaktivitu. Príliš veľa údajových bodov vo vizuáli ho môže spomaliť a odvádzať pozornosť od viditeľnosti trendov. Spôsob vzorkovania údajov poháňa vytvorenie algoritmu vzorkovania, ktorý zabezpečí čo najlepšie vizualizačné skúsenosti a zastúpenie všetkých údajov. V Power BI je tento algoritmus vylepšený tak, aby zaisťuje čo najlepšiu kombináciu odozvy, vyjadrenia a zachovania dôležitých bodov v celej množine údajov.

Poznámka

Bodové grafy využívajúce vzorkovanie s vysokou hustotou sa najlepšie vykresľujú v štvorcových vizuáloch (ako všetky bodové grafy).

Ako funguje algoritmus vzorkovania bodového grafu

Algoritmus vzorkovania s vysokou hustotou pre bodové grafy používa metódy, ktoré efektívnejšie zaznamenávajú a reprezentujú základné údaje a eliminujú prekrývajúce sa body. Algoritmus začína malým polomerom pre každý údajový bod, čo je vizuálny kruh pre daný bod na vizualizácii. Potom sa zväčší rádius všetkých údajových bodov. Keď sa dva údajové body prekrývajú, jeden kruh s veľkosťou zvýšeného polomeru ich predstavuje prekrytými údajovými bodmi. Algoritmus ďalej zväčuje rádius údajových bodov, kým jeho hodnota nebude mať za následok, že v bodovom grafe sa zobrazí dostatočný počet údajových bodov (3 500).

Metódy tohto algoritmu zaisťujú, že vo výslednom vizuáli sú znázornené odľahlé hodnoty. Algoritmus rešpektuje mierku pri určovaní prekrývania tak, že exponenciálne stupnice sa vizualizujú verne k základným vizualizovaným bodom.

Tento algoritmus zároveň zachováva celkový tvar bodového grafu.

Poznámka

Pri používaní algoritmu vzorkovania s vysokou hustotou pre bodové grafy je cieľom presná distribúcia údajov, nie implicitná vizuálna hustota. Môžete sa napríklad pozrieť na bodový graf s mnohými prekrývajúcimi sa kruhmi (hustota) v určitej oblasti a predstaviť si, že tam musí byť zhluk mnohých údajových bodov. Keďže algoritmus vzorkovania s vysokou hustotou môže použiť jeden kruh na znázornenie mnohých údajových bodov, takáto implicitná vizuálna hustota alebo klastrovanie sa nezobrazi. Ak chcete získať ďalšie podrobnosti o danej oblasti, môžete priblížiť zobrazenie pomocou rýchlych filtrov.

Okrem toho sa údajové body, ktoré sa nedajú vykresliť, ako napríklad hodnoty null alebo textové hodnoty, ignorujú, takže sa vyberie ďalšia hodnota, ktorú možno vykresliť. Tým sa ďalej zabezpečí zachovanie skutočného tvaru bodového grafu.

Keď sa pre bodové grafy použije štandardný algoritmus

Za určitých okolností sa v bodovom grafe nedá použiť vzorkovanie s vysokou hustotou, a preto sa použije pôvodný algoritmus. Ide o tieto situácie:

  • Ak kliknete pravým tlačidlom myši na hodnotu v časti Hodnoty a v ponuke nastavíte možnosť Zobraziť položky bez údajov , bodový graf sa vráti k pôvodnému algoritmu.

    Screenshot of the Visualization menu, showing the Values pane with Show items with no data selection.

  • Ak sa objaví ľubovoľná hodnota v poli Os prehrávania, bodový graf sa vráti k pôvodnému algoritmu.

  • Ak v bodovom grafe chýba os X aj os Y, graf sa vráti k pôvodnému algoritmu.

  • Ak použijete možnosť Čiara pomeru na table Analýza , graf sa vráti k pôvodnému algoritmu.

    Screenshot of the Visualization menu, showing a pointer to the Analytics pane and Ratio line.

Ako zapnúť vzorkovanie s vysokou hustotou pre bodový graf

Ak chcete prepnúť vzorkovanie s vysokou hustotou na možnosť Zapnuté, vyberte bodový graf, prejdite na tablu vizuálu Formát, rozbaľte kartu Všeobecné a v jej spodnej časti prepnite jazdec Vzorkovanie s vysokou hustotou do polohy Zapnuté.

Screenshot of the Visualization menu, showing a pointer to the Format visual pane, General card, and High Density Sampling toggle slider.

Poznámka

Po zapnutí prepínača sa Power BI pokúsi použiť algoritmus vzorkovania s vysokou hustotou vždy, keď to bude možné. Keď algoritmus nemožno použiť, napríklad keď umiestnite hodnotu na os Prehrať, prepínač zostane zapnutý, aj keď sa graf vráti k štandardnému algoritmu. Ak neskôr odstránite hodnotu z osi Prehrať alebo sa zmenia podmienky, ktoré umožnia použiť algoritmus vzorkovania s vysokou hustotou, v grafe sa automaticky použije vzorkovanie s vysokou hustotou, pretože je funkcia aktívna.

Poznámka

Údajové body sa zoskupujú alebo vyberajú podľa indexu. To, či máte legendu, nemá na vzorkovanie pre algoritmus vplyv. Ovplyvní to len zoradenie vizuálu.

Dôležité informácie a obmedzenia

Algoritmus vzorkovania s vysokou hustotou je dôležitým vylepšenie služby Power BI. Algoritmus vzorkovania s vysokou hustotou však funguje len so živými pripojeniami k modelom založeným na služba Power BI, importovaným modelom alebo DirectQuery.