High-densitysampling in Power BI-spreidingsdiagrammenHigh-density sampling in Power BI scatter charts

Notitie

Deze visuals kunnen zowel in Power BI Desktop als in de Power BI-service worden gemaakt en bekeken.These visuals can be created and viewed in both Power BI Desktop and the Power BI service. De stappen en afbeeldingen uit dit artikel zijn gebaseerd op Power BI Desktop.The steps and illustrations in this article are from Power BI Desktop.

Sinds de release in september 2017 van Power BI Desktop is er een nieuw samplingalgoritme beschikbaar waarmee de weergave van high-densitygegevens in spreidingsdiagrammen is verbeterd.Beginning with the September 2017 release of the Power BI Desktop, a new sampling algorithm is available that improves how scatter charts represent high-density data.

U kunt bijvoorbeeld een spreidingsdiagram maken van de verkoopactiviteiten van uw organisatie, waarbij elke vestiging elk jaar tienduizenden gegevenspunten genereert.For example, you might create a scatter chart from your organization's sales activity, each store having tens of thousands of data points each year. Met een spreidingsdiagram van dergelijke informatie wordt dan een gegevenssample opgehaald (door een zinvolle representatie van alle gegevens te selecteren, ter illustratie van de wijze waarop de verkoop gedurende een bepaalde periode zich heeft ontwikkeld) uit de beschikbare gegevens en wordt een spreidingsdiagram gemaakt dat de onderliggende gegevens vertegenwoordigt.A scatter chart of such information would sample data (select a meaningful representation of that data to illustrate how sales occurred over time) from the available data, and create a scatter chart that represents the underlying data. Dit is gebruikelijk bij spreidingsdiagrammen met high-densitygegevens.This is common practice in high-density scatter charts. In Power BI is de sampling van high-densitygegevens verbeterd, zoals nader beschreven in dit artikel.Power BI has improved its sampling of high-density data, the details of which are described in this article.

voorbeeld spreidingsdiagram

Hoe high-densityspreidingsdiagrammen werkenHow high-density scatter charts work

Voorheen selecteerde Power BI op deterministische wijze een sample van gegevenspunten in het volledige bereik van onderliggende gegevens om een spreidingsdiagram te maken.Previously, Power BI selected a collection of sample data points in the full range of underlying data in a deterministic fashion to create a scatter chart. Meer in het bijzonder selecteerde Power BI de eerste en laatste rij gegevens in de reeks van het spreidingsdiagram, waarna de overige rijen gelijkmatig werden verdeeld zodat in totaal 3500 gegevenspunten in het spreidingsdiagram werden geplot.Specifically, Power BI would select the first and last rows of data in the scatter chart series, then would divide the remaining rows evenly so that 3,500 data points total would be plotted on the scatter chart. Als de sample bijvoorbeeld uit 35.000 rijen bestond, werden de eerste en laatste rij geselecteerd voor het plotten, waarna elke tiende rij ook werd geplot (35.000 / 10 = elke tiende rij = 3500 gegevenspunten).For example, if the sample had 35,000 rows, the first and last rows would be selected for plotting, then every tenth row would also be plotted (35,000 / 10 = every tenth row = 3,500 data points). Voorheen gold ook dat null-waarden of punten die niet in gegevensreeksen konden worden geplot (zoals tekstwaarden), niet werden weergegeven en derhalve niet werden meegenomen bij het genereren van de visual.Also previously, null values or points that could not be plotted (such as text values) in data series weren't shown, and thus, were not considered when generating the visual. Met dergelijke samples werd de waargenomen dichtheid van het spreidingsdiagram ook gebaseerd op de representatieve gegevenspunten, waardoor de impliciete visuele dichtheid het gevolg was van de punten in de sample, niet van de volledige verzameling onderliggende gegevens.With such sampling, the perceived density of the scatter chart was also based on the representative data points, so the implied visual density was a circumstance of the sampled points, not the full collection of the underlying data.

Wanneer u High-densitysampling inschakelt, implementeert Power BI een algoritme dat overlappende punten elimineert en wordt ervoor gezorgd dat de punten in de visual bereikbaar zijn tijdens interactie met de visual.When you enable High-density Sampling, Power BI implements an algorithm that eliminates overlapping points, and ensures that the points on the visual can be reached when interacting with the visual. Bovendien zorgt het algoritme ervoor dat alle punten in de gegevensset worden weergegeven in de visual, zodat er een context wordt verschaft bij de betekenis van de geselecteerde punten, in plaats van alleen maar een representatieve sample te plotten.The algorithm also ensures that all points in the data set are represented in the visual, providing context to the meaning of selected points, rather than just plotting a representative sample.

High-densitygegevens worden per definitie verzameld om redelijk snel visualisaties te maken die responsief zijn voor op interactiviteit.By definition, high-density data is sampled to create visualizations reasonably quickly that are responsive to interactivity. Door te veel gegevenspunten op een visual kan de snelheid omlaag gaan. Bovendien kan dit afbreuk doen aan de zichtbaarheid van de trends.Too many data points on a visual can bog it down, and can detract from the visibility of trends. De manier waarop dergelijke gegevens worden verzameld is bepalend voor het samenstellen van het samplingalgoritme om de best mogelijke visualisatie te bieden en ervoor te zorgen dat alle gegevens worden weergegeven.So, how the data is sampled is what drives the creation of the sampling algorithm to provide the best visualization experience and ensure that all data is represented. In Power BI is het algoritme nu verbeterd om de best mogelijke combinatie van reactievermogen, weergave en behoud van belangrijke punten in de algehele gegevensset te bieden.In Power BI, the algorithm is now improved to provide the best combination of responsiveness, representation, and clear preservation of important points in the overall data set.

Notitie

Spreidingsdiagrammen die het high-densitysampling-algoritme gebruiken, kunnen net zoals alle spreidingsdiagrammen het beste worden geplot in vierkante visuals.Scatter charts using the High-density Sampling algorithm are best plotted on square visuals, as with all scatter charts.

De werking van het nieuwe samplingalgoritme voor spreidingsdiagrammenHow the new scatter chart sampling algorithm works

Het nieuwe algoritme voor high-densitysampling voor spreidingsdiagrammen maakt gebruik van methoden waarmee de onderliggende gegevens effectiever worden vastgelegd en weergegeven, en waarmee overlappende punten worden geëlimineerd.The new algorithm for High-density Sampling for scatter charts employs methods that capture and represent the underlying data more effectively and eliminates overlapping points. Het algoritme doet dit door te beginnen met een kleine straal voor elk gegevenspunt (de visuele cirkelgrootte voor een bepaald punt in de visualisatie).It does this by starting with a small radius for each data point (the visual circle size for a given point on the visualization). Vervolgens wordt de straal van alle gegevenspunten vergroot. Wanneer twee (of meer) gegevenspunten elkaar overlappen, geeft één enkele cirkel (met de vergrote straal) die overlapte gegevenspunten weer.It then increases the radius of all data points; when two (or more) data points overlap, a single circle (of the increased radius size) represents those overlapped data points. Het algoritme blijft de straal van gegevenspunten vergroten totdat de waarde van de straal resulteert in een redelijk aantal gegevenspunten, in dit geval 3500, die worden weergegeven in het spreidingsdiagram.The algorithm continues to increase the radius of data points, until that radius value results in a reasonable number of data points - 3,500 - being displayed in the scatter chart.

De methoden in dit algoritme zorgen ervoor dat in de resulterende visual ook uitschieters worden weergegeven.The methods in this algorithm ensure that outliers are represented in the resulting visual. Het algoritme houdt ook rekening met de schaal wanneer er overlapping wordt vastgesteld, en wel zo dat exponentiële schalen nauwkeurig worden weergegeven op basis van de onderliggende gevisualiseerde punten.The algorithm respects scale when determining overlap, too, such that exponential scales are visualized with fidelity to the underlying visualized points.

Met dit algoritme blijft ook de algehele vorm van het spreidingsdiagram behouden.The algorithm also preserves the overall shape of the scatter chart.

Notitie

Wanneer u het high-densitysampling-algoritme voor spreidingsdiagrammen gebruikt, is nauwkeurige distributie van de gegevens het doel en niet de impliciete visuele dichtheid.When using the High-density Sampling algorithm for scatter charts, accurate distribution of the data is the goal, and implied visual density is not the goal. Een voorbeeld. U hebt een spreidingsdiagram met veel cirkels die elkaar in een bepaald gebied overlappen (dichtheid) en stel u voor dat er hier veel gegevenspunten moeten zijn geclusterd. Aangezien het high-densitysampling-algoritme één cirkel kan gebruiken om veel gegevenspunten weer te geven, komt een dergelijke impliciete visuele dichtheid (of 'clustering') niet aan het licht.For example, you might see a scatter chart with lots of circles that overlap (density) in a certain area, and imagine many data points must be clustered there; since the High-density Sampling algorithm can use one circle to represent many data points, such implied visual density (or "clustering") will not show up. Als u meer details in een bepaald gebied wilt zien, kunt u slicers gebruiken om in te zoomen.To get more detail in a given area, you can use slicers to zoom in.

Daar komt bij dat gegevenspunten die niet kunnen worden geplot (zoals null- of tekstwaarden) genegeerd worden, zodat een andere waarde die wel kan worden geplot wordt geselecteerd, waardoor de juiste vorm van het spreidingsdiagram behouden blijft.In addition, data points that cannot be plotted (such as nulls or text values) are ignored, so another value that can be plotted is selected, further ensuring the true shape of the scatter chart is maintained.

Wanneer het standaardalgoritme voor spreidingsdiagrammen wordt gebruiktWhen the standard algorithm for scatter charts is used

Er zijn omstandigheden waaronder high-densitysampling niet kan worden toegepast op een spreidingsdiagram en derhalve het oorspronkelijke algoritme wordt gebruikt.There are circumstances under which High-density Sampling cannot be applied to a scatter chart and the original algorithm is used. Dat geldt voor de volgende situaties:Those circumstances are the following:

  • Als u met de rechtermuisknop op een waarde onder Details klikt en vervolgens Items zonder gegevens weergeven in het menu selecteert, wordt het spreidingsdiagram teruggezet naar het oorspronkelijke algoritme.If you right-click a value under Details and set it to Show items with no data from the menu, the scatter chart will revert to the original algorithm.

    voorbeeld van items zonder gegevens weergeven

  • Waarden in de Play-as zorgen ervoor dat het spreidingsdiagram wordt teruggezet naar het oorspronkelijke algoritme.Any values in the Play axis will result in the scatter chart reverting to the original algorithm.

  • Als de X- en Y-as beide in een spreidingsdiagram ontbreken, wordt het diagram teruggezet naar het oorspronkelijke algoritme.If both X and Y axes are missing on a scatter chart, the chart reverts to the original algorithm.

  • Het gebruik van een verhoudingslijn in het deelvenster Analyse zorgt ervoor dat het diagram wordt teruggezet naar het oorspronkelijke algoritme.Using a Ratio line in the Analytics pane results in the chart reverting to the original algorithm.

    voorbeeld van het gebruik van een verhoudingslijn

High-densitysampling inschakelen voor een spreidingsdiagramHow to turn on high-density sampling for a scatter chart

Als u High-densitysampling wilt inschakelen, selecteert u een spreidingsdiagram, gaat u naar het deelvenster Opmaak, vouwt u de kaart Algemeen uit en schuift u de schuifregelaar High-densitysampling onderaan de kaart naar Aan.To turn on High-density Sampling, select a scatter chart, go to the Formatting pane, expand the General card, and near the bottom of that card, slide the High-density Sampling toggle slider to On.

voorbeeld van een steekproef nemen van hoge dichtheid

Notitie

Zodra de schuifregelaar is ingeschakeld, zal Power BI het high-densitysampling-algoritme zo veel mogelijk proberen te gebruiken.Once the slider is turned on, Power BI will attempt to use the High-density Sampling algorithm whenever possible. Wanneer het algoritme niet kan worden gebruikt (bijvoorbeeld als u een waarde in de Afspelen-as zet), blijft de schuifregelaar op Aan staan, zelfs als het diagram is teruggezet naar het standaardalgoritme.When the algorithm cannot be used (for example, you place a value in the Play axis), the slider stays in the On position even though the chart has reverted to the standard algorithm. Als u vervolgens een waarde verwijdert uit de as Afspelen (of voorwaarden veranderen waardoor het high-densitysampling-algoritme kan worden gebruikt), maakt het diagram automatisch gebruik van high-densitysampling omdat de functie actief is.If you then remove a value from the Play axis (or conditions change to enable use of the high-density sampling algorithm), the chart will automatically use high-density sampling for that chart because the feature is active.

Notitie

Gegevenspunten worden door de index geselecteerd of gegroepeerd.Data points are grouped or selected by the index. Een legenda heeft geen invloed op sampling voor het algoritme, dit geldt alleen voor het ordenen van de visual.Having a legend does not affect sampling for the algorithm, it only affects the ordering of the visual.

Overwegingen en beperkingenConsiderations and limitations

Het high-densitysampling-algoritme is een belangrijke verbetering in Power BI, maar er zijn wel enkele zaken waarmee u rekening moet houden wanneer u werkt met high-densitywaarden en spreidingsdiagrammen.The high-density sampling algorithm is an important improvement to Power BI, but there are a few considerations to know when working with high-density values and scatter charts.

  • Het high-densitysampling-algoritme werkt alleen met liveverbindingen naar op Power BI gebaseerde modellen, geïmporteerde modellen of DirectQuery.The High-density Sampling algorithm only works with live connections to Power BI service-based models, imported models, or DirectQuery.

Volgende stappenNext steps

Zie het volgende artikel voor meer informatie over high-densitysampling in andere diagrammen.For more information about high-density sampling in other charts, see the following article.