Stichprobenentnahme mit hoher Dichte in Power BI-PunktdiagrammenHigh density sampling in Power BI scatter charts

Ab der im September 2017 veröffentlichten Version von Power BI Desktop und Updates des Power BI-Diensts steht ein neuer Stichprobenalgorithmus zur Verfügung, der die Darstellung von Daten mit hoher Dichte in Punktdiagrammen verbessert.Beginning with the September 2017 release of the Power BI Desktop and updates to the Power BI service, a new sampling algorithm is available that improves how scatter charts represent high density data.

Sie können z.B. ein Punktdiagramm der Verkaufsaktivitäten Ihrer Organisation erstellen, wobei für jedes Ladengeschäft Zehntausende von Datenpunkten pro Jahr vorhanden sind.For example, you might create a scatter chart from your organization's sales activity, each store having tens of thousands of data points each year. Ein Punktdiagramm mit derartigen Informationen entnimmt stichprobenartig Daten (wählen Sie eine aussagekräftige Darstellung dieser Daten, um die Verkaufszahlen über die Zeit hinweg darzustellen) aus den verfügbaren Daten und erstellt ein Punktdiagramm, das die zugrunde liegenden Daten veranschaulicht.A scatter chart of such information would sample data (select a meaningful representation of that data, to illustrate how sales occurred over time) from the available data, and create a scatter chart that represents the underlying data. Dies ist bei Punktdiagrammen mit hoher Dichte eine häufig genutzte Methode. Die Stichprobenentnahme von Daten mit hoher Dichte von Power BI wurde verbessert. Dies wird in diesem Artikel ausführlicher beschrieben.This is common practice in high density scatter charts, and Power BI has improved its sampling of high density data, the details of which are described in this article.

Hinweis

Der in diesem Artikel beschriebene Algorithmus der Stichprobenentnahme mit hoher Dichte gilt für Punktdiagramme in Power BI Desktop und im Power BI-Dienst und ist in beiden verfügbar.The high density sampling algorithm described in this article applies to, and is available in, scatter charts in both Power BI Desktop and the Power BI service.

Funktionsweise von Punktdiagrammen mit hoher DichteHow high density scatter charts work

Früher hat Power BI zum Erstellen eines Punktdiagramms eine Sammlung von Beispieldatenpunkten im vollständigen Bereich der zugrunde liegenden Daten auf deterministische Weise ausgewählt.Previously, Power BI selected a collection of sample data points in the full range of underlying data in a deterministic fashion to create a scatter chart. In Power BI wurde die erste und die letzte Datenzeile in der Datenreihe des Punktdiagramms ausgewählt, und dann wurden die restlichen Zeilen gleichmäßig unterteilt, sodass im Punktdiagramm insgesamt 3.500 Datenpunkte dargestellt werden.Specifically, Power BI would select the first and last rows of data in the scatter chart series, then would divide the remaining rows evenly so that 3,500 data points total would be plotted on the scatter chart. Wenn die Stichprobe beispielsweise 35.000 Zeilen umfasst, werden die erste und letzte Zeile für die Darstellung ausgewählt und außerdem jede zehnte Zeile dargestellt (35.000/10 = jede zehnte Zeile = 3.500 Datenpunkte).For example, if the sample had 35,000 rows, then the first and last rows would be selected for plotting, then every tenth row would also be plotted (35,000 / 10 = every tenth row = 3,500 data points). Zudem wurden früher NULL-Werte oder nicht darstellbare Punkte (z.B. Textwerte) in Datenreihen nicht angezeigt und somit beim Generieren des Visuals nicht berücksichtigt.Also previously, null values or points that could not be plotted (such as text values) in data series weren't shown, and thus were not considered when generating the visual. Bei einer solchen Stichprobenentnahme basiert die wahrgenommene Dichte des Punktdiagramms auch auf den repräsentativen Datenpunkten. Deshalb war die implizierte visuelle Dichte eine Folge der als Stichprobe entnommenen Datenpunkte und nicht der vollständigen Sammlung der zugrunde liegenden Daten.And with such sampling, the perceived density of the scatter chart was also based on the representative data points, and thus the implied visual density was a circumstance of the sampled points, and not the full collection of the underlying data.

Wenn Sie Stichprobenentnahme mit hoher Dichte aktivieren, implementiert Power BI einen Algorithmus, der überlappende Punkte ausschließt, und es wird sichergestellt, dass die Punkte im Visual bei der Interaktion mit dem Visual erreicht werden können.When you enable High Density Sampling, Power BI implements an algorithm that eliminates overlapping points, and ensures that the points on the visual can be reached when interacting with the visual. Darüber hinaus wird sichergestellt, dass alle Punkte im Dataset im Visual dargestellt werden. So wird nicht nur einfach eine repräsentative Stichprobe, sondern auch der Kontext ausgewählter Punkte dargestellt.It also ensures that all points in data set are represented in the visual, providing context to the meaning of selected points, rather than just plotting a representative sample.

Definitionsgemäß werden Daten mit hoher Dichte als Stichprobe entnommen, um ein schnelles Erstellen von Visuals und deren Interaktivität zu ermöglichen (wenn sich zu viele Datenpunkte in einem Visual befinden, kann sie dadurch verlangsamt und die Sichtbarkeit von Trends beeinträchtigt werden).By definition, high density data is sampled to enable visualizations that can be created reasonably quickly, and are responsive to interactivity (too many data points on a visual can bog it down, and can detract from the visibility of trends). Das Erstellen des Algorithmus für die Stichprobenentnahme hängt davon ab, wie die Daten entnommen werden, um das beste Visualisierungserlebnis zu bieten und sicherzustellen, dass alle Daten dargestellt werden.How such data is sampled, to provide the best visualization experience and ensure all data is represented, is what drives the creation of the sampling algorithm. Durch den verbesserten Algorithmus in Power BI werden Reaktionsfähigkeit, Darstellung und die Erhaltung von wichtigen Punkten im gesamten Dataset optimal miteinander vereint.In Power BI, the algorithm has been improved to provide the best combination of responsiveness, representation, and clear preservation of important points in the overall data set.

Hinweis

Punktdiagramme, die Stichprobenentnahme mit hoher Dichte verwenden, lassen sich wie alle Punktdiagramme am besten in quadratischen Visuals darstellen.Scatter charts using the high density sampling algorithm are best plotted on square visuals, as with all scatter charts.

Funktionsweise des neuen Algorithmus der Stichprobenentnahme für PunktdiagrammeHow the new scatter chart sampling algorithm works

Der neue Algorithmus der Stichprobenentnahme mit hoher Dichte für Punktdiagramme nutzt Methoden, mit denen die zugrunde liegenden Daten effektiver erfasst und dargestellt und überlappende Punkte ausgeschlossen werden.The new algorithm for High Density Sampling for scatter charts employs methods that capture and represent the underlying data more effectively, and eliminate overlapping points. Hierzu wird mit einem kleinen Radius für jeden Datenpunkt (der visuelle Kreisradius für einen bestimmten Punkt in der Visualisierung) begonnen.It does this by starting with a small radius for each data point (the visual circle size for a given point on the visualization). Anschließend wird der Radius aller Datenpunkte vergrößert. Wenn sich zwei (oder mehr) Datenpunkte überlappen, werden die überlappenden Datenpunkte durch einen einzelnen Kreis (mit vergrößertem Radius) dargestellt.It then increases the radius of all data points; when two (or more) data points overlap, a single circle (of the increased radius size) represents those overlapped data points. Der Algorithmus vergrößert den Radius der Datenpunkte weiter, bis der Radiuswert dazu führt, dass im Punktdiagramm eine angemessene Anzahl von Datenpunkten – 3.500 – angezeigt wird.The algorithm continues to increase the radius of data points, until that radius value results in a reasonable number of data points - 3,500 - being displayed in the scatter chart.

Die Methoden in diesem Algorithmus stellen sicher, dass Ausreißer im resultierenden Visual dargestellt werden.The methods in this algorithm ensure that outliers are represented in the resulting visual. Der Algorithmus berücksichtigt beim Bestimmen der Überlappung auch die Skalierung, sodass exponentielle Skalierungen gemäß den zugrunde liegenden visualisierten Datenpunkten dargestellt werden.The algorithm respects scale when determining overlap, too, such that exponential scales are visualized with fidelity to the underlying visualized points.

Der Algorithmus bewahrt zudem die Gesamtform des Punktdiagramms.The algorithm also preserves the overall shape of the scatter chart.

Hinweis

Bei Verwendung des Algorithmus der Stichprobenentnahme mit hoher Dichte für Punktdiagramme wird eine genaue Verteilung der Daten und nicht die implizierte visuelle Dichte angestrebt.When using the High Density Sampling algorithm for scatter charts, accurate distribution of the data is the goal, and implied visual density is not the goal. Beispielsweise wird eventuell ein Punktdiagramm angezeigt, in dem sich in einem bestimmten Bereich sehr viele Kreise überlappen (Dichte), und Sie nehmen an, dass dort viele Datenpunkte zusammengedrängt sind. Da der Algorithmus für die Stichprobenentnahme mit hoher Dichte mit einem einzelnen Kreis viele Datenpunkte darstellen kann, wird die implizierte visuelle Dichte (Clustering) nicht angezeigt.For example, you might see a scatter chart with lots of circles that overlap (density) in a certain area, and imagine many data points must be clustered there; since the High Density Sampling algorithm can use one circle to represent many data points, such implied visual density (or "clustering") will not show up. Um weitere Details in einem angegebenen Bereich anzuzeigen, können Sie mit Schiebereglern die Darstellung vergrößern.To get more detail in a given area, you can use slicers to zoom in.

Darüber hinaus werden Datenpunkte, die nicht dargestellt werden können (z.B. NULL-Werte oder Textwerte), ignoriert, und stattdessen wird ein anderer Wert ausgewählt, der dargestellt werden kann. Auch dies stellt sicher, dass die richtige Form des Punktdiagramms erhalten bleibt.In addition, data points that cannot be plotted (such as nulls or text values) are ignored, so another value that can be plotted is selected, further ensuring the true shape of the scatter chart is maintained.

Wenn der Standardalgorithmus für Punktdiagramme verwendet wirdWhen the standard algorithm for scatter charts is used

Es gibt Situationen, in denen die Stichprobenentnahme mit hoher Dichte nicht auf ein Punktdiagramm angewendet werden kann und der ursprüngliche Algorithmus verwendet wird.There are circumstances under which High Density Sampling cannot be applied to a scatter chart, and the original algorithm is used. Dabei handelt es sich um die folgenden Situationen:Those circumstances are the following:

  • Wenn Sie mit der rechten Maustaste auf Details klicken und im daraufhin angezeigten Menü Elemente ohne Daten anzeigen auswählen, wird das Punktdiagramm auf den ursprünglichen Algorithmus zurückgesetzt.If you right-click on Details, then select Show items with no data from the menu that appears, the scatter chart will revert to the original algorithm.

  • Wenn sich auf der Wiedergabeachse Werte befinden, wird das Punktdiagramm auf den ursprünglichen Algorithmus zurückgesetzt.Any values in the Play axis will result in the scatter chart reverting to the original algorithm.
  • Wenn in einem Punktdiagramm die X-und Y-Achse fehlen, wird das Diagramm auf den ursprünglichen Algorithmus zurückgesetzt.If both X and Y axes are missing on a scatter chart, the chart reverts to the original algorithm.
  • Wenn im Bereich Analyse eine Verhältnislinie verwendet wird, wird das Diagramm auf den ursprünglichen Algorithmus zurückgesetzt.Using a Ratio line in the Analytics pane results in the chart reverting to the original algorithm.

Aktivieren der Stichprobenentnahme mit hoher Dichte für ein PunktdiagrammHow to turn on high density sampling for a scatter chart

Wählen Sie zum Aktivieren der Stichprobenentnahme mit hoher Dichte ein Punktdiagramm aus, wechseln Sie zum Bereich Formatierung, und erweitern Sie die Karte Allgemein.To turn on High Density Sampling, select a scatter chart and then go to the Formatting pane, and expand the General card. Im unteren Bereich der Karte ist ein Schieberegler zum Ein-/Ausschalten mit dem Namen Stichprobenentnahme mit hoher Dichte verfügbar.Near the bottom of that card, a toggle slider called High Density Sampling is available. Schieben Sie den Schieberegler auf Ein, um den Algorithmus zu aktivieren.To turn it on, slide it to On.

Hinweis

Nachdem der Schieberegler auf „Ein“ geschoben wurde, wird der Algorithmus der Stichprobenentnahme mit hoher Dichte in Power BI verwendet, wann immer dies möglich ist.Once the slider is turned on, Power BI will attempt to use the High Density Sampling algorithm whenever possible. Wenn der Algorithmus nicht verwendet werden kann (z.B. weil Sie auf der Wiedergabeachse einen Wert platzieren), bleibt der Schieberegler in der Position Ein, obwohl das Diagramm auf den Standardalgorithmus zurückgesetzt wurde.When the algorithm cannot be used (for example, you place a value in the Play axis), the slider stays in the On position even though the chart has reverted to the standard algorithm. Wenn Sie dann einen Wert von der Wiedergabeachse entfernen (oder die Bedingungen sich ändern, sodass der Algorithmus für die Stichprobenentnahme mit hoher Dichte verwendet werden kann), wird automatisch die Stichprobenentnahme mit hoher Dichte für das Diagramm verwendet, da der Schieberegler auf „Ein“ gestellt ist.If you then remove a value from the Play axis (or conditions change to enable use of the high density sampling algorithm), since the slider is on the chart will automatically use high density sampling for that chart.

Hinweis

Datenpunkte werden nach dem Index gruppiert und/oder ausgewählt.Data points are grouped and/or selected by the index. Das Vorhandensein einer Legende beeinträchtigt nicht die Stichprobenentnahme durch den Algorithmus, es wirkt sich nur auf die Sortierung des Visuals aus.Having a legend does not affect sampling for the algorithm, it only affects the ordering of the visual.

Überlegungen und EinschränkungenConsiderations and limitations

Der Algorithmus der Stichprobenentnahme mit hoher Dichte ist eine wichtige Verbesserung in Power BI. Es gibt jedoch einige Aspekte, die Sie berücksichtigen sollten, wenn Sie mit Werten hoher Dichte und Punktdiagrammen arbeiten.The high density sampling algorithm is an important improvement to Power BI, but there are a few considerations you need to know when working with high density values and scatter charts.

  • Der Algorithmus der Stichprobenentnahme mit hoher Dichte kann nur für Liveverbindungen mit auf dem Power BI-Dienst basierenden Modellen, importierten Modellen oder DirectQuery ausgeführt werden.The High Density Sampling algorithm only works with live connections to Power BI service-based models, imported models, or DirectQuery.

Nächste SchritteNext steps

Weitere Informationen über die Stichprobenentnahme mit hoher Dichte in anderen Diagrammen finden Sie im folgenden Artikel.For more information about high density sampling in other charts, see the following article.