Stichprobenentnahme für visuelle Linienelemente mit hoher Dichte in Power BIHigh-density line sampling in Power BI

Ab dem im Juni 2017 veröffentlichten Release von Power BI Desktop und Updates des Power BI-Diensts steht ein neuer Stichprobenalgorithmus zur Verfügung, der die Visuals verbessert, die Daten mit hoher Dichte stichprobenartig entnehmen.Beginning with the June 2017 release of the Power BI Desktop and updates to the Power BI service, a new sampling algorithm is available that improves visuals that sample high-density data. Sie können z. B. ein Liniendiagramm aus den Verkaufsergebnissen Ihres Einzelhandelsgeschäfts erstellen, auch wenn jedes Geschäft mehr als zehntausend Verkaufsbelege jährlich verzeichnet.For example, you might create a line chart from your retail stores' sales results, each store having more than ten thousand sales receipts each year. Ein Liniendiagramm mit derartigen Verkaufsinformationen entnimmt stichprobenartig Daten (wählen Sie eine aussagekräftige Darstellung dieser Daten, um zu veranschaulichen, wie die Verkaufszahlen über die Zeit hinweg variieren) aus den Daten jedes Geschäfts und erstellt ein Mehrfachliniendiagramm, das die zugrunde liegenden Daten veranschaulicht.A line chart of such sales information would sample data (select a meaningful representation of that data, to illustrate how sales vary over time) from the data for each store, and create a multi-series line chart that thereby represents the underlying data. Dies ist eine gängige Methode für das Visualisieren von Daten mit hoher Dichte.This is common practice in visualizing high-density data. Die Stichprobenentnahme von Daten mit hoher Dichte von Power BI Desktop wurde verbessert. Dies wird in diesem Artikel ausführlicher beschrieben.Power BI Desktop has improved its sampling of high-density data, the details of which are described in this article.

Screenshot von Liniendiagrammen mit Stichprobendaten mit hoher Dichte

Hinweis

Der in diesem Artikel beschriebene Algorithmus zur Stichprobenentnahme mit hoher Dichte ist in Power BI Desktop und in Power BI-Dienst verfügbar.The High Density Sampling algorithm described in this article is available in both Power BI Desktop and the Power BI service.

So funktioniert die Strichprobenentnahme für visuelle Linienelemente mit hoher DichteHow high-density line sampling works

Früher hat Power BI eine Sammlung von Beispieldatenpunkten im vollständigen Bereich der zugrunde liegenden Daten auf deterministische Weise ausgewählt.Previously, Power BI selected a collection of sample data points in the full range of underlying data in a deterministic fashion. Es kann z.B. sein, dass für Daten mit hoher Dichte in einer Visualisierung eines Kalenderjahrs 350 Beispieldatenpunkte angezeigt werden, die jeweils ausgewählt wurden, um sicherzustellen, dass der vollständige Datenbereich im Visual dargestellt wird.For example, for high-density data on a visual spanning one calendar year, there might be 350 sample data points displayed in the visual, each of which was selected to ensure the full range of data (the overall series of underlying data) was represented in the visual. Um dies besser zu verstehen, können Sie sich vorstellen, dass ein Aktienkurs über ein Jahr aufgezeichnet und 365 Datenpunkte ausgewählt wurden, um eine Liniendiagrammvisualisierung zu erstellen (also ein Datenpunkt pro Tag).To help understand how this happens, imagine plotting a stock price over a one-year period, and selecting 365 data points to create a line chart visual (that's one data point for each day).

In diesem Fall gibt es allein am Tag mehrere Werte für den Aktienkurs.In that situation, there are many values for a stock price within each day. Natürlich gibt es ein Tageshoch und -tief, aber diese können zu jedem Zeitpunkt am Tag während der Öffnung des Börsenmarkts auftreten.Of course, there is a daily high and low, but those could occur at any time during the day when the stock market is open. Für Linienstichproben mit hoher Dichte erhalten Sie eine repräsentative Momentaufnahme der zugrunde liegenden Daten (der Preis um 10:30 Uhr und um 12:00 Uhr), wenn das zugrunde liegenden Datenbeispiel an jedem Tag um 10:30 Uhr und 12:00 Uhr entnommen wurde. Allerdings wird dadurch nicht gewährleistet, dass das tatsächliche Tageshoch und -tief des Aktienkurses (an diesem Tag) für diesen repräsentativen Datenpunkt erfasst wird.For high-density line sampling, if the underlying data sample was taken at 10:30 AM and 12:00 PM each day, you would get a representative snapshot of the underlying data (the price at 10:30 AM and 12:00 PM), but it might not capture the actual high and low of the stock price for that representative data point (that day). In dieser und in anderen Situationen ist die Stichprobenentnahme für die zugrunde liegenden Daten repräsentativ. Allerdings werden die wichtigsten Punkte nicht immer erfasst (in diesem Fall wären dies das Tageshoch und -tief gewesen).In that situation – and others – the sampling is representative of the underlying data, but it doesn't always capture important points, which in this case, would be daily stock price highs and lows.

Definitionsgemäß werden Stichproben von Daten mit hoher Dichte entnommen, um schnell Visualisierungen zu erstellen, die auf Interaktivität reagieren.By definition, high-density data is sampled to create visualizations reasonably quickly that are responsive to interactivity. Zu viele Datenpunkte in einem Visual können dieses verlangsamen und die Sichtbarkeit von Trends beeinträchtigen.Too many data points on a visual can bog it down, and can detract from the visibility of trends. Das Erstellen des Algorithmus zur Stichprobenentnahme hängt davon ab, wie die Daten entnommen werden, um die beste Visualisierung zu bieten.So, how the data is sampled is what drives the creation of the sampling algorithm to provide the best visualization experience. Durch den verbesserten Algorithmus in Power BI Desktop werden Reaktionsfähigkeit, Darstellung und die Erhaltung von wichtigen Punkten in jedem Zeitsegment optimal miteinander vereint.In Power BI Desktop, the algorithm is now improved to provide the best combination of responsiveness, representation, and clear preservation of important points in each time slice.

So funktioniert der neue Algorithmus für die Strichprobenentnahme für visuelle Linienelemente mit hoher DichteHow the new line sampling algorithm works

Der neue Algorithmus für Linienstichproben mit hoher Dichte steht für Visuals mit Liniendiagrammen und Flächendiagrammen mit fortlaufender X-Achse zur Verfügung.The new algorithm for high-density line sampling is available for line chart and area chart visuals with a continuous x-axis.

Für ein Visual mit hoher Dichte teilt Power BI Ihre Daten auf intelligente Weise in hochauflösende Blöcke ein und wählt anschließend wichtige Punkte für jeden Block aus.For a high-density visual, Power BI intelligently slices your data into high-resolution chunks, and then picks important points to represent each chunk. Dieses Aufteilen von hochauflösenden Daten wurde so optimiert, dass sich das entstehende Diagramm optisch nicht von einem Diagramm unterscheidet, für das alle zugrunde liegenden Datenpunkte geladen wurden – und zudem ist es deutlich schneller und interaktiver.That process of slicing high-resolution data is specifically tuned to ensure that the resulting chart is visually indistinguishable from rendering all of the underlying data points, but much faster and more interactive.

Mindest- und Höchstwerte für visuelle Linienelemente mit hoher DichteMinimum and maximum values for high-density line visuals

Für jedes visuelle Element gelten die folgenden visuellen Einschränkungen:For any given visualization, the following visual limitations apply:

  • Die maximale Anzahl von Datenpunkten, die in den meisten Visuals angezeigt werden können, beträgt 3.500, unabhängig von der Anzahl der zugrunde liegenden Datenpunkte oder -reihen (weitere Informationen finden Sie unter den Ausnahmen in der folgenden Aufzählung).3,500 is the maximum number of data points displayed on most visuals, regardless of the number of underlying data points or series (see the exceptions in the following bullet list). Bei 10 Reihen mit jeweils 350 Datenpunkten hat das visuelle Element deshalb die Höchstgrenze an Datenpunkten erreicht.As such, if you have 10 series with 350 data points each, the visual has reached its maximum overall data points limit. Wenn Sie eine Reihe haben, kann diese bis zu 3.500 Datenpunkte haben, wenn der neue Algorithmus dies für die beste Stichprobenentnahme für die zugrunde liegenden Daten hält.If you have one series, it may have up to 3,500 data points if the new algorithm deems that the best sampling for the underlying data.

  • Jedes visuelle Element kann maximal 60 Reihen enthalten.There is a maximum of 60 series for any visual. Wenn Sie mehr als 60 Reihen haben, teilen Sie die Daten auf, und erstellen Sie mehrere Visuals mit jeweils höchstens 60 Reihen.If you have more than 60 series, break up the data and create multiple visuals with 60 or fewer series each. Es wird empfohlen, einen Datenschnitt zu verwenden, um nur Segmente der Daten anzuzeigen (nur bestimmte Reihen).It's good practice to use a slicer to show only segments of the data (only certain series). Wenn Sie z.B. alle Unterkategorien in der Legende anzeigen, können Sie einen Datenschnitt verwenden, um nach der übergeordneten Kategorie auf der gleichen Berichtseite zu filtern.For example, if you're displaying all subcategories in the legend, you could use a slicer to filter by the overall category on the same report page.

Die maximale Anzahl von Datenlimits ist für die folgenden Arten von Visuals höher, die Ausnahmen vom Datenpunktlimit 3.500 sind:The maximum number of data limits is higher for the following visual types, which are exceptions to the 3,500 data point limit:

  • Maximal 150.000 Datenpunkte für R-Visuals.150,000 data points maximum for R visuals.
  • 30 000 Datenpunkte für Power BI-Visuals30,000 data points for Power BI visuals.
  • 10.000 Datenpunkte für Punktdiagramme (Standardeinstellung 3.500)10,000 data points for scatter charts (scatter charts default to 3,500)
  • 3.500 für alle anderen Visuals3,500 for all other visuals

Durch diese Parameter wird sichergestellt, dass die Visuals in Power BI Desktop sehr schnell gerendert werden und weiter auf Interaktion von Benutzern reagieren können. Zudem wird sichergestellt, dass diese keinen unnötigen Rechenmehraufwand auf dem Computer verursachen, der das Visual rendert.These parameters ensure that visuals in Power BI Desktop render very quickly, are responsive to interaction with users, and do not result in undue computational overhead on the computer rendering the visual.

Auswerten von repräsentativen Datenpunkten für visuelle Linienelemente mit hoher DichteEvaluating representative data points for high-density line visuals

Wenn die Anzahl von zugrunde liegenden Datenpunkten die der maximalen Datenpunkte übersteigt, die im Visual dargestellt werden können, wird der sogenannte Diskretisierungsvorgang gestartet. Dabei werden Blöcke der zugrunde liegenden Daten in bins genannte Gruppen aufgeteilt, die dann iterativ optimiert werden.When the number of underlying data points exceeds the maximum data points that can be represented in the visual, a process called binning begins, which chunks the underlying data into groups called bins, and then iteratively refines those bins.

Der Algorithmus erstellt so viele Gruppen wie möglich, um dem visuellen Element die höchstmögliche Granularität zu bieten.The algorithm creates as many bins as possible to create the greatest granularity for the visual. Innerhalb jeder Gruppierung sucht der Algorithmus den Mindest- und Höchstdatenwert, um sicherzustellen, dass relevante und aussagekräftige Werte (z.B. Ausreißer) erfasst und im visuellen Element angezeigt werden.Within each bin, the algorithm finds the minimum and maximum data value, to ensure that important and significant values (for example, outliers) are captured and displayed in the visual. Auf Grundlage der Ergebnisse der Diskretisierung und der anschließenden Auswertung der Daten durch Power BI wird die Mindestauflösung der X-Achse für das Visual bestimmt, um die höchstmögliche Granularität für das Visual zu gewährleisten.Based on the results of the binning and subsequent evaluation of the data by Power BI, the minimum resolution for the x-axis for the visual is determined – to ensure maximum granularity for the visual.

Wie bereits erwähnt, ist die minimale Granularität für jede Reihe 350 Punkte, das Maximum für die meisten Visuals ist 3.500, wobei die Ausnahmen in den vorherigen Abschnitten aufgeführt wurden.As mentioned previously, the minimum granularity for each series is 350 points, the maximum is 3,500 for most visuals, with the exceptions listed in the previous paragraphs.

Jede Gruppierung wird durch zwei Datenpunkte dargestellt, die im visuellen Element die repräsentativen Datenpunkte der Gruppierung werden.Each bin is represented by two data points, which become the bin's representative data points in the visual. Die Datenpunkte sind einfach nur die Höchst- und Tiefwerte für diese Gruppe. Wenn Sie Höchst- oder Tiefwerte auswählen, stellt der Gruppierungsprozess sicher, dass jeder relevante Höchstwert oder aussagekräftige Tiefwert im visuellen Element erfasst und gerendert wird.The data points are simply the high and low value for that bin, and by selecting the high and low, the binning process ensures any important high value, or significant low value, is captured and rendered in the visual.

Dies scheint auf den ersten Blick ein sehr hoher Analyseaufwand zu sein, um sicherzustellen, dass vereinzelte Ausreißer erfasst und ordnungsgemäß im Visual dargestellt werden. Deshalb gibt es jetzt den neuen Algorithmus und den neuen Diskretisierungsvorgang.If that sounds like a lot of analysis to ensure the occasional outlier is captured and properly displayed in the visual, you are correct, but that's the exact reason for the new algorithm and binning process.

QuickInfos und Stichprobenentnahme für visuelle Linienelemente mit hoher DichteTooltips and high-density line sampling

Beachten Sie, dass der Diskretisierungsvorgang, der die Mindest- und Höchstwerte in einer gegebenen Gruppe erfasst und darstellt, sich darauf auswirken kann, wie QuickInfos Daten anzeigen, wenn Sie mit der Maus auf Datenpunkte zeigen.It's important to note that this binning process, which results in the minimum and maximum value in a given bin being captured and displayed, may affect how tooltips display data when you hover over the data points. Wir sehen uns noch mal unser Beispiel zu Aktienkursen an, um zu erläutern, wie und warum dies passiert.To explain how and why this occurs, let's revisit our example about stock prices.

Angenommen, Sie erstellen ein Visual auf der Grundlage von Aktienkursen, und Sie vergleichen zwei unterschiedliche Aktien miteinander, die beide die Stichprobenentnahme mit hoher Dichte verwenden.Let's say you're creating a visual based on stock price and you're comparing two different stocks, both of which are using High-Density Sampling. Die zugrunde liegenden Daten für jede Reihe haben viele Datenpunkte (möglicherweise erfassen Sie den Aktienkurs für jede Sekunde am Tag).The underlying data for each series has lots of data points (maybe you capture the stock price each second of the day). Der Algorithmus für Linienstichproben mit hoher Dichte führt die Diskretisierung für jede Reihe einzeln durch.The high-density line sampling algorithm performs binning for each series independently of the other.

Nehmen wir weiterhin an, dass der Preis der ersten Aktie um 12:02 Uhr steigt und zehn Sekunden später wieder schnell absinkt.Now let's say that the first stock jumps up in price at 12:02, then quickly comes back down ten seconds later. Das ist ein wichtiger Datenpunkt.That's an important data point. Wenn die Gruppierung für diese Aktie durchgeführt wird, ist das Tageshoch um 12:02 Uhr der repräsentative Datenpunkt für diese Gruppe.When binning occurs for that stock, the high at 12:02 will be a representative data point for that bin.

Bei der zweiten Aktie gab es um 12:02 Uhr allerdings weder ein Tageshoch noch ein Tagestief in der Gruppe, die diesen Zeitpunkt enthält.But, for the second stock, 12:02 was neither a high nor a low in the bin that included that time. Das Tageshoch oder -tief der Gruppe, die 12:02 Uhr enthält, kann drei Minuten später aufgetreten sein.Maybe the high and low for the bin that includes 12:02 occurred three minutes later. Wenn Sie in dieser Situation beim Erstellen den Liniendiagramms auf 12:02 zeigen, sehen Sie einen Wert in QuickInfos für die erste Aktie (weil er um 12:02 gestiegen ist und dieser Wert als der höchste Datenpunkt der Gruppe ausgewählt wurde). Allerdings sehen Sie um 12:02 Uhr keine Werte in QuickInfos für die zweite Aktie.In that situation, when the line chart is created and you hover over 12:02, you will see a value in the tooltip for the first stock (because it jumped at 12:02 and that value was selected as that bin's high data point), but you will not see any value in the tooltip at 12:02 for the second stock. Dies liegt daran, dass die zweite Aktie weder ein Tageshoch noch -tief für die Gruppe hatte, die 12:02 Uhr enthalten hat.That's because the second stock had neither a high, nor a low, for the bin that included 12:02. Deshalb können für die zweite Aktie für 12:02 Uhr keine Daten angezeigt werden, und deshalb werden auch keine QuickInfo-Daten angezeigt.So, there's no data to show for the second stock at 12:02, and thus, no tooltip data is displayed.

Dies tritt mit QuickInfos häufig auf.This situation will happen frequently with tooltips. Möglicherweise stimmen die Höchst- und Tiefwerte einer Gruppe nicht genau mit den gleichmäßig skalierten Wertpunkten der X-Achse überein, und deshalb wird der Wert nicht von QuickInfos angezeigt.The high and low values for a given bin might not match perfectly with the evenly scaled x-axis value points, and as such the tooltip will not display the value.

So aktivieren Sie die Strichprobenentnahme für visuelle Linienelemente mit hoher DichteHow to turn on high-density line sampling

Standardmäßig ist der neue Algorithmus eingeschaltet.By default, the new algorithm is turned on. Um diese Einstellung zu ändern, wechseln Sie in den Bereich Formatierung auf der Karte Allgemein. Am unteren Rand sehen Sie einen Schieberegler mit dem Namen Stichprobenentnahme mit hoher Dichte.To change this setting, go to the Formatting pane, in the General card, and along the bottom, you see a toggle slider called High-Density Sampling. Um den Algorithmus zu deaktivieren, schieben Sie ihn auf off (aus).To turn it off, slide it to Off.

Screenshot einer Stichprobenentnahme mit hoher Dichte mit Pfeilen zum Formatierungsbereich, zu „Allgemein“ und zu „Stichprobenentnahme mit hoher Dichte“

Überlegungen und EinschränkungenConsiderations and limitations

Der neue Algorithmus für Linienstichproben mit hoher Dichte ist eine wichtige Verbesserung in Power BI. Es gibt jedoch einige Aspekte, die Sie berücksichtigen sollten, wenn Sie mit Werten und Daten mit hoher Dichte arbeiten.The new algorithm for high-density line sampling is an important improvement to Power BI, but there are a few considerations you need to know when working with high-density values and data.

  • Aufgrund der erhöhten Granularität und des erweiterten Gruppierungsprozesses, zeigt QuickInfos möglicherweise nur dann einen Wert an, wenn repräsentative Daten nach dem Cursor übereinstimmen.Because of increased granularity and the binning process, Tooltips may only show a value if the representative data is aligned with your cursor. Weitere Informationen finden Sie im Abschnitt QuickInfos und Linienstichproben mit hoher Dichte dieses Artikels.See the Tooltips and high-density line sampling section in this article for more information.

  • Wenn die Größe einer allgemeinen Datenquelle zu groß ist, eliminiert der neue Algorithmus Reihen (Legendenelemente), um sie an das Maximum an importieren Daten anzupassen.When the size of an overall data source is too big, the new algorithm eliminates series (legend elements) to accommodate the data import maximum constraint.

    • In diesem Fall ordnet der Algorithmus Legendenreihen alphabetisch und durchläuft die Liste von Legendenelementen von oben nach unten in alphabetischer Reihenfolge, bis das Maximum an importierten Daten erreicht ist. Danach werden keine weiteren Reihen mehr importiert.In this situation, the new algorithm orders legend series alphabetically, starts down the list of legend elements in alphabetical order until the data import maximum is reached, and does not import additional series.
  • Wenn ein zugrunde liegendes Dataset mehr als 60 Reihe hat (die Höchstzahl an Reihen, wie zuvor beschrieben), ordnet der neue Algorithmus die Reihen alphabetisch und löscht Reihen, die nach der 60. alphabetischen Reihe stehen.When an underlying data set has more than 60 series (the maximum number of series, as described earlier), the new algorithm orders the series alphabetically, and eliminates series beyond the 60th alphabetically-ordered series.

  • Wenn die Werte in den Daten nicht vom Typ numeric oder date/time sind, verwendet Power BI nicht den neuen Algorithmus, sondern den vorherigen Algorithmus (Stichprobenentnahme ohne hohe Dichte).If the values in the data are not of type numeric or date/time, Power BI will not use the new algorithm, and will revert to the previous (non-high-density sampling) algorithm.

  • Die Einstellung Show Items with no data (Elemente ohne Daten anzeigen) wird vom neuen Algorithmus nicht unterstützt.The Show items with no data setting is not supported with the new algorithm.

  • Der neue Algorithmus wird nicht unterstützt, wenn Sie die Liveverbindung zu einem Modell verwenden, das in SQL Server Analysis Services (Version 2016 oder früher) gehostet wird.The new algorithm is not supported when using a live connection to a model hosted in SQL Server Analysis Services (version 2016 or earlier). Er wird aber in Modellen unterstützt, die in Power BI oder Azure Analysis Services gehostet werden.It is supported in models hosted in Power BI or Azure Analysis Services.

Nächste SchritteNext steps

Informationen über die Stichprobenentnahme mit hoher Dichte in Punktdiagrammen finden Sie im folgenden Artikel.For information about high-density sampling in scatter charts, see the following article.