Campionamento ad alta densità nei grafici a dispersione di Power BI

L'algoritmo di campionamento di Power BI migliora il modo in cui i grafici a dispersione rappresentano dati ad alta densità.

Ad esempio, è possibile creare un grafico a dispersione dall'attività di vendita dell'organizzazione, con ogni punto vendita con decine di migliaia di punti dati ogni anno. Un grafico a dispersione di tali informazioni campionerebbe i dati da una rappresentazione significativa dei dati per illustrare il modo in cui le vendite si sono verificate nel tempo. I dettagli del campionamento dei dati ad alta densità sono descritti in questo articolo.

Screenshot of a scatter chart, showing the high-density sampling data.

Nota

L'algoritmo di campionamento ad alta densità descritto in questo articolo è disponibile nei grafici a dispersione sia per Power BI Desktop che per i servizio Power BI.

Funzionamento dei grafici a dispersione ad alta densità

In precedenza, Power BI ha selezionato una raccolta di punti dati di esempio nell'intera gamma di dati sottostanti in modo deterministico per creare un grafico a dispersione. In particolare, Power BI seleziona le prime e le ultime righe di dati nella serie di grafici a dispersione, quindi divide le righe rimanenti in modo uniforme in modo che nel grafico a dispersione siano state tracciate 3.500 punti dati totali. Ad esempio, se l'esempio ha 35.000 righe, verranno selezionate le prime e le ultime righe per il tracciato, quindi ogni decima riga verrà tracciata anche (35.000 / 10 = ogni decima riga = 3.500 punti dati). In precedenza, anche i valori Null o i punti che non potevano essere tracciati, ad esempio i valori di testo, nelle serie di dati non venivano visualizzati e quindi non venivano considerati durante la generazione dell'oggetto visivo. Con tale campionamento, anche la densità percepita del grafico a dispersione era basata sui punti dati rappresentativi, quindi la densità visiva implicita era una circostanza dei punti campionati, non la raccolta completa dei dati sottostanti.

Quando si abilita il campionamento ad alta densità, Power BI implementa un algoritmo che elimina i punti sovrapposti e garantisce che i punti nell'oggetto visivo possano essere raggiunti durante l'interazione con l'oggetto visivo. L'algoritmo garantisce inoltre che tutti i punti del set di dati siano rappresentati nell'oggetto visivo, fornendo il contesto al significato dei punti selezionati, invece di tracciare semplicemente un campione rappresentativo.

Per definizione, i dati ad alta densità vengono campionati per creare visualizzazioni reattive all'interattività. Troppi punti dati su un oggetto visivo possono rallentarlo e sottrarre la visibilità delle tendenze. Il modo in cui vengono campionati i dati determina la creazione dell'algoritmo di campionamento per offrire la migliore esperienza di visualizzazione e assicurarsi che tutti i dati siano rappresentati. In Power BI l'algoritmo è stato migliorato per offrire la migliore combinazione di velocità di risposta, rappresentazione e conservazione chiara di punti importanti nel set di dati complessivo.

Nota

I grafici a dispersione che usano l'algoritmo di campionamento ad alta densità sono meglio tracciati sugli oggetti visivi quadrati, come con tutti i grafici a dispersione.

Funzionamento dell'algoritmo di campionamento grafico a dispersione

L'algoritmo per il campionamento ad alta densità per i grafici a dispersione usa metodi che acquisisce e rappresentano i dati sottostanti in modo più efficace ed elimina i punti sovrapposti. L'algoritmo inizia con un raggio ridotto per ogni punto dati, ovvero la dimensione del cerchio visivo per un determinato punto nella visualizzazione. Aumenta quindi il raggio di tutti i punti dati. Quando due o più punti dati si sovrappongono, un singolo cerchio delle dimensioni del raggio aumentato rappresenta i punti dati sovrapposti. L'algoritmo continua ad aumentare il raggio dei punti dati fino a quando tale valore del raggio non comporta un numero ragionevole di punti dati (3.500) visualizzati nel grafico a dispersione.

I metodi in questo algoritmo assicurano che gli outlier siano rappresentati nell'oggetto visivo risultante. L'algoritmo rispetta la scala anche quando si determina la sovrapposizione, in modo che le scale esponenziali vengano visualizzate con fedeltà ai punti visualizzati sottostanti.

L'algoritmo mantiene inoltre la forma complessiva del grafico a dispersione.

Nota

Quando si usa l'algoritmo di campionamento ad alta densità per i grafici a dispersione, la distribuzione accurata dei dati è l'obiettivo, non la densità visiva implicita. Ad esempio, è possibile che venga visualizzato un grafico a dispersione con un numero elevato di cerchi che si sovrappongono (densità) in una determinata area e si immagini che molti punti dati debbano essere raggruppati in tale area. Poiché l'algoritmo di campionamento ad alta densità può usare un cerchio per rappresentare molti punti dati, tale densità visiva implicita o "clustering" non verrà visualizzata. Per ottenere altri dettagli in una determinata area, è possibile usare i filtri dei dati per eseguire lo zoom avanti.

Inoltre, i punti dati che non possono essere tracciati, ad esempio valori Null o valori di testo, vengono ignorati, quindi viene selezionato un altro valore che può essere tracciato. In questo modo si garantisce inoltre che venga mantenuta la forma vera del grafico a dispersione.

Quando viene usato l'algoritmo standard per i grafici a dispersione

Esistono circostanze in cui non è possibile applicare il campionamento ad alta densità a un grafico a dispersione e viene usato l'algoritmo originale. Tali circostanze sono:

  • Se si fa clic con il pulsante destro del mouse su un valore in Valori e lo si imposta su Mostra elementi senza dati dal menu, il grafico a dispersione verrà ripristinato all'algoritmo originale.

    Screenshot of the Visualization menu, showing the Values pane with Show items with no data selection.

  • Tutti i valori nel campo Asse di riproduzione genereranno il ripristino del grafico a dispersione sull'algoritmo originale.

  • Se in un grafico a dispersione mancano entrambi gli assi X e Y, il grafico torna all'algoritmo originale.

  • L'uso di una riga Ratio nel riquadro Analisi comporta il ripristino dell'algoritmo originale nel grafico.

    Screenshot of the Visualization menu, showing a pointer to the Analytics pane and Ratio line.

Come attivare il campionamento ad alta densità per un grafico a dispersione

Per impostare Il campionamento ad alta densità su Sì, selezionare un grafico a dispersione, passare al riquadro Formato oggetto visivo, espandere la scheda Generale e nella parte inferiore della scheda scorrere il dispositivo di scorrimento Campionamento ad alta densità su Sì.

Screenshot of the Visualization menu, showing a pointer to the Format visual pane, General card, and High Density Sampling toggle slider.

Nota

Dopo aver attivato l'opzione, Power BI tenterà di usare l'algoritmo di campionamento ad alta densità quando possibile. Quando l'algoritmo non può essere usato, ad esempio quando si posiziona un valore nell'asse Play , l'opzione rimane attiva anche se il grafico è stato ripristinato all'algoritmo standard. Se quindi si rimuove un valore dall'asse Play o se le condizioni cambiano per consentire l'uso dell'algoritmo di campionamento ad alta densità, il grafico userà automaticamente il campionamento ad alta densità per tale grafico perché la funzionalità è attiva.

Nota

I punti dati vengono raggruppati o selezionati in base all'indice. La presenza di una legenda non influisce sul campionamento per l'algoritmo. Influisce solo sull'ordinamento dell'oggetto visivo.

Considerazioni e limitazioni

L'algoritmo di campionamento ad alta densità è un miglioramento importante per Power BI. Tuttavia, l'algoritmo di campionamento ad alta densità funziona solo con connessioni dinamiche a modelli basati su servizio Power BI, modelli importati o DirectQuery.