Creare visualizzazioni di fattori di influenza chiave

SI APPLICA A: Power BI Desktop servizio Power BI

L'oggetto visivo fattori di influenza chiave consente di comprendere i fattori che determinano una metrica a cui si è interessati. Analizza i dati, classifica i fattori importanti e li visualizza come fattori di influenza chiave. Si supponga, ad esempio, di voler capire cosa influisce sul fatturato dei dipendenti, noto anche come varianza. Un fattore potrebbe essere la lunghezza del contratto di lavoro e un altro fattore potrebbe essere il tempo commutare.

Quando usare fattori di influenza chiave

L'oggetto visivo fattori di influenza chiave è un'ottima scelta se si vuole:

  • Vedere quali fattori influiscono sulla metrica analizzata.
  • Contrasta l'importanza relativa di questi fattori. Ad esempio, i contratti a breve termine influiscono sulla varianza di più dei contratti a lungo termine?

Funzionalità dell'oggetto visivo fattori di influenza chiave

Screenshot of the numbered features of the key influencers visual.

  1. Schede: selezionare una scheda per passare da una visualizzazione all'altra. I fattori di influenza chiave mostrano i principali collaboratori al valore della metrica selezionato. I segmenti principali mostrano i segmenti principali che contribuiscono al valore della metrica selezionato. Un segmento è costituito da una combinazione di valori. Ad esempio, un segmento potrebbe essere consumer che sono stati clienti per almeno 20 anni e vivono nell'area occidentale.

  2. Casella di riepilogo a discesa: valore della metrica in fase di analisi. In questo esempio esaminare la metrica Rating ( Valutazione). Il valore selezionato è Basso.

  3. Riformulare: consente di interpretare l'oggetto visivo nel riquadro sinistro.

  4. Riquadro sinistro: il riquadro sinistro contiene un oggetto visivo. In questo caso, nel riquadro sinistro viene visualizzato un elenco dei principali fattori di influenza chiave.

  5. Riformulare: consente di interpretare l'oggetto visivo nel riquadro destro.

  6. Riquadro destro: il riquadro destro contiene un oggetto visivo. In questo caso, nell'istogramma vengono visualizzati tutti i valori per il tema fattore di influenza chiave selezionato nel riquadro sinistro. Il valore specifico dell'usabilità dal riquadro sinistro viene visualizzato in verde. Tutti gli altri valori per Theme sono visualizzati in nero.

  7. Linea media: la media viene calcolata per tutti i valori possibili per Tema ad eccezione dell'usabilità (ovvero il fattore di influenza selezionato). Il calcolo si applica quindi a tutti i valori in nero. Indica quale percentuale degli altri temi ha una valutazione bassa. In questo caso il 11,35% ha una valutazione bassa (mostrata dalla linea tratteggiata).

  8. Casella di controllo: filtra l'oggetto visivo nel riquadro destro per visualizzare solo i valori fattori di influenza per tale campo. In questo esempio l'oggetto visivo viene filtrato per visualizzare usabilità, sicurezza e navigazione.

Analizzare una metrica categorica

Guardare questo video per informazioni su come creare un oggetto visivo fattori di influenza chiave con una metrica categorica. Seguire quindi i passaggi per crearne uno.

Nota

Questo video potrebbe usare versioni precedenti di Power BI Desktop o il servizio Power BI.

  1. Il product manager vuole capire quali fattori portano i clienti a lasciare recensioni negative sul servizio cloud. Per seguire la procedura in Power BI Desktop, aprire il file PBIX commenti e suggerimenti dei clienti.

Nota

Il set di dati Customer Feedback si basa su [Moro et al., 2014] S. Moro, P. Cortez e P. Rita. "Un approccio basato sui dati per stimare il successo del telemarketing bancario". Decision Support Systems, Elsevier, 62:22-31, giugno 2014.

  1. In Compila oggetto visivo nel riquadro Visualizzazioni selezionare l'icona Fattori di influenza chiave.

    Screenshot of the Key influencers icon on the Visualizations pane.

  2. Spostare la metrica da analizzare nel campo Analizza . Per visualizzare le caratteristiche che determinano la bassa classificazione del servizio da parte di un cliente, selezionare Customer Table Rating (Valutazione tabella>clienti).

  3. Spostare i campi che si ritiene potrebbero influire sulla classificazione nel campo Spiega per . È possibile spostare tutti i campi desiderati. In questo caso, iniziare con:

    • Country-Region
    • Ruolo nell'organizzazione
    • Tipo di sottoscrizione
    • Dimensioni società
    • Theme
  4. Lasciare vuoto il campo Espandi per . Questo campo viene utilizzato solo durante l'analisi di una misura o di un campo riepilogato.

  5. Per concentrarsi sulle classificazioni negative, selezionare Bassa nella casella di riepilogo a discesa Che influenza valutazione.

    Screenshot of the drop-down box with high and low options.

L'analisi viene eseguita a livello di tabella del campo da analizzare. In questo caso, si tratta della metrica Rating . Questa metrica viene definita a livello di cliente. Ogni cliente ha assegnato un punteggio elevato o un punteggio basso. Tutti i fattori esplicativi devono essere definiti a livello di cliente affinché l'oggetto visivo usi tali fattori.

Nell'esempio precedente tutti i fattori esplicativi hanno una relazione uno-a-uno o molti-a-uno con la metrica. In questo caso, ogni cliente ha assegnato un singolo tema alla valutazione. Analogamente, i clienti provengono da un paese o da un'area geografica, hanno un tipo di appartenenza e hanno un ruolo nella propria organizzazione. I fattori esplicativi sono già attributi di un cliente e non sono necessarie trasformazioni. L'oggetto visivo può usarli immediatamente.

Più avanti nell'esercitazione vengono esaminati esempi più complessi con relazioni uno-a-molti. In questi casi, è necessario aggregare le colonne fino al livello del cliente prima di poter eseguire l'analisi.

Le misure e le aggregazioni usate come fattori esplicativi vengono valutate anche a livello di tabella della metrica Analizza . Alcuni esempi sono illustrati più avanti in questo articolo.

Interpretare fattori di influenza chiave categorica

Esaminiamo i fattori di influenza chiave per valutazioni basse.

Fattore singolo principale che influenza la probabilità di una valutazione bassa

Il cliente in questo esempio può avere tre ruoli: consumer, amministratore e editore. Essere un consumer è il fattore principale che contribuisce a una valutazione bassa.

Screenshot of key influencers, with Role in Org is consumer selected.

Più precisamente, i consumatori hanno una probabilità maggiore di 2,57 volte di dare al servizio un punteggio negativo. Il grafico fattori di influenza chiave elenca Role in Org is consumer first nell'elenco a sinistra. Selezionando Ruolo nell'organizzazione è consumer, Power BI mostra altri dettagli nel riquadro a destra. Viene visualizzato l'effetto comparativo di ogni ruolo sulla probabilità di una valutazione bassa.

  • Il 14,93% dei consumatori dà un punteggio basso.
  • In media, tutti gli altri ruoli assegnano un punteggio basso al 5,78% del tempo.
  • I consumer hanno una probabilità maggiore di 2,57 volte di dare un punteggio basso rispetto a tutti gli altri ruoli. È possibile determinare questo punteggio dividendo la barra verde per la linea punteggiata rossa.

Secondo singolo fattore che influenza la probabilità di una valutazione bassa

L'oggetto visivo fattori di influenza chiave confronta e classifica i fattori di molte variabili diverse. Il secondo fattore di influenza non ha nulla a che fare con Role in Org. Selezionare il secondo fattore di influenza nell'elenco, ovvero Theme è usabilità.

Screenshot of key influencers, with Theme is usability selected.

Il secondo fattore più importante è correlato al tema della revisione del cliente. I clienti che hanno commentato l'usabilità del prodotto hanno 2,55 volte più probabilità di dare un punteggio basso rispetto ai clienti che hanno commentato altri temi, ad esempio affidabilità, progettazione o velocità.

Tra gli oggetti visivi, la media, mostrata dalla linea punteggiata rossa, è cambiata dal 5,78% al 11,35%. La media è dinamica perché è basata sulla media di tutti gli altri valori. Per il primo fattore di influenza, la media ha escluso il ruolo del cliente. Per il secondo fattore di influenza, ha escluso il tema di usabilità.

Selezionare la casella di controllo Mostra solo valori che sono fattori di influenza per filtrare usando solo i valori influenti . In questo caso, sono i ruoli che determinano un punteggio basso. 12 temi vengono ridotti ai quattro identificati da Power BI come temi che determinano valutazioni basse.

Screenshot of check box to only show values that are influencers.

Interagire con altri oggetti visivi

Ogni volta che si seleziona un filtro dei dati, un filtro o un altro oggetto visivo nell'area di disegno, l'oggetto visivo fattori di influenza chiave esegue nuovamente l'analisi sulla nuova parte dei dati. Ad esempio, è possibile spostare le dimensioni aziendali nel report e usarlo come filtro dei dati. Usarlo per verificare se i fattori di influenza chiave per i clienti aziendali sono diversi dalla popolazione generale. Le dimensioni di un'azienda sono superiori a 50.000 dipendenti.

Selezionare 50.000 per rieseguire l'analisi ed è possibile osservare >che i fattori di influenza sono stati modificati. Per i clienti aziendali di grandi dimensioni, il fattore di influenza principale per le valutazioni basse ha un tema correlato alla sicurezza. È possibile esaminare ulteriormente per verificare se sono presenti funzionalità di sicurezza specifiche per i clienti di grandi dimensioni.

Screenshot of visual to select by company size.

Interpretare fattori di influenza chiave continui

Finora è stato illustrato come usare l'oggetto visivo per esplorare il modo in cui i diversi campi categorici influenzano le valutazioni basse. È anche possibile avere fattori continui, ad esempio età, altezza e prezzo nel campo Spiega per . Si esaminerà ora cosa accade quando Tenure viene spostato dalla tabella del cliente in Explain by. Tenure illustra per quanto tempo un cliente ha usato il servizio.

Man mano che aumenta la tenure, aumenta anche la probabilità di ricevere una classificazione inferiore. Questa tendenza suggerisce che i clienti a lungo termine hanno maggiori probabilità di dare un punteggio negativo. Questa informazione è interessante e una che potrebbe essere utile seguire in un secondo momento.

La visualizzazione mostra che ogni volta che il tenure aumenta di 13,44 mesi, in media la probabilità che una valutazione bassa aumenti di 1,23 volte. In questo caso, 13,44 mesi rappresentano la deviazione standard del tenure. Quindi le informazioni dettagliate che si ricevono esaminano come aumentare la tenure per una quantità standard, che è la deviazione standard del tenure, influisce sulla probabilità di ricevere una valutazione bassa.

Il grafico a dispersione nel riquadro destro traccia la percentuale media di valutazioni basse per ogni valore di tenure. Evidenzia la pendenza con una linea di tendenza.

Screenshot of scatter plot for Tenure.

Fattori di influenza chiave continui binati

In alcuni casi, è possibile che i fattori continui siano stati trasformati automaticamente in categorie. Se la relazione tra le variabili non è lineare, non è possibile descrivere la relazione come semplicemente aumentare o diminuire (come nell'esempio precedente).

Vengono eseguiti test di correlazione per determinare in che modo lineare il fattore di influenza riguarda la destinazione. Se la destinazione è continua, si esegue la correlazione di Pearson e, se la destinazione è categorica, vengono eseguiti test di correlazione point biserial. Se si rileva che la relazione non è sufficientemente lineare, si esegue un binning supervisionato e si genera un massimo di cinque contenitori. Per capire quali contenitori hanno più senso, viene usato un metodo di binning supervisionato che esamina la relazione tra il fattore esplicativo e la destinazione da analizzare.

Interpretare misure e aggregazioni come fattori di influenza chiave

È possibile usare misure e aggregazioni come fattori esplicativi all'interno dell'analisi. Ad esempio, si potrebbe voler visualizzare l'effetto del conteggio dei ticket di supporto clienti o la durata media di un ticket aperto sul punteggio ricevuto.

In questo caso, si vuole verificare se il numero di ticket di supporto che un cliente ha influenzato il punteggio che assegna. Ora si porta l'ID del ticket di supporto dalla tabella dei ticket di supporto. Poiché un cliente può avere più ticket di supporto, aggregare l'ID a livello di cliente. L'aggregazione è importante perché l'analisi viene eseguita a livello di cliente, quindi tutti i driver devono essere definiti a tale livello di granularità.

Esaminiamo ora il numero di ID. A ogni riga del cliente è associato un conteggio dei ticket di supporto. In questo caso, man mano che aumenta il numero di ticket di supporto, la probabilità che la valutazione sia bassa aumenta di 4,08 volte. L'oggetto visivo a destra mostra il numero medio di ticket di supporto in base a valori di valutazione diversi valutati a livello di cliente.

Screenshot that shows influence of Support Ticket ID.

Interpretare i risultati: Segmenti principali

È possibile usare la scheda Fattori di influenza chiave per valutare ogni fattore singolarmente. È anche possibile usare la scheda Segmenti principali per vedere come una combinazione di fattori influisce sulla metrica che si sta analizzando.

I segmenti principali mostrano inizialmente una panoramica di tutti i segmenti individuati da Power BI. L'esempio seguente mostra che sono stati trovati sei segmenti. Questi segmenti vengono classificati in base alla percentuale di valutazioni basse all'interno del segmento. Segmento 1, ad esempio, ha valutazioni del 74,3% dei clienti basse. Maggiore è la bolla, maggiore è la percentuale di valutazioni basse. La dimensione della bolla rappresenta il numero di clienti all'interno del segmento.

Screenshot of Top segments tab selected.

Selezionando una bolla vengono visualizzati i dettagli del segmento. Se si seleziona Segmento 1, ad esempio, si scopre che è costituito da clienti relativamente consolidati. Sono clienti da oltre 29 mesi e hanno più di quattro ticket di supporto. Infine, non sono editori, quindi sono consumer o amministratori.

In questo gruppo, il 74,3% dei clienti ha dato una valutazione bassa. Il cliente medio ha dato una valutazione bassa del 11,7% del tempo, quindi questo segmento ha una percentuale maggiore di valutazioni basse. È superiore a 63 punti percentuali. Il segmento 1 contiene anche circa il 2,2% dei dati, quindi rappresenta una parte indirizzabile della popolazione.

Screenshot of top segment according to rating.

Aggiunta di conteggi

In alcuni casi un fattore di influenza può avere un effetto significativo, ma rappresenta poco dei dati. Ad esempio, Theme è usabilità è il terzo fattore di influenza più grande per valutazioni basse. Tuttavia, potrebbe esserci solo una manciata di clienti che si sono lamentati dell'usabilità. I conteggi consentono di classificare in ordine di priorità i fattori di influenza su cui concentrarsi.

È possibile attivare i conteggi tramite la scheda Analisi del riquadro di formattazione.

Screenshot of enable counts slider in the Format pane.

Dopo l'abilitazione dei conteggi, verrà visualizzato un anello intorno alla bolla di ogni fattore di influenza, che rappresenta la percentuale approssimativa di dati contenuti dal fattore di influenza. Maggiore è la bolla dei cerchi circolari, maggiore è il numero di dati contenuti. Si può notare che Theme è usabilità contiene una piccola percentuale di dati.

Screenshot of rings that around influencer bubbles that represent counts.

È anche possibile usare l'interruttore Ordina per in basso a sinistra dell'oggetto visivo per ordinare prima le bolle in base al conteggio anziché all'impatto. Il tipo di sottoscrizione è Premier è il fattore di influenza principale in base al conteggio.

Screenshot of the Sort by toggle to sort by counts first.

Avere un anello completo intorno al cerchio significa che il fattore di influenza contiene il 100% dei dati. È possibile modificare il tipo di conteggio in modo che sia relativo al fattore di influenza massimo usando l'elenco a discesa Tipo di conteggio nella scheda Analisi del riquadro di formattazione. Ora il fattore di influenza con la maggior parte dei dati sarà rappresentato da un anello completo e tutti gli altri conteggi saranno relativi.

Screenshot that shows the relative counts drop-down menu.

Analizzare una metrica numerica

Se si sposta un campo numerico nonsummarizzato nel campo Analizza , è possibile scegliere come gestire tale scenario. È possibile modificare il comportamento dell'oggetto visivo passando al riquadro Formattazione e passando dal tipo di analisi categorica al tipo di analisi continua.

Screenshot of drop-down menu to change from categorical to continuous.

Un tipo di analisi categorica si comporta come descritto in precedenza. Ad esempio, se si esaminano i punteggi dei sondaggi compresi tra 1 e 10, è possibile chiedere "Che cosa influenza i punteggi dei sondaggi come 1?".

Un tipo di analisi continua modifica la domanda in una continua. Nell'esempio precedente, la nuova domanda sarebbe "Che influenza i punteggi dei sondaggi per aumentare/diminuire?".

Questa distinzione è utile quando si hanno molti valori univoci nel campo che si sta analizzando. Nell'esempio seguente vengono esaminati i prezzi delle case. Non è significativo chiedere "Che influenza il prezzo della casa per essere 156.214?". poiché è molto specifico e probabilmente non si hanno dati sufficienti per dedurre un modello.

Invece potremmo chiedere: "Che cosa influenza l'aumento del prezzo della casa"? che ci consente di trattare i prezzi delle case come un intervallo piuttosto che valori distinti.

Screenshot of drop-down options to choose influencers.

Interpretare i risultati: Fattori di influenza chiave

Nota

Gli esempi in questa sezione usano i dati relativi ai prezzi delle case di dominio pubblico. È possibile scaricare il set di dati di esempio se si vuole seguire la procedura.

In questo scenario si esaminerà "What influences House Price to increase". Un certo numero di fattori esplicativi potrebbe influire sul prezzo di una casa come Year Built (anno in cui è stata costruita la casa), KitchenQual (qualità della cucina) e YearRemodAdd (anno in cui la casa è stata rimodellata).

Nell'esempio seguente, esaminiamo il nostro fattore di influenza principale, che è la qualità della cucina eccellente. I risultati sono simili a quelli illustrati durante l'analisi delle metriche categoriche con alcune importanti differenze:

  • L'istogramma a destra esamina le medie anziché le percentuali. Quindi ci mostra il prezzo medio della casa di una casa con una cucina eccellente (bar verde) rispetto al prezzo medio della casa di una casa senza una cucina eccellente (linea punteggiata)
  • Il numero nella bolla è ancora la differenza tra la linea rossa punteggiata e la barra verde, ma è espressa come numero ($158,49K) anziché una probabilità (1,93x). Così in media, le case con ottime cucine sono quasi $160K più costoso rispetto alle case senza ottime cucine.

Screenshot of numeric target categorical influencers.

Nell'esempio seguente si esamina l'impatto di un fattore continuo (anno in cui la casa è stata rimodellata) sul prezzo della casa. Le differenze rispetto alla modalità di analisi dei fattori di influenza continui per le metriche categoriche sono le seguenti:

  • Il grafico a dispersione nel riquadro destro traccia il prezzo medio della casa per ogni valore distinto dell'anno rimodellato.
  • Il valore nella bolla mostra quanto aumenta il prezzo medio della casa (in questo caso $ 2,87k) quando l'anno in cui la casa è stata rimodellata aumenta per la sua deviazione standard (in questo caso 20 anni)

Screenshot of numeric target continuous influencers.

Infine, nel caso delle misure, stiamo esaminando l'anno medio in cui è stata costruita una casa. L'analisi è la seguente:

  • Il grafico a dispersione nel riquadro destro traccia il prezzo medio della casa per ogni valore distinto nella tabella
  • Il valore nella bolla mostra quanto aumenta il prezzo medio della casa (in questo caso $ 1,35K) quando l'anno medio aumenta per la deviazione standard (in questo caso 30 anni)

Screenshot of Key influencers for house prices with influencers on the left and the scatterplot on the right.

Interpretare i risultati: Segmenti principali

I segmenti principali per le destinazioni numeriche mostrano i gruppi in cui i prezzi delle abitazioni in media sono superiori rispetto al set di dati complessivo. Ad esempio, di seguito è possibile notare che segmento 1 è costituito da case in cui GarageCars (numero di automobili che il garage può adattare) è maggiore di 2 e RoofStyle è Hip. Le case con queste caratteristiche hanno un prezzo medio di $ 355K rispetto alla media complessiva dei dati che è $180K.

Screenshot that shows Top segments for house prices.

Analizzare una metrica che è una misura o una colonna riepilogata

Nel caso di una misura o di una colonna riepilogata, per impostazione predefinita l'analisi è il tipo di analisi continua descritto in precedenza. Questo valore non può essere modificato. La differenza principale tra l'analisi di una colonna misura/riepilogata e una colonna numerica nonsummarizzata è il livello in cui viene eseguita l'analisi.

Nel caso di colonne non sommate, l'analisi viene sempre eseguita a livello di tabella. Nell'esempio di prezzo della casa precedente è stata analizzata la metrica House Price per vedere cosa influisce su un prezzo di casa per aumentare/diminuire. L'analisi viene eseguita automaticamente a livello di tabella. La tabella ha un ID univoco per ogni casa, quindi l'analisi viene eseguita a livello di casa.

Screenshot that shows the table level analysis for the house price example.

Per le misure e le colonne riepilogate, non si sa immediatamente a quale livello analizzarli. Se House Price è stato riepilogato come Media, dovremmo considerare quale livello vorremmo calcolare questo prezzo medio della casa. È il prezzo medio della casa a livello di quartiere? O forse un livello regionale?

Le misure e le colonne riepilogate vengono analizzate automaticamente a livello dei campi Spiega in base ai campi usati. Si supponga di avere tre campi in Spiega per interesse: Qualità della cucina, Tipo di edificio e Aria condizionata. Il prezzo medio della casa viene calcolato per ogni combinazione univoca di questi tre campi. Spesso è utile passare a una vista tabella per esaminare l'aspetto dei dati valutati.

Screenshot that shows the three columns and the average house price.

Questa analisi è molto riepilogata e quindi sarà difficile per il modello di regressione trovare qualsiasi modello nei dati da cui può apprendere. È consigliabile eseguire l'analisi a un livello più dettagliato per ottenere risultati migliori. Se si vuole analizzare il prezzo della casa a livello di casa, è necessario aggiungere in modo esplicito il campo ID all'analisi. Tuttavia, non vogliamo che l'ID casa sia considerato un fattore di influenza. Non è utile imparare che quando l'ID casa aumenta, il prezzo di una casa aumenta. L'opzione Espandi per campo è utile qui. È possibile usare Expand By per aggiungere campi da usare per impostare il livello di analisi senza cercare nuovi fattori di influenza.

Esaminare l'aspetto della visualizzazione dopo aver aggiunto l'ID a Expand By. Dopo aver definito il livello a cui si vuole valutare la misura, l'interpretazione dei fattori di influenza è esattamente la stessa delle colonne numeriche nonsumate.

Screenshot that shows the house price visualization that depends on the three columns discussed in this section.

Per altre informazioni su come analizzare le misure con la visualizzazione fattori di influenza chiave, guardare il video seguente. Per informazioni su come Power BI usa ML.NET dietro le quinte per ragionare sui dati e sulle informazioni dettagliate in modo naturale, vedere Power BI identifica i fattori di influenza chiave usando ML.NET.

Nota

Questo video potrebbe usare versioni precedenti di Power BI Desktop o il servizio Power BI.

Considerazioni e risoluzione dei problemi

Quali sono le limitazioni per l'oggetto visivo?

L'oggetto visivo fattori di influenza chiave presenta alcune limitazioni:

  • Direct Query non è supportato
  • Il Connessione live in Azure Analysis Services e SQL Server Analysis Services non è supportato
  • La pubblicazione sul Web non è supportata
  • È necessario .NET Framework 4.6 o versione successiva
  • L'incorporamento di SharePoint Online non è supportato

Screenshot of drop-down choices for numeric question

Viene visualizzato un errore che indica che non sono stati trovati fattori di influenza o segmenti. Perché?

Screenshot of no influencers found error message.

Questo errore si verifica quando sono stati inclusi i campi in Spiega da ma non sono stati trovati fattori di influenza.

  • È stata inclusa la metrica analizzata sia in Analizzache in Explain by. Rimuoverlo da Spiega per.
  • I campi esplicativi hanno troppe categorie con poche osservazioni. Questa situazione rende difficile per la visualizzazione determinare quali fattori sono fattori di influenza. È difficile generalizzare in base a poche osservazioni. Se si analizza un campo numerico, è possibile passare dall'analisi categorica all'analisicontinua nel riquadro formattazione nella scheda Analisi.
  • I fattori esplicativi hanno osservazioni sufficienti per generalizzare, ma la visualizzazione non ha trovato correlazioni significative da segnalare.

Viene visualizzato un errore che indica che la metrica analizzata non dispone di dati sufficienti per eseguire l'analisi. Perché?

Screenshot of not enough data error message.

La visualizzazione funziona esaminando i modelli nei dati di un gruppo rispetto ad altri gruppi. Ad esempio, cerca i clienti che hanno dato valutazioni basse rispetto ai clienti che hanno dato valutazioni elevate. Se i dati nel modello hanno solo alcune osservazioni, i modelli sono difficili da trovare. Se la visualizzazione non dispone di dati sufficienti per trovare fattori di influenza significativi, indica che sono necessari più dati per eseguire l'analisi.

È consigliabile avere almeno 100 osservazioni per lo stato selezionato. In questo caso, lo stato è quello dei clienti che sfornano. Sono necessarie anche almeno 10 osservazioni per gli stati usati per il confronto. In questo caso, lo stato di confronto è costituito dai clienti che non si sfornano.

Se si analizza un campo numerico, è possibile passare dall'analisi categorica all'analisicontinua nel riquadro formattazione nella scheda Analisi.

Viene visualizzato un errore che, quando "Analizza" non è riepilogato, l'analisi viene sempre eseguita a livello di riga della tabella padre. La modifica di questo livello tramite i campi "Espandi per" non è consentita. Perché?

Quando si analizza una colonna numerica o categorica, l'analisi viene sempre eseguita a livello di tabella. Ad esempio, se si analizzano i prezzi delle abitazioni e la tabella contiene una colonna ID, l'analisi verrà eseguita automaticamente a livello di ID casa.

Quando si analizza una misura o una colonna riepilogata, è necessario specificare in modo esplicito a quale livello si vuole eseguire l'analisi. È possibile usare Expand by per modificare il livello dell'analisi per le misure e le colonne riepilogate senza aggiungere nuovi fattori di influenza. Se il prezzo della casa è stato definito come misura, è possibile aggiungere la colonna ID casa a Expand by per modificare il livello dell'analisi.

Viene visualizzato un errore che indica che un campo in Explain by non è correlato in modo univoco alla tabella che contiene la metrica che si sta analizzando. Perché?

L'analisi viene eseguita a livello di tabella del campo da analizzare. Ad esempio, se si analizza il feedback dei clienti per il servizio, potrebbe essere disponibile una tabella che indica se un cliente ha dato una valutazione elevata o una valutazione bassa. In questo caso, l'analisi viene eseguita a livello di tabella del cliente.

Se si dispone di una tabella correlata definita a un livello più granulare rispetto alla tabella che contiene la metrica, viene visualizzato questo errore. Ecco un esempio:

  • Si analizzano i dati che consentono ai clienti di offrire valutazioni basse del servizio.
  • Si vuole verificare se il dispositivo in cui il cliente sta utilizzando il servizio influisce sulle recensioni che forniscono.
  • Un cliente può utilizzare il servizio in diversi modi.
  • Nell'esempio seguente il cliente 10000000 usa sia un browser che un tablet per interagire con il servizio.

Screenshot of a related table defined at a more granular level than the table that contains your metric.

Se si tenta di usare la colonna del dispositivo come fattore esplicativo, viene visualizzato l'errore seguente:

Screenshot of wrong column error message.

Questo errore viene visualizzato perché il dispositivo non è definito a livello di cliente. Un cliente può utilizzare il servizio su più dispositivi. Affinché la visualizzazione trovi modelli, il dispositivo deve essere un attributo del cliente. Esistono diverse soluzioni che dipendono dalla comprensione dell'azienda:

  • È possibile modificare il riepilogo dei dispositivi in modo da contare. Ad esempio, usare il conteggio se il numero di dispositivi potrebbe influire sul punteggio che un cliente assegna.
  • È possibile pivotare la colonna del dispositivo per verificare se l'utilizzo del servizio in un dispositivo specifico influisce sulla classificazione di un cliente.

In questo esempio, i dati sono stati votati per creare nuove colonne per browser, dispositivi mobili e tablet (assicurarsi di eliminare e ricreare le relazioni nella visualizzazione di modellazione dopo aver pivotato i dati). È ora possibile usare questi dispositivi specifici in Spiega per. Tutti i dispositivi si rivelano fattori di influenza e il browser ha l'effetto maggiore sul punteggio del cliente.

Più precisamente, i clienti che non usano il browser per utilizzare il servizio sono più probabili di 3,79 volte di dare un punteggio basso rispetto ai clienti che lo fanno. In basso nell'elenco, per i dispositivi mobili l'inverso è true. I clienti che usano l'app per dispositivi mobili hanno maggiori probabilità di offrire un punteggio basso rispetto ai clienti che non lo usano.

Screenshot that shows mobile app are more likely to give a low score.

Viene visualizzato un avviso che indica che le misure non sono state incluse nell'analisi. Perché?

Screenshot that shows measures not included error message.

L'analisi viene eseguita a livello di tabella del campo da analizzare. Se si analizza la varianza dei clienti, potrebbe essere disponibile una tabella che indica se un cliente è inattiva o meno. In questo caso, l'analisi viene eseguita a livello di tabella del cliente.

Le misure e le aggregazioni vengono analizzate per impostazione predefinita a livello di tabella. Se esistesse una misura per la spesa mensile media, verrà analizzata a livello di tabella del cliente.

Se la tabella customer non ha un identificatore univoco, non è possibile valutare la misura e viene ignorata dall'analisi. Per evitare questa situazione, assicurarsi che la tabella con la metrica abbia un identificatore univoco. In questo caso, si tratta della tabella customer e l'identificatore univoco è l'ID cliente. È anche facile aggiungere una colonna di indice usando Power Query.

Viene visualizzato un avviso che indica che la metrica analizzata ha più di 10 valori univoci e che questa quantità potrebbe influire sulla qualità dell'analisi. Perché?

La visualizzazione intelligenza artificiale può analizzare campi categorici e campi numerici. Nel caso di campi categorici, un esempio può essere Varianza è Sì o No e Customer Satisfaction è Alto, Medio o Basso. Aumentando il numero di categorie da analizzare significa che sono presenti meno osservazioni per categoria. Questa situazione rende più difficile per la visualizzazione trovare modelli nei dati.

Quando si analizzano i campi numerici, è possibile scegliere di trattare i campi numerici come il testo, nel qual caso si eseguirà la stessa analisi eseguita per i dati categorici (analisi categorica). Se si dispone di un numero elevato di valori distinti, è consigliabile passare all'analisi continua perché ciò significa che è possibile dedurre i modelli da quando i numeri aumentano o diminuiscono anziché considerarli come valori distinti. È possibile passare dall'analisi categorica all'analisicontinua nel riquadro Formattazione nella scheda Analisi.

Per trovare fattori di influenza più efficaci, è consigliabile raggruppare valori simili in una singola unità. Ad esempio, se si dispone di una metrica per il prezzo, è probabile che si ottengano risultati migliori raggruppando prezzi simili in categorie High, Medium e Low rispetto all'uso di singoli punti di prezzo.

Screenshot that shows more than 10 unique factors warning.

Ci sono fattori nei miei dati che sembrano essere fattori di influenza chiave, ma non sono. Come può accadere?

Nell'esempio seguente, i clienti che sono consumer determinano valutazioni basse, con il 14,93% delle valutazioni basse. Il ruolo di amministratore ha anche una percentuale elevata di valutazioni basse, al 13,42%, ma non è considerato un fattore di influenza.

Il motivo di questa determinazione è che la visualizzazione considera anche il numero di punti dati quando rileva fattori di influenza. Nell'esempio seguente sono presenti più di 29.000 consumer e 10 volte meno amministratori, circa 2.900. Solo 390 di loro hanno dato una valutazione bassa. L'oggetto visivo non dispone di dati sufficienti per determinare se è stato trovato un modello con classificazioni di amministratore o se si tratta solo di una ricerca casuale.

Screenshot that shows how influencers are determined.

Quali sono i limiti dei punti dati per i fattori di influenza chiave? L'analisi viene eseguita su un campione di 10.000 punti dati. Le bolle su un lato mostrano tutti i fattori di influenza trovati. I grafici a colonne e i grafici a dispersione sull'altro lato rispettano le strategie di campionamento per tali oggetti visivi principali.

Come si calcolano i fattori di influenza chiave per l'analisi categorica?

Dietro le quinte, la visualizzazione intelligenza artificiale usa ML.NET per eseguire una regressione logistica per calcolare i fattori di influenza chiave. Una regressione logistica è un modello statistico che confronta gruppi diversi tra loro.

Se si vuole vedere quali sono le valutazioni basse, la regressione logistica esamina il modo in cui i clienti che hanno dato un punteggio basso differiscono dai clienti che hanno assegnato un punteggio elevato. Se sono presenti più categorie, ad esempio punteggi alti, neutrali e bassi, si esamina il modo in cui i clienti che hanno dato una valutazione bassa differiscono dai clienti che non hanno dato una valutazione bassa. In questo caso, in che modo i clienti che hanno dato un punteggio basso differiscono dai clienti che hanno dato una valutazione elevata o una classificazione neutra?

La regressione logistica cerca modelli nei dati e cerca in che modo i clienti che hanno dato una valutazione bassa potrebbero differire dai clienti che hanno dato una valutazione elevata. Potrebbe ad esempio risultare che i clienti con più ticket di supporto offrono una percentuale più elevata di valutazioni basse rispetto ai clienti con pochi o nessun ticket di supporto.

La regressione logistica considera anche il numero di punti dati presenti. Ad esempio, se i clienti che svolgono un ruolo di amministratore assegnano punteggi proporzionalmente più negativi, ma ci sono solo alcuni amministratori, questo fattore non è considerato influente. Questa determinazione viene eseguita perché non sono disponibili punti dati sufficienti per dedurre un modello. Un test statistico, noto come test Wald, viene usato per determinare se un fattore è considerato un fattore di influenza. L'oggetto visivo usa un valore p pari a 0,05 per determinare la soglia.

Come si calcolano i fattori di influenza chiave per l'analisi numerica?

Dietro le quinte, la visualizzazione intelligenza artificiale usa ML.NET per eseguire una regressione lineare per calcolare i fattori di influenza chiave. Una regressione lineare è un modello statistico che esamina il risultato del campo che si sta analizzando in base ai fattori esplicativi.

Ad esempio, se si analizzano i prezzi delle case, una regressione lineare esaminerà l'effetto che avere una cucina eccellente avrà sul prezzo della casa. Le case con ottime cucine hanno generalmente prezzi più bassi o superiori rispetto alle case senza ottime cucine?

La regressione lineare considera anche il numero di punti dati. Ad esempio, se le case con campi da tennis hanno prezzi più alti, ma abbiamo poche case con un campo da tennis, questo fattore non è considerato influente. Questa determinazione viene eseguita perché non sono disponibili punti dati sufficienti per dedurre un modello. Un test statistico, noto come test Wald, viene usato per determinare se un fattore è considerato un fattore di influenza. L'oggetto visivo usa un valore p pari a 0,05 per determinare la soglia.

Come si calcolano i segmenti?

Dietro le quinte, la visualizzazione intelligenza artificiale usa ML.NET per eseguire un albero delle decisioni per trovare sottogruppi interessanti. L'obiettivo dell'albero delle decisioni è quello di terminare con un sottogruppo di punti dati relativamente elevato nella metrica a cui si è interessati. Potrebbe trattarsi di clienti con valutazioni basse o case con prezzi elevati.

L'albero delle decisioni prende ogni fattore esplicativo e cerca di ragionare il fattore che fornisce la suddivisione migliore. Ad esempio, se si filtrano i dati in modo da includere solo i clienti aziendali di grandi dimensioni, i clienti che hanno dato una valutazione elevata rispetto a una valutazione bassa? O forse è meglio filtrare i dati in modo da includere solo i clienti che hanno commentato la sicurezza?

Dopo che l'albero delle decisioni esegue una divisione, accetta il sottogruppo di dati e determina la divisione migliore successiva per tali dati. In questo caso, il sottogruppo è costituito dai clienti che hanno commentato la sicurezza. Dopo ogni divisione, l'albero delle decisioni considera anche se dispone di un numero sufficiente di punti dati per questo gruppo da essere rappresentativi per dedurre un modello da o se si tratta di un'anomalia nei dati e non di un segmento reale. Un altro test statistico viene applicato per verificare la rilevanza statistica della condizione di divisione con valore p pari a 0,05.

Al termine dell'esecuzione dell'albero delle decisioni, vengono eseguite tutte le divisioni, ad esempio i commenti di sicurezza e le grandi aziende, e vengono creati filtri di Power BI. Questa combinazione di filtri viene inserita in un pacchetto come segmento nell'oggetto visivo.

Perché determinati fattori diventano fattori di influenza o smettono di essere fattori di influenza man mano che si spostano più campi nel campo Spiega per ?

La visualizzazione valuta tutti i fattori esplicativi insieme. Un fattore può essere un fattore di influenza da solo, ma quando viene considerato con altri fattori potrebbe non essere. Si supponga di voler analizzare quali fattori esplicativi determinano un prezzo della casa, con camere da letto e dimensioni della casa:

  • Da solo, più camere da letto potrebbero essere un driver per i prezzi delle case ad essere alti.
  • Includendo le dimensioni della casa nell'analisi, ora si osserva cosa accade alle camere da letto mentre le dimensioni della casa rimangono costanti.
  • Se le dimensioni della casa sono fisse a 1.500 piedi quadrati, è improbabile che un aumento continuo del numero di camere da letto aumenterà notevolmente il prezzo della casa.
  • Le camere da letto potrebbero non essere importanti di un fattore come era prima che le dimensioni della casa fosse considerato.

Per condividere il report con un collega di Power BI è necessario disporre di singole licenze di Power BI Pro o che il report venga salvato nella capacità Premium. Vedere Condivisione dei report.