Del via


Opret visualiseringer af nøglefaktorer

GÆLDER FOR: Power BI Desktop Power BI-tjeneste

Visualiseringen af nøglefaktorer hjælper dig med at forstå de faktorer, der driver en metrikværdi, du er interesseret i. Den analyserer dine data, rangerer de faktorer, der betyder noget, og viser dem som nøglefaktorer. Lad os f.eks. antage, at du vil finde ud af, hvad der påvirker medarbejderomsætningen, som også kaldes churn. En faktor kan være ansættelseskontraktens længde, og en anden faktor kan være pendlingstid.

Hvornår skal du bruge nøglefaktorer?

Visualiseringen af nøglefaktorer er et godt valg, hvis du vil:

  • Se, hvilke faktorer der påvirker den metrikværdi, der analyseres.
  • Kontrast den relative betydning af disse faktorer. Påvirker kortfristede kontrakter f.eks. afskafningsafgang mere end langsigtede kontrakter?

Funktioner i visualiseringen af nøglefaktorer

Screenshot of the numbered features of the key influencers visual.

  1. Faner: Vælg en fane for at skifte mellem visninger. Nøglefaktorer viser dig de største bidragydere til den valgte metrikværdi. De øverste segmenter viser de øverste segmenter, der bidrager til den valgte metrikværdi. Et segment består af en kombination af værdier. Et segment kan f.eks. være forbrugere, der har været kunder i mindst 20 år og bor i det vestlige område.

  2. Rulleliste: Værdien af den metrikværdi, der undersøges. I dette eksempel skal du se på metrikværdien Bedømmelse. Den valgte værdi er Lav.

  3. Tilpasning: Det hjælper dig med at fortolke visualiseringen i venstre rude.

  4. Venstre rude: Ruden til venstre indeholder én visualisering. I dette tilfælde viser ruden til venstre en liste over de vigtigste nøglefaktorer.

  5. Tilpasning: Det hjælper dig med at fortolke visualiseringen i højre rude.

  6. Højre rude: Ruden til højre indeholder én visualisering. I dette tilfælde viser søjlediagrammet alle værdierne for nøglefaktorernes tema , der blev valgt i ruden til venstre. Den specifikke værdi for anvendelighed fra venstre rude vises med grønt. Alle de andre værdier for Tema vises med sort.

  7. Gennemsnitslinje: Gennemsnittet beregnes for alle mulige værdier for Tema undtagen anvendelighed (som er den valgte nøglefaktor). Så beregningen gælder for alle værdier i sort. Den fortæller dig, hvilken procentdel af de andre temaer der havde en lav bedømmelse. I dette tilfælde havde 11,35 % en lav bedømmelse (vist ved den stiplede linje).

  8. Afkrydsningsfelt: Filtrerer visualiseringen i ruden til højre for kun at vise værdier, der er nøglefaktorer for det pågældende felt. I dette eksempel filtreres visualiseringen for at vise anvendelighed, sikkerhed og navigation.

Analysér en metrikværdi, der er kategorisk

Se denne video for at få mere at vide om, hvordan du opretter en visualisering af nøglefaktorer med en kategorisk metrikværdi. Følg derefter trinnene for at oprette en.

Bemærk

Denne video bruger muligvis tidligere versioner af Power BI Desktop eller Power BI-tjeneste.

  1. Din Produktchef vil gerne have, at du finder ud af, hvilke faktorer der får kunderne til at give negative anmeldelser om din cloudtjeneste. Hvis du vil følge med i Power BI Desktop, skal du åbne PBIX-filen Kundefeedback.

Bemærk

Datasættet Kundefeedback er baseret på [Moro et al., 2014] S. Moro, P. Cortez og P. Rita. "En datadrevet tilgang til at forudsige succes banktelemarketing." Decision Support Systems, Elsevier, 62:22-31, juni 2014.

  1. Under Opret visualisering i ruden Visualiseringer skal du vælge ikonet Nøglefaktorer .

    Screenshot of the Key influencers icon on the Visualizations pane.

  2. Flyt den metrikværdi, du vil undersøge, til feltet Analysér . Hvis du vil se, hvad der får en kundeklassificering af tjenesten til at være lav, skal du vælge Kundetabelklassificering>.

  3. Flyt felter, som du mener kan påvirke Bedømmelse , til feltet Forklar efter . Du kan flytte lige så mange felter, du vil. I dette tilfælde skal du starte med:

    • Country-Region
    • Rolle i organisationen
    • Abonnementstype
    • Virksomhedsstørrelse
    • Theme
  4. Lad feltet Udvid efter være tomt. Dette felt bruges kun, når du analyserer en måling eller et opsummeret felt.

  5. Hvis du vil fokusere på de negative bedømmelser, skal du vælge Lav i rullelisten Hvad påvirker bedømmelsen til at være .

    Screenshot of the drop-down box with high and low options.

Analysen kører på tabelniveau for det felt, der analyseres. I dette tilfælde er det metrikværdien Bedømmelse . Denne metrikværdi er defineret på kundeniveau. Hver kunde har enten givet en høj score eller en lav score. Alle de forklarende faktorer skal defineres på kundeniveau, for at visualiseringen kan bruge dem.

I det forrige eksempel har alle de forklarende faktorer enten en en til en- eller en mange til en-relation med metrikværdien. I dette tilfælde tildelte hver kunde et enkelt tema til deres bedømmelse. På samme måde kommer kunder fra ét land eller område, har én medlemskabstype og har én rolle i deres organisation. De forklarende faktorer er allerede attributter for en kunde, og der kræves ingen transformationer. Visualiseringen kan bruge dem med det samme.

Senere i selvstudiet ser du på mere komplekse eksempler, der har en til mange-relationer. I disse tilfælde skal kolonnerne først aggregeres ned til kundeniveau, før du kan køre analysen.

Målinger og aggregeringer, der bruges som forklarende faktorer, evalueres også på tabelniveau i metrikværdien Analysér . Nogle eksempler vises senere i denne artikel.

Fortolkning af kategoriske nøglefaktorer

Lad os se på nøglefaktorerne for lave bedømmelser.

Den største enkeltfaktor, der påvirker sandsynligheden for en lav bedømmelse

Kunden i dette eksempel kan have tre roller: forbruger, administrator og udgiver. At være forbruger er den vigtigste faktor, der bidrager til en lav bedømmelse.

Screenshot of key influencers, with Role in Org is consumer selected.

Mere præcist er dine forbrugere 2,57 gange mere tilbøjelige til at give din tjeneste en negativ score. Diagrammet over nøglefaktorer viser Rolle i organisationen er forbruger først på listen til venstre. Når du vælger Rolle i organisationen er forbruger, vises der flere oplysninger i ruden til højre i Power BI. Den komparative effekt af hver rolle på sandsynligheden for en lav bedømmelse vises.

  • 14,93 % af forbrugerne giver en lav score.
  • I gennemsnit giver alle andre roller en lav score 5,78 % af tiden.
  • Forbrugerne er 2,57 gange mere tilbøjelige til at give en lav score sammenlignet med alle andre roller. Du kan bestemme denne score ved at dividere den grønne linje med den røde stiplede linje.

Anden enkeltfaktor, der påvirker sandsynligheden for en lav bedømmelse

Visualiseringen af nøglefaktorer sammenligner og rangerer faktorer fra mange forskellige variabler. Den anden nøglefaktor har intet at gøre med Rolle i organisationen. Vælg den anden nøglefaktor på listen, som er Tema er anvendelighed.

Screenshot of key influencers, with Theme is usability selected.

Den næstvigtigste faktor er relateret til temaet for kundens anmeldelse. Kunder, der kommenterede produktets anvendelighed, var 2,55 gange mere tilbøjelige til at give en lav score sammenlignet med kunder, der kommenterede på andre temaer, f.eks. pålidelighed, design eller hastighed.

Mellem visualiseringerne er gennemsnittet, som vises af den røde stiplede linje, ændret fra 5,78 % til 11,35 %. Gennemsnittet er dynamisk, fordi det er baseret på gennemsnittet af alle andre værdier. For den første nøglefaktor ekskluderede gennemsnittet kunderollen. For den anden nøglefaktor udelukkede den anvendelighedstemaet.

Markér afkrydsningsfeltet Vis kun værdier, der er nøglefaktorer for kun at filtrere ved kun at bruge de indflydelsesrige værdier. I dette tilfælde er det rollerne, der giver en lav score. 12 temaer reduceres til de fire, som Power BI har identificeret som de temaer, der ligger til grund for lave bedømmelser.

Screenshot of check box to only show values that are influencers.

Interager med andre visualiseringer

Hver gang du vælger et udsnitsværktøj, et filter eller et andet visuelt element på lærredet, kører visualiseringen af nøglefaktorer sin analyse på den nye del af dataene igen. Du kan f.eks. flytte Firmastørrelse til rapporten og bruge den som et udsnit. Brug den til at se, om nøglefaktorerne for dine virksomhedskunder er anderledes end den generelle befolkning. En virksomhedsstørrelse er større end 50.000 medarbejdere.

Vælg >50.000 for at køre analysen igen, og du kan se, at nøglefaktorerne er ændret. For store virksomhedskunder har den største nøglefaktor for lave bedømmelser et tema, der er relateret til sikkerhed. Det kan være en god idé at undersøge yderligere for at se, om der er specifikke sikkerhedsfunktioner, som dine store kunder er utilfredse med.

Screenshot of visual to select by company size.

Fortolkning af fortløbende nøglefaktorer

Indtil videre har du set, hvordan du bruger visualiseringen til at udforske, hvordan forskellige kategorifelter påvirker lave bedømmelser. Det er også muligt at have fortløbende faktorer, f.eks. alder, højde og pris, i feltet Forklar med . Lad os se på, hvad der sker, når brugsperiode flyttes fra kundetabellen til Forklar ved. Brugsperiode viser, hvor længe en kunde har brugt tjenesten.

I takt med at ansættelsen stiger, øges sandsynligheden for at modtage en lavere bedømmelse også. Denne tendens tyder på, at der er større sandsynlighed for, at de langsigtede kunder giver en negativ score. Denne indsigt er interessant, og en, som du måske vil følge op på senere.

Visualiseringen viser, at hver gang ansættelsen stiger med 13,44 måneder, stiger sandsynligheden for en lav bedømmelse i gennemsnit med 1,23 gange. I dette tilfælde viser 13,44 måneder standardafvigelsen for brugsperiode. Så den indsigt, du modtager, ser på, hvordan en forøgelse af brugstiden med et standardbeløb, som er standardafvigelsen for brugsperiode, påvirker sandsynligheden for at modtage en lav bedømmelse.

Punktdiagrammet i ruden til højre viser den gennemsnitlige procentdel af lave bedømmelser for hver værdi for brugsperiode. Det fremhæver hældningen med en tendenslinje.

Screenshot of scatter plot for Tenure.

Grupperede fortløbende nøglefaktorer

I nogle tilfælde kan du opleve, at dine fortløbende faktorer automatisk blev omdannet til kategoriske faktorer. Hvis relationen mellem variablerne ikke er lineær, kan vi ikke beskrive relationen som blot stigende eller faldende (som vi gjorde i eksemplet ovenfor).

Vi kører korrelationstest for at bestemme, hvor lineær nøglefaktoren er med hensyn til målet. Hvis målet er fortløbende, kører vi Pearson-korrelationen, og hvis målet er kategorisk, kører vi Point Biserial-korrelationstest. Hvis vi registrerer, at relationen ikke er tilstrækkelig lineær, udfører vi overvåget gruppering i beholdere og genererer maksimalt fem beholdere. For at finde ud af, hvilke beholdere der giver mest mening, bruger vi en metode til overvåget gruppering i beholdere, der ser på relationen mellem den forklarende faktor og det mål, der analyseres.

Fortolkning af målinger og aggregeringer som nøglefaktorer

Du kan bruge målinger og aggregeringer som forklarende faktorer i din analyse. Det kan f.eks. være, at du vil se, hvilken effekt antallet af kundesupportanmodninger eller den gennemsnitlige varighed af en åben billet har på den score, du modtager.

I dette tilfælde vil du gerne se, om antallet af supportanmodninger, som en kunde har, påvirker den score, vedkommende giver. Nu kan du hente supportanmodnings-id'et fra tabellen supportanmodning. Da en kunde kan have flere supportanmodninger, aggregerer du id'et på kundeniveau. Sammenlægning er vigtig, fordi analysen kører på kundeniveau, så alle faktorer skal defineres på dette granularitetsniveau.

Lad os se på antallet af id'er. Hver kunderække har et antal supportanmodninger tilknyttet. I dette tilfælde stiger antallet af supportanmodninger, og sandsynligheden for, at bedømmelsen er lav, stiger 4,08 gange. Visualiseringen til højre viser det gennemsnitlige antal supportanmodninger efter forskellige bedømmelsesværdier , der evalueres på kundeniveau.

Screenshot that shows influence of Support Ticket ID.

Fortolkning af resultaterne: De øverste segmenter

Du kan bruge fanen Nøglefaktorer til at vurdere hver faktor individuelt. Du kan også bruge fanen Øverste segmenter til at se, hvordan en kombination af faktorer påvirker den metrikværdi, du analyserer.

De øverste segmenter viser indledningsvist en oversigt over alle de segmenter, som Power BI har fundet. I følgende eksempel kan du se, at der blev fundet seks segmenter. Disse segmenter er rangeret efter procentdelen af lave bedømmelser i segmentet. Segment 1 har f.eks. 74,3 % lave kundebedømmelser. Jo højere boblen er, jo højere er andelen af lave bedømmelser. Boblens størrelse repræsenterer, hvor mange kunder der er inden for segmentet.

Screenshot of Top segments tab selected.

Hvis du vælger en boble, vises detaljerne for det pågældende segment. Hvis du f.eks. vælger Segment 1, finder du ud af, at det består af relativt etablerede kunder. De har været kunder i mere end 29 måneder og har mere end fire supportanmodninger. Endelig er de ikke udgivere, så de er enten forbrugere eller administratorer.

I denne gruppe gav 74,3 % af kunderne en lav bedømmelse. Den gennemsnitlige kunde gav en lav bedømmelse 11,7 % af tiden, så dette segment har en større andel af lave bedømmelser. Det er 63 procentpoint højere. Segment 1 indeholder også ca. 2,2 % af dataene, så det repræsenterer en adresserbar del af populationen.

Screenshot of top segment according to rating.

Tilføjelse af antal

Nogle gange kan en nøglefaktor have en betydelig effekt, men repræsentere lidt af dataene. Tema er f.eks. anvendelighed er den tredjestørste nøglefaktor for lave bedømmelser. Der kan dog kun have været en håndfuld kunder, der klagede over anvendelighed. Antal kan hjælpe dig med at prioritere, hvilke nøglefaktorer du vil fokusere på.

Du kan slå antal til via kortet Analyse i formateringsruden.

Screenshot of enable counts slider in the Format pane.

Når antallet er aktiveret, kan du se en ring omkring hver nøglefaktors boble, som repræsenterer den omtrentlige procentdel af data, som nøglefaktoren indeholder. Jo mere af boblen ringcirlerne er, jo flere data indeholder den. Vi kan se, at Tema er anvendelighed indeholder en lille del af dataene.

Screenshot of rings that around influencer bubbles that represent counts.

Du kan også bruge til/fra-knappen Sortér efter nederst til venstre i visualiseringen til at sortere boblerne efter antal først i stedet for indvirkning. Abonnementstypen er Premier , der er den største nøglefaktor baseret på antal.

Screenshot of the Sort by toggle to sort by counts first.

Hvis du har en fuld ring rundt om cirklen, betyder det, at nøglefaktoren indeholder 100 % af dataene. Du kan ændre optællingstypen, så den er relativ i forhold til den maksimale nøglefaktor, ved hjælp af rullelisten Antalstypekortet Analyse i formateringsruden. Nu repræsenteres nøglefaktoren med den største mængde data af en fuld ring, og alle andre optællinger vil være relative i forhold til den.

Screenshot that shows the relative counts drop-down menu.

Analysér en metrikværdi, der er numerisk

Hvis du flytter et ikke-opsummeret numerisk felt til feltet Analysér , kan du vælge, hvordan du vil håndtere dette scenarie. Du kan ændre funktionsmåden for visualiseringen ved at gå til ruden Formatering og skifte mellem Kategorisk analysetype og Fortløbende analysetype.

Screenshot of drop-down menu to change from categorical to continuous.

En kategorisk analysetype fungerer som beskrevet ovenfor. Hvis du f.eks. kiggede på undersøgelsesscores, der spænder fra 1 til 10, kan du spørge "Hvad påvirker undersøgelsesscores til at være 1?"

En fortløbende analysetype ændrer spørgsmålet til et fortløbende spørgsmål. I eksemplet ovenfor vil vores nye spørgsmål være "Hvad får undersøgelsens scorer til at stige/falde?"

Denne skelnen er nyttig, når du har mange entydige værdier i det felt, du analyserer. I eksemplet nedenfor ser vi på huspriser. Det er ikke meningsfyldt at spørge "Hvad påvirker House Price til at være 156.214?" da det er meget specifikt, og vi sandsynligvis ikke har nok data til at udlede et mønster.

I stedet vil vi måske spørge", "Hvad får Husprisen til at stige"? hvilket giver os mulighed for at behandle huspriser som et interval i stedet for særskilte værdier.

Screenshot of drop-down options to choose influencers.

Fortolkning af resultaterne: Nøglefaktorer

Bemærk

I eksemplerne i dette afsnit bruges data om huspriser i det offentlige domæne. Du kan downloade eksempeldatasættet , hvis du vil følge med.

I dette scenarie ser vi på "Hvad får Husprisen til at stige". En række forklarende faktorer kan påvirke en huspris som Year Built (år huset blev bygget), KitchenQual (køkkenkvalitet) og YearRemodAdd (år huset blev renoveret).

I eksemplet nedenfor ser vi på vores vigtigste nøglefaktor, som er køkkenkvalitet, som er Excellent. Resultaterne ligner dem, vi så, da vi analyserede kategoriske målepunkter med nogle få vigtige forskelle:

  • Søjlediagrammet til højre kigger på gennemsnit i stedet for procenter. Det viser os derfor, hvad den gennemsnitlige huspris for et hus med et fremragende køkken er (grøn bar) sammenlignet med den gennemsnitlige huspris for et hus uden et fremragende køkken (stiplet linje)
  • Tallet i boblen er stadig forskellen mellem den røde stiplede linje og den grønne linje, men det udtrykkes som et tal ($158,49K) i stedet for en sandsynlighed (1,93 x). Så i gennemsnit er huse med fremragende køkkener næsten $ 160K dyrere end huse uden fremragende køkkener.

Screenshot of numeric target categorical influencers.

I nedenstående eksempel ser vi på den indvirkning, en fortløbende faktor (år huset blev ombygget) har på husprisen. Forskellene i forhold til, hvordan vi analyserer fortløbende nøglefaktorer for kategoriske målepunkter, er som følger:

  • Punktdiagrammet i ruden til højre viser den gennemsnitlige huspris for hver enkelt værdi af året, der er ombygget.
  • Værdien i boblen viser, hvor meget den gennemsnitlige huspris stiger (i dette tilfælde $ 2,87k), når året huset blev ombygget stiger med sin standardafvigelse (i dette tilfælde 20 år)

Screenshot of numeric target continuous influencers.

Endelig ser vi på det gennemsnitlige år, hvor et hus blev bygget, i forbindelse med målinger. Analysen er som følger:

  • Punktdiagrammet i ruden til højre viser den gennemsnitlige huspris for hver enkelt værdi i tabellen
  • Værdien i boblen viser, hvor meget den gennemsnitlige huspris stiger (i dette tilfælde $1,35.000), når det gennemsnitlige år stiger med standardafvigelsen (i dette tilfælde 30 år)

Screenshot of Key influencers for house prices with influencers on the left and the scatterplot on the right.

Fortolkning af resultaterne: De øverste segmenter

De øverste segmenter for numeriske mål viser grupper, hvor huspriserne i gennemsnit er højere end i det samlede datasæt. Nedenfor kan vi f.eks. se, at Segment 1 består af huse, hvor GarageCars (antal biler, som garagen kan passe) er større end 2, og RoofStyle er Hip. Huse med disse egenskaber har en gennemsnitlig pris på $355.000 sammenlignet med det samlede gennemsnit i dataene, som er $180.000.

Screenshot that shows Top segments for house prices.

Analysér en metrikværdi, der er en måling eller en opsummeret kolonne

Hvis der er tale om en måling eller en opsummeret kolonne, er analysen som standard den fortløbende analysetype , der er beskrevet ovenfor. Den kan ikke ændres. Den største forskel mellem analyse af en måling/opsummeret kolonne og en ikke-opsummeret numerisk kolonne er det niveau, som analysen kører på.

Hvis der er tale om ikke-opsummerede kolonner, kører analysen altid på tabelniveau. I eksemplet med huspris ovenfor analyserede vi metrikværdien Huspris for at se, hvad der får en huspris til at stige/falde. Analysen kører automatisk på tabelniveau. Vores tabel har et entydigt id for hvert hus, så analysen kører på husniveau.

Screenshot that shows the table level analysis for the house price example.

For målinger og opsummerede kolonner ved vi ikke straks, hvilket niveau de skal analyseres på. Hvis Huspris blev opsummeret som et gennemsnit, ville vi være nødt til at overveje, hvilket niveau vi gerne vil have denne gennemsnitlige huspris beregnet på. Er det den gennemsnitlige huspris på kvartersniveau? Eller måske et regionalt niveau?

Målinger og opsummerede kolonner analyseres automatisk på niveauet i de anvendte felter Forklar med . Forestil dig, at vi har tre felter i Forklar ved , som vi er interesseret i: Køkkenkvalitet, Bygningstype og Aircondition. Den gennemsnitlige huspris beregnes for hver entydige kombination af disse tre felter. Det er ofte nyttigt at skifte til en tabelvisning for at se, hvordan de data, der evalueres, ser ud.

Screenshot that shows the three columns and the average house price.

Denne analyse er meget opsummeret, og det vil derfor være svært for regressionsmodellen at finde eventuelle mønstre i de data, den kan lære af. Vi bør køre analysen på et mere detaljeret niveau for at få bedre resultater. Hvis vi vil analysere husprisen på husniveau, skal vi eksplicit føje feltet Id til analysen. Ikke desto mindre ønsker vi ikke, at hus-id'et betragtes som en nøglefaktor. Det er ikke nyttigt at lære, at i takt med at hus-id stiger, stiger prisen på et hus. Indstillingen Udvid efter felt er praktisk her. Du kan bruge Udvid med til at tilføje felter, du vil bruge til at angive analyseniveauet uden at søge efter nye nøglefaktorer.

Se, hvordan visualiseringen ser ud, når vi føjer id'et til Udvid med. Når du har defineret det niveau, hvor målingen skal evalueres, er fortolkningen af nøglefaktorer nøjagtigt den samme som for ikke-opsummerede numeriske kolonner.

Screenshot that shows the house price visualization that depends on the three columns discussed in this section.

Hvis du vil vide mere om, hvordan du kan analysere målinger med visualiseringen af nøglefaktorer, kan du se følgende video. Hvis du vil vide, hvordan Power BI bruger ML.NET bag kulisserne til at forklare data og få indsigt på en naturlig måde, skal du se Power BI identificerer nøglefaktorer ved hjælp af ML.NET.

Bemærk

Denne video bruger muligvis tidligere versioner af Power BI Desktop eller Power BI-tjeneste.

Overvejelser og fejlfinding

Hvilke begrænsninger er der for visualiseringen?

Visualiseringen af nøglefaktorer har nogle begrænsninger:

  • Direct Query understøttes ikke
  • Live Forbind ion til Azure Analysis Services og SQL Server Analysis Services understøttes ikke
  • Publicer på internettet understøttes ikke
  • Microsoft .NET Framework 4.6 eller nyere er påkrævet
  • SharePoint Online-integrering understøttes ikke

Screenshot of drop-down choices for numeric question

Jeg får vist en fejl om, at der ikke blev fundet nogen nøglefaktorer eller segmenter. Hvorfor?

Screenshot of no influencers found error message.

Denne fejl opstår, når du har medtaget felter i Forklar ved , men der ikke blev fundet nogen nøglefaktorer.

  • Du inkluderede den metrikværdi, du analyserede, i både Analysér og Forklar ved. Fjern den fra Forklar ved.
  • Dine forklarende felter har for mange kategorier med få observationer. Denne situation gør det svært for visualiseringen at afgøre, hvilke faktorer der er nøglefaktorer. Det er svært at generalisere på baggrund af nogle få observationer. Hvis du analyserer et numerisk felt, kan det være en god idé at skifte fra Kategorianalyse til Fortløbende analyse i ruden Formatering under kortet Analyse .
  • Dine forklarende faktorer har nok observationer til at generalisere, men visualiseringen fandt ingen meningsfulde korrelationer til rapporten.

Jeg får vist en fejl om, at den metrikværdi, jeg analyserer, ikke har nok data til at køre analysen. Hvorfor?

Screenshot of not enough data error message.

Visualiseringen fungerer ved at se på mønstre i dataene for én gruppe sammenlignet med andre grupper. Det ser f.eks. ud for kunder, der gav lave bedømmelser sammenlignet med de kunder, der gav høje bedømmelser. Hvis dataene i din model kun indeholder nogle få observationer, er det svært at finde mønstre. Hvis visualiseringen ikke har nok data til at finde meningsfulde nøglefaktorer, angiver det, at der er behov for flere data for at køre analysen.

Vi anbefaler, at du har mindst 100 observationer for den valgte tilstand. I dette tilfælde er staten kunder, der afskaftager. Du skal også bruge mindst 10 observationer for de stater, du bruger til sammenligning. I dette tilfælde er sammenligningstilstanden kunder, der ikke aftager.

Hvis du analyserer et numerisk felt, kan det være en god idé at skifte fra Kategorianalyse til Fortløbende analyse i ruden Formatering under kortet Analyse .

Jeg får vist en fejl om, at når 'Analysér' ikke opsummeres, kører analysen altid på rækkeniveau i den overordnede tabel. Det er ikke tilladt at ændre dette niveau via 'Udvid efter'-felter. Hvorfor?

Når du analyserer en numerisk eller kategorisk kolonne, kører analysen altid på tabelniveau. Hvis du f.eks. analyserer huspriser, og tabellen indeholder en id-kolonne, køres analysen automatisk på hus-id-niveauet.

Når du analyserer en måling eller en opsummeret kolonne, skal du eksplicit angive, på hvilket niveau analysen skal køre på. Du kan bruge Udvid ved at ændre analyseniveauet for målinger og opsummerede kolonner uden at tilføje nye nøglefaktorer. Hvis Huspris er defineret som en måling, kan du føje kolonnen hus-id til Udvid ved at ændre analysens niveau.

Jeg får vist en fejl om, at et felt i Forklar ved ikke er entydigt relateret til den tabel, der indeholder den metrikværdi, jeg analyserer. Hvorfor?

Analysen kører på tabelniveau for det felt, der analyseres. Hvis du f.eks. analyserer kundefeedback for din tjeneste, kan du have en tabel, der fortæller dig, om en kunde har givet en høj eller lav bedømmelse. I dette tilfælde kører din analyse på kundetabelniveau.

Hvis du har en relateret tabel, der er defineret på et mere detaljeret niveau end den tabel, der indeholder din metrikværdi, får du vist denne fejl. Her er et eksempel:

  • Du analyserer, hvad der får kunderne til at give lave bedømmelser af din tjeneste.
  • Du vil gerne se, om den enhed, som kunden bruger din tjeneste på, påvirker de anmeldelser, de giver.
  • En kunde kan bruge tjenesten på flere forskellige måder.
  • I følgende eksempel bruger kunde 10000000 både en browser og en tablet til at interagere med tjenesten.

Screenshot of a related table defined at a more granular level than the table that contains your metric.

Hvis du forsøger at bruge enhedskolonnen som en forklarende faktor, får du vist følgende fejl:

Screenshot of wrong column error message.

Denne fejl vises, fordi enheden ikke er defineret på kundeniveau. Én kunde kan forbruge tjenesten på flere enheder. Hvis visualiseringen skal finde mønstre, skal enheden være en attribut for kunden. Der er flere løsninger, der afhænger af din forståelse af virksomheden:

  • Du kan ændre opsummering af enheder, så de tælles. Brug f.eks. antal, hvis antallet af enheder kan påvirke den score, som en kunde giver.
  • Du kan pivotere enhedskolonnen for at se, om forbrug af tjenesten på en bestemt enhed påvirker en kundes bedømmelse.

I dette eksempel blev dataene pivoteret for at oprette nye kolonner til browser, mobil og tablet (sørg for at slette og genoprette dine relationer i udformningsvisningen, når du har pivoteret dine data). Du kan nu bruge disse specifikke enheder i Forklar ved. Alle enheder viser sig at være nøglefaktorer, og browseren har den største effekt på kundescore.

Mere præcist er kunder, der ikke bruger browseren til at forbruge tjenesten, 3,79 gange mere tilbøjelige til at give en lav score end de kunder, der gør. Længere nede på listen er det omvendte sandt for mobilenheder. Kunder, der bruger mobilappen, har større sandsynlighed for at give en lav score end de kunder, der ikke gør det.

Screenshot that shows mobile app are more likely to give a low score.

Jeg får vist en advarsel om, at målinger ikke var inkluderet i min analyse. Hvorfor?

Screenshot that shows measures not included error message.

Analysen kører på tabelniveau for det felt, der analyseres. Hvis du analyserer kundeafgang, kan du have en tabel, der fortæller dig, om en kunde er kunde eller ej. I dette tilfælde kører din analyse på kundetabelniveau.

Målinger og aggregeringer analyseres som standard på tabelniveau. Hvis der var en måling for de gennemsnitlige månedlige udgifter, ville den blive analyseret på kundetabelniveau.

Hvis kundetabellen ikke har et entydigt id, kan du ikke evaluere målingen, og den ignoreres af analysen. Hvis du vil undgå denne situation, skal du sørge for, at tabellen med din metrikværdi har et entydigt id. I dette tilfælde er det kundetabellen, og det entydige id er kunde-id. Det er også nemt at tilføje en indekskolonne ved hjælp af Power Query.

Jeg får vist en advarsel om, at den metrikværdi, jeg analyserer, har mere end 10 entydige værdier, og at dette beløb kan påvirke kvaliteten af min analyse. Hvorfor?

AI-visualiseringen kan analysere kategorifelter og numeriske felter. I tilfælde af kategorifelter kan et eksempel være Churn er Ja eller Nej, og Kundetilfredshed er Høj, Mellem eller Lav. Hvis du øger antallet af kategorier, der skal analyseres, er der færre observationer pr. kategori. Denne situation gør det sværere for visualiseringen at finde mønstre i dataene.

Når du analyserer numeriske felter, kan du vælge mellem at behandle de numeriske felter som tekst, i hvilket tilfælde du kører den samme analyse, som du gør for kategoriske data (kategorianalyse). Hvis du har mange forskellige værdier, anbefaler vi, at du skifter analysen til Fortløbende analyse , da det betyder, at vi kan udlede mønstre fra, når tal øges eller reduceres, i stedet for at behandle dem som særskilte værdier. Du kan skifte fra Kategorisk analyse til Fortløbende analyse i formateringsruden under kortet Analyse.

Hvis du vil finde stærkere nøglefaktorer, anbefaler vi, at du grupperer lignende værdier i en enkelt enhed. Hvis du f.eks. har en metrikværdi for pris, vil du sandsynligvis opnå bedre resultater ved at gruppere lignende priser i kategorierne High, Medium og Low i forhold til at bruge individuelle prispoint.

Screenshot that shows more than 10 unique factors warning.

Der er faktorer i mine data, der ser ud til at være nøglefaktorer, men det er de ikke. Hvordan kan det ske?

I følgende eksempel kører kunder, der er forbrugere, lave bedømmelser med 14,93 % af bedømmelserne, der er lave. Administratorrollen har også en stor andel af lave bedømmelser på 13,42 %, men den betragtes ikke som en nøglefaktor.

Årsagen til denne bestemmelse er, at visualiseringen også tager antallet af datapunkter i betragtning, når den finder nøglefaktorer. Følgende eksempel har mere end 29.000 forbrugere og 10 gange færre administratorer, ca. 2.900. Kun 390 af dem gav en lav bedømmelse. Visualiseringen har ikke nok data til at afgøre, om den har fundet et mønster med administratorklassifikationer, eller om det blot er en chance for at finde dem.

Screenshot that shows how influencers are determined.

Hvad er datapunktgrænserne for nøglefaktorer? Vi kører analysen på et eksempel på 10.000 datapunkter. Boblerne på den ene side viser alle de nøglefaktorer, der blev fundet. Søjlediagrammer og punktdiagrammer på den anden side overholder udsnitsstrategierne for disse centrale visualiseringer.

Hvordan beregner du nøglefaktorer for kategoriske analyser?

Ai-visualiseringen bruger ML.NET til at køre en logistisk regression i baggrunden for at beregne nøglefaktorerne. En logistisk regression er en statistisk model, der sammenligner forskellige grupper med hinanden.

Hvis du vil se, hvad der driver lave bedømmelser, ser den logistiske regression på, hvordan de kunder, der gav en lav score, adskiller sig fra de kunder, der gav en høj score. Hvis du har flere kategorier, f.eks. høje, neutrale og lave scorer, kan du se, hvordan de kunder, der gav en lav bedømmelse, adskiller sig fra de kunder, der ikke gav en lav bedømmelse. I dette tilfælde, hvordan adskiller de kunder, der gav en lav score, sig fra de kunder, der gav en høj bedømmelse eller en neutral bedømmelse?

Den logistiske regression søger efter mønstre i dataene og søger efter, hvordan de kunder, der gav en lav bedømmelse, kan afvige fra de kunder, der gav en høj bedømmelse. Det kan f.eks. finde ud af, at kunder med flere supportanmodninger giver en højere procentdel af lave bedømmelser end kunder med få eller ingen supportanmodninger.

Den logistiske regression tager også højde for, hvor mange datapunkter der er til stede. Hvis kunder, der spiller en administratorrolle, f.eks. giver forholdsvis flere negative scorer, men der kun er få administratorer, anses denne faktor ikke for at have indflydelse. Denne bestemmelse foretages, fordi der ikke er nok tilgængelige datapunkter til at udlede et mønster. En statistisk test, der kaldes en Wald-test, bruges til at afgøre, om en faktor betragtes som en nøglefaktor. Visualiseringen bruger en p-værdi på 0,05 til at bestemme tærsklen.

Hvordan beregner du nøglefaktorer for numerisk analyse?

Ai-visualiseringen bruger ML.NET til at køre en lineær regression i baggrunden for at beregne nøglefaktorerne. En lineær regression er en statistisk model, der ser på, hvordan resultatet af det felt, du analyserer ændringer, er baseret på dine forklarende faktorer.

Hvis vi f.eks. analyserer huspriser, vil en lineær regression se på den effekt, som et fremragende køkken vil have på husprisen. Har huse med fremragende køkkener generelt lavere eller højere huspriser sammenlignet med huse uden fremragende køkkener?

Den lineære regression tager også antallet af datapunkter i betragtning. Hvis huse med tennisbaner f.eks. har højere priser, men vi har få huse med en tennisbane, anses denne faktor ikke for at have indflydelse. Denne bestemmelse foretages, fordi der ikke er nok tilgængelige datapunkter til at udlede et mønster. En statistisk test, der kaldes en Wald-test, bruges til at afgøre, om en faktor betragtes som en nøglefaktor. Visualiseringen bruger en p-værdi på 0,05 til at bestemme tærsklen.

Hvordan beregner du segmenter?

Ai-visualiseringen bruger ML.NET til at køre et beslutningstræ i baggrunden for at finde interessante undergrupper. Formålet med beslutningstræet er at ende med en undergruppe af datapunkter, der er relativt høj i den metrikværdi, du er interesseret i. Det kan være kunder med lave bedømmelser eller huse med høje priser.

Beslutningstræet tager hver forklarende faktor og forsøger at finde ud af, hvilken faktor der giver den bedste opdeling. Hvis du f.eks. filtrerer dataene, så de kun omfatter store virksomhedskunder, vil det så adskille de kunder, der gav en høj bedømmelse i forhold til en lav bedømmelse? Eller er det måske bedre at filtrere dataene, så de kun omfatter kunder, der har kommenteret sikkerheden?

Når beslutningstræet foretager en opdeling, tager det undergruppen af data og bestemmer den næste bedste opdeling for de pågældende data. I dette tilfælde er undergruppen kunder, der har kommenteret sikkerhed. Efter hver opdeling overvejer beslutningstræet også, om det har nok datapunkter til, at denne gruppe er repræsentativ nok til at udlede et mønster fra, eller om det er en uregelmæssighed i dataene og ikke et reelt segment. Der anvendes en anden statistisk test til at kontrollere den statistiske betydning af opdelingsbetingelsen med p-værdien 0,05.

Når beslutningstræet er færdigt, tager det alle opdelinger, f.eks. sikkerhedskommentarer og store virksomheder, og opretter Power BI-filtre. Denne kombination af filtre pakkes sammen som et segment i visualiseringen.

Hvorfor bliver visse faktorer nøglefaktorer eller stopper med at være nøglefaktorer, når jeg flytter flere felter til feltet Forklar med ?

Visualiseringen evaluerer alle forklarende faktorer sammen. En faktor kan være en nøglefaktor i sig selv, men når den overvejes sammen med andre faktorer, er den muligvis ikke. Lad os antage, at du vil analysere, hvad der får en huspris til at være høj, med værelser og husstørrelse som forklarende faktorer:

  • I sig selv kan flere værelser være en faktor for huspriserne for at være høje.
  • Hvis du medtager husets størrelse i analysen, kan du nu se på, hvad der sker med soveværelserne, mens husets størrelse forbliver konstant.
  • Hvis husets størrelse er fastsat til 1.500 kvadratmeter, er det usandsynligt, at en kontinuerlig stigning i antallet af værelser vil dramatisk øge husprisen.
  • Værelser er måske ikke så vigtige for en faktor, som det var før husets størrelse blev overvejet.

Deling af din rapport med en Power BI-kollega kræver, at I begge har individuelle Power BI Pro-licenser, eller at rapporten er gemt i En Premium-kapacitet. Se deling af rapporter.