Použití přehledů v Power BI Desktopu ke zjištění rozdílů v rozdělení (Preview)Apply insights in Power BI Desktop to discover where distributions vary (preview)

Ve vizuálech často vidíte nějaký datový bod a zajímá vás, jestli by rozdělení bylo stejné i v jiných kategoriích.Often in visuals, you see a data point, and wonder about whether distribution would be the same for different categories. V přehledech Power BI Desktopu to zjistíte několika kliknutími.With insights in Power BI Desktop you can find out with just a few clicks.

Například v tomto vizuálu jsou zobrazené celkové tržby (Total Sales) podle zemí (Country).Consider the following visual, which shows Total Sales by Country. Z grafu je patrné, že většina tržeb pochází ze Spojených Států, konkrétně 57 % z celkových tržeb. Ostatní země přispívají menší částkou.As the chart shows, most sales come from the United States, accounting for 57% of all sales with lessor contributions coming from the other countries. V podobných případech vás může často zajímat, jestli by rozdělení bylo stejné i u jiných dílčích souborů.It's often interesting in such cases to explore whether that same distribution would be seen for different sub-populations. Bude stejné třeba ve všech letech, pro všechny prodejní kanály a kategorie produktů?For example, is this the same for all years, all sales channels, and all categories of products? I kdybyste k vizuálnímu porovnání výsledků použili různé filtry, bude taková činnost časově náročná a může vést k chybám.While you could apply different filters and compare the results visually, doing so can be time consuming and error prone.

Graf s velkým rozdělením

Power BI Desktopu můžete dát příkaz, aby našel rozdíly v rozdělení a vy jste rychle získali automatickou přehlednou analýzu dat.You can tell Power BI Desktop to find where a distribution is different, and get fast, automated, insightful analysis about your data. Stačí kliknout pravým tlačítkem myši na některý datový bod a vybrat Analyzovat > Zjistit, kde se toto rozdělení liší. Otevře se snadno použitelné okno s přehledem.Simply right-click on a data point, and select Analyze > Find where the distribution is different, and insight is delivered to you in an easy-to-use window.

Přehled rozdílů v rozdělení

V tomto příkladu nám automatická analýza rychle ukáže, že podíl tržeb z cestovních kol (Touring Bikes) je v USA a Kanadě nižší, zatímco v ostatních zemích je vyšší.In this example, the automated analysis quickly shows that for Touring Bikes, the proportion of sales in the United States and Canada are lower, while the proportion coming from the other countries is higher.

Poznámka

Tato funkce je ve verzi Preview a může se změnit.This feature is in preview, and is subject to change. Funkce přehledu je ve výchozím nastavení povolená a zapnutá (nemusíte tedy zaškrtávat políčko náhledu, abyste ji povolili) od verze Power BI Desktopu vydané v září 2017.The insight feature is enabled and on by default (you don't need to check a Preview box to enable it) beginning with the September 2017 version of Power BI Desktop.

Používání přehledůUsing insights

Pokud chcete z přehledů zjistit, jak se liší rozdělení v jednotlivých grafech, jednoduše klikněte pravým tlačítkem myši na libovolný datový bod (nebo na celý vizuál) a vyberte Analyzovat > Zjistit, kde se toto rozdělení liší.To use insights to find where distributions seen on charts are different, just right-click on any data point (or on the visual as a whole), and select Analyze > Find where the distribution is different.

Získání přehledu kliknutím pravým tlačítkem myši

Power BI Desktop pak spustí nad těmito daty algoritmus strojového učení. Otevře se okno s vizuálem a popisem kategorií (sloupců) a hodnot těchto sloupců s největšími rozdíly v rozdělení.Power BI Desktop then runs its machine learning algorithms over the data, and populates a window with a visual and a description that describes which categories (columns), and which values of those columns, result in the most significantly different distribution. Přehled se zobrazí jako sloupcový graf (je to vidět na následujícím obrázku).Insights are provided as a column chart, as shown in the following image.

Sloupcový graf

Hodnoty odpovídající použitému vybranému filtru mají normální výchozí barvu.The values with the selected filter applied are shown using the normal default color. Celkové hodnoty původně zobrazené ve výchozím vizuálu jsou kvůli snadnému porovnání zobrazené šedě.The overall values, as seen on the original starting visual, are shown in grey for easy comparison. Můžete přidat až tři různé filtry. V tomto příkladu jsou to filtry pro cestovní kola (Touring Bikes), horská kola (Mountain Bikes) a silniční kola (Road Bikes). Můžete je zvolit tím, že na ně kliknete (pokud chcete vybrat více možností, podržte Ctrl a postupně na ně klikněte).Up to three different filters might be included (Touring Bikes, Mountain Bikes, Road Bikes in this example) and different filters can be chosen by clicking on them (or using ctrl-click to select multiple).

U jednoduchých celkových částek, v tomto příkladu jsou to třeba celkové tržby (Total Sales), vychází srovnání z relativních, nikoli z absolutních hodnot.For simple additive measures, like Total Sales in this example, the comparison is based on the relative, rather than absolute, values. Tržby z cestovních kol (Touring Bikes) jsou nižší než celkové tržby za všechny kategorie. Ve výchozím nastavení se ve vizuálu použijí k porovnání tržeb za cestovní kola s tržbami za všechny kategorie kol v různých zemích dvě osy.Hence while the sales for Touring Bikes are lower than overall sales for all categories, by default the visual uses a dual axis to allow the comparison between the proportion of sales across different countries, for Touring Bikes versus all categories of bikes. Když přepnete přepínač pod vizuálem, zobrazí se obě hodnoty na stejné ose, abyste mohli jednoduše srovnávat absolutní hodnoty (viz následující obrázek).Switching the toggle below the visual allows the two values to be displayed in the same axis, allowing the absolute values to easily be compared (as shown in the following image).

Vizuály zobrazené při použití přehledů

Popisný text také informuje o tom, jakou důležitost můžete přikládat filtrované hodnotě, a to tím, že uvádí počet záznamů, které odpovídají filtru.The descriptive text also gives some indication of the level of importance that might be attached to a filter value, by given the number of records that match the filter. V tomto příkladu vidíte, že i když se rozdělení u cestovních kol (Touring Bikes) výrazně liší, představuje jen 16,6 % všech záznamů.So in this example, you can see that while the distribution for Touring Bikes might be significantly different, they account for only 16.6% of records.

Prostřednictvím ikon palce nahoru a palce dolů nahoře na stránce nám můžete dát vědět, co si o vizuálu a funkci myslíte.The thumbs up and thumbs down icons at the top of the page are provided so you can provide feedback about the visual and the feature. Tím nám poskytnete zpětnou vazbu, ale v současnosti ještě netrénujete algoritmus, aby dokázal ovlivnit výsledky vrácené při příštím použití funkce.Doing so provides feedback, but it does not currently train the algorithm to influence the results returned next time you use the feature.

Důležitým prvkem je také tlačítko + v horní části vizuálu, které vám umožňuje přidat vybraný vizuál do sestavy stejným způsobem, jako kdybyste vytvářeli vizuál ručně.And importantly, the + button at the top of the visual lets you add the selected visual to your report, just as if you created the visual manually. Přidaný vizuál pak můžete zformátovat nebo jinak upravit stejně jako kterýkoli jiný vizuál v sestavě.You can then format or otherwise adjust the added visual just as you would to any other visual on your report. Při úpravě sestavy v Power BI Desktopu můžete přidat jenom vybraný vizuál přehledu.You can only add a selected insight visual when you're editing a report in Power BI Desktop.

Přehledy můžete používat, když je sestava v režimu pro čtení nebo úpravy. Díky tomu jsou přehledy univerzální a můžete pomocí nich analyzovat data i vytvářet vizuály, které pak snadno přidáte do sestav.You can use insights when your report is in reading or editing mode, making it versatile for both analyzing data, and for creating visuals you can easily add to your reports.

Podrobnosti vrácených výsledkůDetails of the returned results

Představte si funkci algoritmu tak, že vezme všechny další sloupce modelu a všechny hodnoty těchto sloupců a použije je jako filtry původního vizuálu. Tímto způsobem zjistí, které z takto vyfiltrovaných hodnot představují největší výsledný rozdíl proti původnímu vizuálu.You can think of the algorithm as taking all the other columns in the model, and for all of the values of those columns, applying them as filters to the original visual, and finding which of those filter values produces the most different result from the original.

Asi vás zajímá, co znamená rozdíl.You likely wonder what different means. Představte si například následující rozdělení celkových tržeb (Sales) mezi USA a Kanadou:For example, say that the overall split of sales between the USA and Canada was the following:

CountryCountry Sales ($M)Sales ($M)
USAUSA 1515
KanadaCanada 55

Pro konkrétní kategorii produktů silniční kola (Road Bike) může podíl tržeb vypadat takto:Then for a particular category of product “Road Bike) the split of sales might be:

CountryCountry Sales ($M)Sales ($M)
USAUSA 33
KanadaCanada 11

I když se údaje v každé tabulce liší, zůstávají relativní hodnoty USA a Kanady stále stejné, a to jak celkově, tak pro silniční kola (Road Bike) je to 75 % a 25 %.While the numbers are different in each of those tables, the relative values between USA and Canada are identical (75% and 25% overall, and for Road Bikes). Proto se to nepovažuje za rozdíl.Because of that, these are not considered different. U jednoduchých celkových částek, jako je tato, hledá algoritmus rozdíly v relativní hodnotě.For simple additive measures like this, the algorithm is therefore looking for differences in the relative value.

Pro srovnání si představte třeba marži, která se vypočítá jako podíl zisku a nákladů. Představte si následující celkovou marži (Margin) odpovídající USA a Kanadě:By contrast consider a measure like margin, that is calculated as Profit/Cost, and say that the overall margins for the USA and Canada were the following

CountryCountry Margin (%)Margin (%)
USAUSA 1515
KanadaCanada 55

Pro konkrétní kategorii produktů silniční kola (Road Bike) může podíl tržeb vypadat takto:Then for a particular category of product “Road Bike) the split of sales might be:

CountryCountry Margin (%)Margin (%)
USAUSA 33
KanadaCanada 11

Vzhledem k povaze hodnot jsou tyto rozdíly považované za zajímavé.Given the nature of such measures, this is considered interestingly different. U nesoučtových hodnot (třeba u marže) hledá algoritmus rozdíly v absolutní hodnotě.So for non-additive measures such as this margin example, the algorithm is looking for differences in the absolute value.

Zobrazené vizuály jasně znázorňují rozdíl mezi celkovým rozdělením (viz původní vizuál) a hodnotou získanou použitím určitého filtru.The visuals displayed are thus intended to clearly show the differences found between the overall distribution (as seen in the original visual) and the value with the particular filter applied.

U celkových částek, jako jsou tržby (Sales) v předchozím příkladu, se použije sloupcový a spojnicový graf se dvěma osami a vhodným měřítkem pro snadné porovnání relativních hodnot.So for additive measures, like Sales in the previous example, a column and line chart is used, where the use of a dual axis with appropriate scaling such that the relative values can easily be compared. Sloupce znázorňují hodnoty s použitým filtrem a na řádku je vidět celková hodnota (osa sloupce je vlevo a osa řádku je vpravo jako obvykle).The columns show the value with the filter applied, and the line shows the overall value (with the column axis being on the left, and the line axis on the right, as normal). Čára ve stupňovitém stylu je přerušovaná a má šedou výplň.The line is shown using a stepped style, with a dashed line, filled with grey. V předchozím příkladu je maximální hodnota osy sloupce 4 a maximální hodnota osy řádku 20, takže můžete jednoduše porovnat relativní hodnoty USA a Kanady, ať už filtrované nebo celkové.For the previous example, if the column axis maximum value is 4, and the line axis maximum value is 20, then it would allow easy comparison of the relative values between USA and Canada for the filtered and overall values.

Podobně u nesoučtových hodnot, například u marže (Margin) v předchozím příkladu, se použije sloupcový a spojnicový graf, který má jen jednu osu. Na ní můžete jednoduše porovnat absolutní hodnoty.Similarly, for non-additive measures like Margin in the previous example, a column and line chart is used, where the use of a single axis means the absolute values can easily be compared. I tady čára (s šedou výplní) zobrazuje celkové hodnoty.Again the line (filled with grey) shows the overall value. Pokud při porovnávání skutečných nebo relativních hodnot chcete určit míru odlišnosti dvou rozdělení, nestačí jenom jednoduše vypočítat rozdíl hodnot.Whether comparing actual or relative numbers, the determination of the degree to which two distributions are different is not simply a matter of calculating the difference in the values. Příklad:For example:

  • Přihlédnutí k velikosti populace. Rozdíly jsou méně statisticky významné a méně zajímavé, pokud se týkají menší části celkové populace.The size of the population is factored in, as a difference is less statistically significant and less interesting when it applies to a smaller proportion of the overall population. Například rozdělení tržeb podle zemí může být u určitého produktu úplně jiné. Ale tento údaj nebude zajímavý, pokud existují tisíce produktů, takže tento konkrétní produkt představuje jenom malé procento celkových tržeb.As an example, the distribution of sales across countries might be very different for some particular product, this would not be considered interesting if there were thousands of products, and hence that particular product accounted for only a small percentage of the overall sales.

  • Rozdíly v kategoriích s velmi vysokými původními hodnotami nebo s hodnotami, které se naopak blížily nule, mají větší váhu než ostatní.Differences for those categories where the original values were very high or very close to zero are weighted higher than others. Pokud například celkový příspěvek země představuje jen 1 % tržeb, ale u určitého typu produktu je její příspěvek 6 %, je to statisticky významnější a také zajímavější než země, jejíž příspěvek se změnil z 50 % na 55 %.For example, if a country overall contributes only 1% of sales, but for some particular type of product contributes 6%, that is more statistically significant, and therefore considered more interesting, than a country whose contribution changed from 50% to 55%.

  • K výběru nejvýznamnějších výsledků se používají různé heuristiky, které zohledňují třeba další vztahy mezi daty.Various heuristics are employed to select the most meaningful results, for example by considering other relationships between the data.

Po prozkoumání různých sloupců a hodnot v každém z těchto sloupců se vyberou sady hodnot s největšími rozdíly.After examining different columns, and the values for each of those columns, the set of values that give the biggest differences are chosen. Kvůli snadnějšímu porozumění jsou tyto rozdíly ve výstupech seskupeny podle sloupců. Sloupec s hodnotami, které představují největší rozdíl, je první.For ease of understanding, these are then output grouped by column, with the column whose values give the biggest difference listed first. Sloupec může zobrazovat až tři hodnoty nebo jich může být zobrazeno méně, pokud ve sloupci nejsou tři hodnoty s velkým vlivem nebo mají některé hodnoty výrazně větší vliv než jiné.Up to three values are shown per column, but less might be shown either if there were fewer than three values that have a large effect, or if some values are much more impactful than others.

Nemusí vždy platit, že v dostupném čase budou prozkoumány všechny sloupce modelu. To znamená, že není zaručeno, že budou zobrazeny nejdůležitější sloupce a hodnoty.It is not necessarily the case that all of the columns in the model will be examined in the time available, so it is not guaranteed that the most impactful columns and values are displayed. Nicméně se používají různé heuristiky, které zajistí, aby se nejpravděpodobnější sloupce prozkoumaly jako první.However, various heuristics are employed to ensure that the most likely columns are examined first. Průzkumem všech sloupců se například zjistí, že v rozdělení mají největší vliv následující sloupce/hodnoty (od nejvlivnějších po nejméně vlivné):For example, say that after examining all the columns, it is determined that the following columns/values have the biggest impact on the distribution, from most impact to least:

Subcategory = Touring Bikes
Channel = Direct
Subcategory = Mountain Bikes
Subcategory = Road Bikes
Subcategory = Kids Bikes
Channel = Store

Ty budou zahrnuty do výstupů v následujícím pořadí sloupců:These would get output in column order, as follows:

Subcategory: Touring Bikes, Mountain Bikes, Road Bikes (only three listed, with the text including “...amongst others” to indicate that more than three have a significant impact) 

Channel = Direct (only Direct listed, if it’s level of impact was much greater than Store)

Důležité informace a omezeníConsiderations and limitations

V následujícím seznamu najdete scénáře, které momentálně u přehledů nepodporujeme:The following list is the collection of currently unsupported scenarios for insights:

  • Filtry nejlepších položekTopN filters
  • Filtry měrMeasure filters
  • Nečíselné míryNon-numeric measures
  • Použití volby Zobrazit hodnoty jakoUse of "Show value as"
  • Filtrované hodnoty jsou výpočty na úrovni vizuálu s použitým určitým filtrem, například celkové tržby ve Francii (Total Sales for France), které se používají v některých vizuálech vytvořených funkcí Přehledy.Filtered measures - filtered measures are visual level calculations with a specific filter applied (for example, Total Sales for France), and are used on some of the visuals created by the insights feature

Kromě toho v současné době u přehledů nepodporujeme následující typy modelů a zdroje dat:In addition, the following model types and data sources are currently not supported for insights:

  • DirectQueryDirectQuery
  • Živé připojeníLive connect
  • Místní služba Reporting ServicesOn-premises Reporting Services
  • VkládáníEmbedding

Další krokyNext steps

Další informace o Power BI Desktopu a o tom, jak s ním začít, najdete v následujících článcích.For more information about Power BI Desktop, and how to get started, check out the following articles.