Aplicación de información en Power BI para detectar dónde varían las distribuciones

Artículo
03/23/2023

SE APLICA A: Power BI Desktop Servicio Power BI

En elementos visuales, verá en ocasiones un punto de datos y podría preguntarse si la distribución será igual para las distintas categorías. Con la información detallada en Power BI, puede averiguarlo con unos pocos clics.

Tenga en cuenta el siguiente objeto visual, que muestra las ventas totales por nombre de país. La mayoría de las ventas proceden de Estados Unidos, ya que suponen el 57 % del total, mientras que las contribuciones procedentes del resto de países/regiones. En estos casos, es interesante investigar si se daría esa misma distribución para subpoblaciones diferentes. Por ejemplo, ¿sucede lo mismo para todos los años, todos los canales de ventas y todas las categorías de productos? Aunque podría aplicar filtros diferentes y comparar los resultados visualmente, esto puede llevar mucho tiempo y ser propenso a errores. Screenshot of a chart with a big distribution.

Puede indicarle a Power BI que busque en qué se diferencia una distribución para obtener un análisis rápido, automatizado y detallado de los datos. Solo tiene que hacer clic con el botón derecho en un punto de datos y seleccionar Analizar>Buscar en qué se diferencia esta distribución y se le proporcionará información detallada en una ventana fácil de usar.

Screenshot of an insight, showing a different distribution.

En este ejemplo, el análisis automático muestra que para las bicicletas de paseo la proporción de ventas en Estados Unidos y Canadá es menor, mientras que la proporción procedente del resto de países/regiones.

Uso de información

Para usar información detallada a fin de descubrir en qué se diferencian las distribuciones vistas en gráficos, basta con hacer clic con el botón derecho en cualquier punto de datos o en el objeto visual en su conjunto. A continuación, seleccione Analizar>Buscar donde esta distribución es diferente.

Screenshot of a Column chart, showing a right click menu.

Power BI ejecuta sus algoritmos de aprendizaje automático sobre los datos. Genera una ventana con un gráfico y una descripción de qué categorías (columnas) y qué valores de esas categorías tienen como resultado la distribución distinta más significativa. La información detallada se proporciona como un gráfico de columnas, como se muestra en la siguiente imagen:

Screenshot showing a Column chart and an insight.

Los valores con el filtro seleccionado aplicado se muestran en el color predeterminado. Los valores totales, igual que en el objeto visual de inicio original, se muestran en gris para facilitar la comparación. Se pueden incluir hasta tres filtros diferentes (bicicletas de paseo, bicicletas de montaña y bicicletas de carretera en este ejemplo). Para elegir los distintos filtros, hay que hacer clic en un punto de datos o usar CTRL+clic para seleccionar varios.

Para las medidas de adición simples, como las ventas totales en este ejemplo, la comparación se basa en valores relativos, en vez de absolutos. Las ventas de bicicletas de paseo son claramente inferiores a las ventas totales de todas las categorías; no obstante, el objeto visual usa de forma predeterminada un eje de dual para permitir la comparación entre la proporción de ventas en los distintos países/regiones. Esto es para bicicletas de paseo frente a todas las categorías de bicicletas. Al cambiar el botón de alternancia situado debajo del objeto visual, los dos valores se muestran en el mismo eje, lo que permite comparar fácilmente los valores absolutos, tal y como se muestra en la imagen siguiente:

Screenshot showing a visual with an insight.

El texto descriptivo también ofrece indicaciones sobre el grado de importancia que podría haberse asignado a un valor de filtro, dado el número de registros que coinciden con el filtro. En este ejemplo puede ver que, aunque la distribución para bicicletas de paseo podría ser significativamente diferente, suponen tan solo el 16,6 % de los registros.

Los iconos de pulgar hacia arriba y pulgar hacia abajo de la parte superior de la página se incluyen para que pueda proporcionar comentarios sobre el objeto visual y la característica. Sin embargo, si lo hace, no entrena el algoritmo para que influya en los resultados que se devuelvan la próxima vez que use la característica.

Y lo que es más importante, el botón + situado en la parte superior del objeto visual le permite agregar el objeto visual seleccionado al informe, como si lo hubiera creado manualmente. A continuación, puede aplicar formato o ajustar de cualquier forma el objeto visual agregado al igual que lo haría con cualquier otro objeto visual del informe. Solo puede agregar un objeto visual seleccionado de información detallada cuando vaya a editar un informe en Power BI.

Puede usar información detallada cuando el informe está en modo de lectura o edición. Esto lo hace versátil tanto para el análisis de datos como para la creación de objetos visuales que puede añadir a sus informes.

Detalles de los resultados devueltos

Considere que el algoritmo toma todas las demás columnas del modelo, y en el caso de todos los valores de esas columnas, aplíquelos como filtros al objeto visual original. A continuación, el algoritmo busca cuál de esos valores de filtro genera el resultado más diferente del original.

Es probable que se pregunte qué significa diferente. Por ejemplo, supongamos que el reparto de ventas total entre Estados Unidos y Canadá es el siguiente:

País/región	Ventas (M de $)
Estados Unidos	15
Canadá	5

Para una categoría de producto determinada (bicicleta de carretera), el reparto de ventas podría ser el siguiente:

País/región	Ventas (M de $)
Estados Unidos	3
Canadá	1

Aunque los números son diferentes en cada una de estas tablas, los valores relativos entre Estados Unidos y Canadá son idénticos (75 % y 25 % en total y para las bicicletas de carretera). Por lo tanto, estos no se consideran diferentes. Para las medidas de adición simples como esta, el algoritmo busca las diferencias en el valor relativo.

Por el contrario, considere una medida como el margen calculado como Beneficio/Costo. Si los márgenes generales para Estados Unidos y Canadá eran los siguientes:

País/región	Margen (%)
Estados Unidos	15
Canadá	5

Para una categoría de producto determinada (bicicleta de carretera), el reparto de ventas podría ser el siguiente:

País/región	Margen (%)
Estados Unidos	3
Canadá	1

Dada la naturaleza de dichas medidas, esto sí se considera diferente. Para las medidas que no son de adición, como este ejemplo de margen, el algoritmo busca las diferencias en el valor absoluto.

Por lo tanto, los objetos visuales que se muestran están diseñados para indicar claramente las diferencias que se encuentran entre la distribución total (como se ve en el objeto visual original) y el valor con el filtro particular aplicado.

Para las medidas de suma, como Sales en el ejemplo anterior, se usa un gráfico de columnas y líneas. En ese caso, el uso de un eje dual con la escala adecuada es tal que se pueden comparar los valores relativos. Las columnas muestran el valor con el filtro aplicado, mientras que la línea muestra el valor general. El eje de columnas está a la izquierda y el eje de líneas está a la derecha, como es normal. La línea se muestra mediante un estilo escalonado, con una línea discontinua, con relleno gris. Para el ejemplo anterior, si el valor máximo del eje de columna es 4 y el valor máximo del eje de línea es 20, se podrían comparar fácilmente los valores relativos entre los Estados Unidos y Canadá para los valores filtrados y totales.

Del mismo modo, para las medidas que no son de adición, como el margen en el ejemplo anterior, se usa un gráfico de columnas y líneas, donde el uso de un eje único permite comparar fácilmente los valores absolutos. De nuevo, la línea rellena de color gris muestra el valor total. Tanto si se comparan números reales o relativos, la determinación del grado en el que son diferentes dos distribuciones no se reduce a una cuestión de calcular la diferencia entre los valores. Por ejemplo:

El tamaño de la población se tiene en cuenta, ya que una diferencia es menos significativa estadísticamente y menos interesante cuando se aplica a una proporción menor de la población total. Por ejemplo, la distribución de ventas entre países o regiones podría ser diferente para un producto determinado. Esto no sería interesante si hubiera miles de productos, por lo que ese producto en particular solo tenía un pequeño porcentaje de las ventas generales.
Las diferencias de las categorías en las que los valores originales son muy altos o muy cercanos a cero tienen una ponderación superior a otras. Por ejemplo, si un país o región aporta en total solo un 1 % de las ventas, pero en un tipo de producto determinado aporta un 6 %, esto es más significativo estadísticamente y, por lo tanto, se considera más interesante que un país cuya contribución cambie del 50 % al 55 %.
Se emplean diferentes heurísticas para seleccionar los resultados más significativos, por ejemplo, al tener en cuenta otras relaciones entre los datos.

Después de examinar las distintas columnas y los valores de cada una de estas columnas, se elige el conjunto de valores que ofrecen las mayores diferencias. Para facilitar la comprensión, los resultados se agrupan por columna, con la columna cuyos valores proporcionan la diferencia más importante en primer lugar. Se muestran hasta tres valores por columna, pero podrían mostrarse menos si hay menos de tres valores con un gran efecto o si algunos valores son mucho más importantes que otros.

No necesariamente todas las columnas del modelo se examinarán en el tiempo disponible, por lo que no se garantiza que se muestren las columnas y los valores más impactantes. Aun así, se emplean diferentes heurísticas para asegurarse de que se examinen primero las columnas más probables. Por ejemplo, supongamos que después de examinar todas las columnas, se determina que las columnas o los valores siguientes tienen el mayor impacto en la distribución, mostrados de mayor a menor impacto:

Subcategory = Touring Bikes
Channel = Direct
Subcategory = Mountain Bikes
Subcategory = Road Bikes
Subcategory = Kids Bikes
Channel = Store

Estos aparecerían en la columna en el orden siguiente:

Subcategoría: Bicicletas de paseo, bicicletas de montaña, bicicletas de carretera (solo se enumeran tres, con el texto "entre otras" para indicar que más de tres tienen un impacto significativo)
Canal: Directo (solo se enumera Directo, si su nivel de impacto es mucho mayor que el de Almacén)

Consideraciones y limitaciones

La siguiente lista es una recopilación de los escenarios que actualmente no son compatibles para la característica de información detallada:

Filtros TopN
Filtros de medidas
Medidas no numéricas
Uso de "Mostrar valor como"
Medidas filtradas: las medidas filtradas son cálculos de nivel del objeto visual con un filtro específico aplicado (por ejemplo, Total de ventas en Francia) y se usan en algunos de los objetos visuales creados por la característica de conclusiones

Además, los siguientes orígenes de datos y tipos de modelos no se admiten para la característica de información detallada:

DirectQuery
Live connect
Reporting Services local
Inserción

Para más información, vea:

Aplicación de información en Power BI para detectar dónde varían las distribuciones

Uso de información

Detalles de los resultados devueltos

Consideraciones y limitaciones

Contenido relacionado

Recursos adicionales