Uso de las herramientas de generación de perfiles de datos

Las herramientas de generación de perfiles de datos proporcionan nuevas e intuitivas formas de limpiar, transformar y comprender los datos en el Editor de Power Query. Incluyen:

  • Calidad de columnas

  • Distribución de columnas

  • Perfil de columna

Para habilitar las herramientas de generación de perfiles de datos, vaya a la pestaña Ver de la cinta de opciones. En Power Query Desktop, habilite las opciones que desee en el grupo Vista previa de datos, como se muestra en la imagen siguiente.

Herramientas de generación de perfiles de datos.

En Power Query Online, seleccione Vista de datos y, a continuación, habilite las opciones que desee en la lista desplegable.

<texto alternativo>

Después de habilitar las opciones, verá algo parecido a la siguiente imagen en el Editor de Power Query.

Herramientas de generación de perfiles de datos habilitadas.

Nota:

De forma predeterminada, Power Query realiza esta generación de perfiles de datos en las primeras 1000 filas de los datos. Para que funcione en todo el conjunto de datos, seleccione el mensaje Generación de perfiles de columna basada en las 1000 primeras filas de la esquina inferior izquierda de la ventana del editor para cambiar la generación de perfiles de columna a Generación de perfiles de columnas en función del conjunto de datos completo.

Calidad de columnas

La característica de calidad de las columnas clasifica los valores de las filas en cinco categorías:

  • Válida, que se muestra en verde.

  • Error, que se muestra en rojo.

  • Vacía, que se muestra en gris oscuro.

  • Desconocida, que se muestra en verde discontinuo. Indica que cuando hay errores en una columna se desconoce la calidad de los datos restantes.

  • Error inesperado, que se muestra en rojo discontinuo.

Estos indicadores se muestran directamente debajo del nombre de la columna como parte de un gráfico de barras pequeño, como se muestra en la siguiente imagen.

Vista mejorada del gráfico de barras con indicadores de calidad de datos y etiquetas encima de cada columna de la tabla.

El número de registros de cada categoría de calidad de las columnas también se muestra como un porcentaje.

Al mantener el puntero sobre cualquiera de las columnas, se le presenta la distribución numérica de la calidad de los valores en toda la columna. Además, al seleccionar el botón de puntos suspensivos (...) se abren algunos botones de acción rápida para las operaciones en los valores.

Distribución de la columna de nombres con 701 nombres válidos (100 por ciento), cero errores y cero vacío, con comandos de acción rápida representados.

Distribución de columnas

Esta característica proporciona un conjunto de objetos visuales debajo de los nombres de las columnas que muestran la frecuencia y distribución de los valores en cada una de las columnas. Los datos de estas visualizaciones se ordenan en orden descendente a partir del valor con la frecuencia más alta.

Distribución de columnas.

Al mantener el puntero sobre los datos de distribución en cualquiera de las columnas, obtendrá información sobre los datos generales de la columna (con un recuento distinto y valores únicos). También puede seleccionar el botón de puntos suspensivos y elegir entre un menú de operaciones disponibles.

Opciones de distribuciones de columnas.

Perfil de columna

Esta característica proporciona una visión más detallada de los datos de una columna. Aparte del gráfico de distribución de columnas, contiene un gráfico de estadísticas de columnas. Esta información se muestra debajo de la sección de vista previa de datos, como se muestra en la imagen siguiente.

Perfil de columna.

Filtrar por valor

Puede interactuar con el gráfico de distribución de valores en el lado derecho y seleccionar cualquiera de las barras si mantiene el puntero sobre las partes del gráfico.

Mantenga el puntero sobre la barra en el gráfico de barras de distribución de valores, que muestra los datos individuales de esa barra.

Haga clic con el botón derecho para mostrar un conjunto de transformaciones disponibles para ese valor.

Muestra el menú de función rápida con tranformaciones disponibles para una sola barra en el gráfico de barras de distribución de valores.

Copia de datos

En la esquina superior derecha de las secciones estadísticas de columna y distribución de valores, puede seleccionar el botón de puntos suspensivos (...) para mostrar el menú contextual Copiar. Selecciónelo para copiar los datos que se muestran en cualquiera de las secciones en el portapapeles.

Copiar las estadísticas de columna.

Agrupar por valor

Al seleccionar el botón de puntos suspensivos (...) en la esquina superior derecha del gráfico de distribución de valores, además de Copiar, puede seleccionar Agrupar por. Esta característica agrupa los valores del gráfico mediante un conjunto de opciones disponibles.

Agrupar por distribución de valor.

En la imagen siguiente se muestra una columna de nombres de producto agrupados por longitud de texto. Una vez agrupados los valores en el gráfico, puede interactuar con valores individuales en el gráfico, tal y como se describe en Filtrar por valor.

Gráfico de barras nuevo que muestra la distribución de la longitud de texto de los nombres de almacén en la columna Nombres de la tabla.