Tutorial: Dar forma a los datos y combinarlos en Power BI Desktop

Con Power BI Desktop, puede conectarse a muchos tipos de orígenes de datos distintos y dar forma a la información para que se ajuste a sus necesidades. De este modo, podrá crear informes visuales y compartirlos con otras personas. Dar forma a los datos significa transformar los datos: cambiar el nombre de las columnas o las tablas, convertir texto en números, quitar filas, configurar la primera fila como encabezado, etc. Combinar datos significa conectarse a dos o más orígenes de datos, darles la forma necesaria y consolidarlos después en una consulta útil.

En este tutorial, aprenderá a:

  • Dar forma a los datos con el Editor de Power Query.
  • Conectarse a diferentes orígenes de datos.
  • Combinar esos orígenes de datos y crear un modelo de datos para usarlo en los informes.

En este tutorial, se explica cómo se forma una consulta utilizando Power BI Desktop y se detallan algunas de las tareas más comunes. La consulta que se usa aquí se describe con más detalle, incluido el procedimiento para crear la consulta desde cero, en Introducción a Power BI Desktop.

El Editor de Power Query en Power BI Desktop hace un amplio uso de los menús contextuales, así como de la cinta de opciones Transformar. La mayor parte de los elementos que se pueden seleccionar en la cinta también están disponibles en el menú contextual que aparece al hacer clic con el botón derecho en un elemento (por ejemplo, en una columna).

Dar forma a los datos

Cuando dé forma a los datos en Editor de Power Query, tiene que proporcionar instrucciones paso a paso para que esta característica pueda ajustar los datos automáticamente a medida que se cargan y se presentan. El origen de datos del que procede la información no se verá afectado. Los únicos datos a los que se va a dar forma o que se van a ajustar son los de esta vista concreta.

El Editor de Power Query registra los pasos especificados (por ejemplo, cambiar el nombre de una tabla, transformar un tipo de datos o eliminar una columna). Cada vez que esta consulta se conecte al origen de datos, el Editor de Power Query llevará a cabo esos pasos para que los datos siempre tengan la forma indicada. Este proceso tendrá lugar siempre que utilice el Editor de Power Query o que otra persona utilice su consulta compartida; por ejemplo, en el servicio Power BI. Estos pasos se capturan, de manera secuencial, en la sección Pasos aplicados del panel Configuración de consulta. Explicaremos cada uno de estos pasos en los párrafos siguientes.

Pasos aplicados en Configuración de la consulta

En Introducción a Power BI Desktop, vamos a utilizar datos sobre la jubilación y a darles forma con arreglo a nuestras necesidades. Estos datos los obtendremos de un origen de datos web al que vamos a conectarnos. Vamos a agregar una columna personalizada para calcular la clasificación en función de todos los datos que son factores iguales y la compararemos con la columna Clasificación existente.

  1. En la cinta Agregar columna, seleccione Columna personalizada, lo que le permitirá agregar una columna personalizada.

    Selección de una columna personalizada

  2. En la ventana Columna personalizada, en Nuevo nombre de columna, escriba Nueva clasificación. En Fórmula de columna personalizada, especifique lo siguiente:

    ([Cost of living] + [Weather] + [Health care quality] + [Crime] + [Tax] + [Culture] + [Senior] + [#"Well-being"]) / 8
    
  3. Compruebe que el mensaje de estado es No se han detectado errores de sintaxis y seleccione Aceptar.

    Página Columna personalizada sin errores de sintaxis

  4. Para mantener la coherencia de los datos de la columna, vamos a transformar los nuevos valores de columna en números enteros. Para ello, solo tiene que hacer clic con el botón derecho en el encabezado de columna y seleccionar Cambiar tipo > Número entero.

    Si necesita seleccionar varias columnas, seleccione una columna, mantenga presionada la tecla MAYÚS, seleccione otras columnas adyacentes y haga clic con el botón derecho en el encabezado de una columna. También puede usar la tecla CTRL para elegir las columnas no adyacentes.

    Selección de Número entero para los datos de la columna

  5. Para transformar el tipo de datos de una columna en otro, seleccione Tipo de datos: Texto en la cinta Transformar.

    Selección de Texto en Tipo de datos

  6. Tenga en cuenta que en Configuración de la consulta, la lista de Pasos aplicados contiene todos los pasos que se han aplicado para dar forma a los datos. Para quitar un paso del proceso, seleccione la X situada a la izquierda del paso correspondiente.

    En la siguiente imagen, la lista de Pasos aplicados contiene los pasos que se han agregado hasta el momento:

    • Origen: conexión con el sitio web.

    • Tabla extraída de HTML: selección de la tabla.

    • Tipo cambiado: modificación de columnas numéricas basadas en texto de Texto a Número entero.

    • Personalizada agregada: incorporación de una columna personalizada.

    • Tipo1 cambiado: último paso aplicado.

      Lista de pasos aplicados

Ajuste de los datos

Antes de poder trabajar con esta consulta, debemos realizar algunos cambios para ajustar los datos:

  • Ajustar las clasificaciones quitando una columna.

    Hemos decidido que Costo de la vida no es un factor importante para nuestros resultados. Después de quitar la columna, descubrimos que los datos permanecen como estaban.

  • Corregir algunos errores.

    Al quitar una columna, es necesario reajustar los cálculos de la columna Nueva clasificación, lo que implica que debemos cambiar una fórmula.

  • Ordenar los datos.

    Ordene los datos con arreglo a las columnas Nueva clasificación y clasificación.

  • Reemplazar los datos.

    Es importante detallar cómo se van a reemplazar determinados valores y la necesidad de insertar un paso aplicado.

  • Cambiar el nombre de la tabla.

    Como Tabla 0 no resulta una descripción útil para la tabla, cambiaremos su nombre.

  1. Para quitar la columna Costo de la vida, seleccione la columna, elija la pestaña Inicio de la cinta y haga clic en Quitar columnas.

    Seleccione Quitar columnas

    Observe que los valores de Nueva clasificación no han cambiado, lo que se debe al orden de los pasos. Como el Editor de Power Query registra los pasos en orden, aunque de modo independiente, puede subir o bajar cada Paso aplicado en la jerarquía.

  2. Haga clic con el botón derecho en un paso. El Editor de Power Query dispone de un menú que le permite realizar las tareas siguientes:

    • Cambiar nombre: permite cambiar el nombre del paso.
    • Eliminar: permite eliminar el paso.
    • Eliminar hasta el final: permite quitar el paso actual y todos los pasos siguientes.
    • Mover antes de: permite subir el paso en la lista.
    • Mover después de: permite bajar el paso en la lista.
  3. Suba el último paso, Columnas quitadas, y colóquelo justo encima del paso Personalizada agregada.

    Subir un paso en Pasos aplicados

  4. Seleccione el paso Personalizada agregada.

    Tenga en cuenta que ahora aparece Error en los datos, por lo que deberemos solucionarlo.

    Resultado de error en los datos de columna

    Hay algunas maneras de obtener más información sobre cada error. Si selecciona la celda sin hacer clic en la palabra Error, el Editor de Power Query mostrará la información del error.

    Información del error en Editor de Power Query

    Si selecciona la palabra Error directamente, el Editor de Power Query crea un Paso aplicado en el panel Configuración de la consulta y muestra información sobre el error.

  5. Como no necesitamos ver información sobre los errores, seleccione Cancelar.

  6. Para corregir los errores, seleccione la columna Nueva clasificación y muestre la fórmula de datos de la columna seleccionando la casilla Barra de fórmulas de la pestaña Ver.

    Seleccione la barra de fórmulas

  7. Quite el parámetro Costo de la vida y reduzca el divisor modificando la fórmula del modo siguiente:

     Table.AddColumn(#"Removed Columns", "New Rank", each ([Weather] + [Health care quality] + [Crime] + [Tax] + [Culture] + [Senior] + [#"Well-being"]) / 7)
    
  8. Seleccione la marca de verificación verde situada a la izquierda del cuadro de fórmula o presione Entrar.

El Editor de Power Query reemplaza los datos por los valores revisados y el paso Personalizada agregada se completa sin errores.

Nota

También puede seleccionar Quitar errores en la cinta o el menú contextual, lo que quitará todas las filas que contienen errores. Sin embargo, en este tutorial no queremos hacer esto, sino que queremos mantener los datos en la tabla.

  1. Ordene los datos con arreglo a la columna Nueva clasificación. En primer lugar, seleccione el último paso aplicado, Tipo cambiado1 para ver los datos más recientes. Después, seleccione la lista desplegable situada junto al encabezado de columna Nueva clasificación y seleccione Orden ascendente.

    Ordene los datos de la columna Nueva clasificación

    Ahora, los datos están ordenados con arreglo a la columna Nueva clasificación. Sin embargo, si mira la columna Clasificación, verá que los datos no se ordenan de manera correcta cuando el valor de Nueva clasificación es igual. Lo corregiremos en el paso siguiente.

  2. Para corregir este problema, seleccione la columna Nueva clasificación y cambie la fórmula de la barra de fórmulas del modo siguiente:

     = Table.Sort(#"Changed Type1",{{"New Rank", Order.Ascending},{"Rank", Order.Ascending}})
    
  3. Seleccione la marca de verificación verde situada a la izquierda del cuadro de fórmula o presione Entrar.

    Ahora, las filas se ordenan con arreglo a las dos columnas: Nueva clasificación y Clasificación. Además, puede seleccionar un paso aplicado en cualquier parte de la lista y seguir dando forma a los datos en ese momento en la secuencia. El Editor de Power Query insertará de forma automática un paso nuevo inmediatamente después del Paso aplicado seleccionado actualmente.

  4. En Paso aplicado, seleccione el paso anterior a la columna personalizada, que es el paso Columnas quitadas. Aquí reemplazaremos el valor de la clasificación El tiempo de Arizona. Haga clic con el botón derecho en la celda que contiene la clasificación El tiempo de Arizona y seleccione Reemplazar valores. Observe cuál es el paso aplicado que está seleccionado actualmente.

    Seleccione Reemplazar valores en la columna

  5. Seleccione Insertar.

    Como vamos a insertar un paso, el Editor de Power Query nos advierte del peligro de hacerlo, ya que los pasos posteriores podrían hacer que la consulta se interrumpiera.

    Comprobación de Insertar paso

  6. Cambie el valor de los datos a 51.

    El Editor de Power Query reemplaza los datos de Arizona. Cuando se crea un Paso aplicado nuevo, el Editor de Power Query le asigna un nombre en función de la acción; en este caso, Valor reemplazado. Si tiene varios pasos con el mismo nombre en la consulta, el Editor de Power Query agrega un número (por orden) a cada Paso aplicado para diferenciarlos entre ellos.

  7. Seleccione el último Paso aplicado y Filas ordenadas.

    Observe que los datos han cambiado con respecto a la nueva clasificación de Arizona. Este cambio se produce porque hemos insertado el paso Valor reemplazado en la ubicación correcta, antes del paso Personalizada agregada.

  8. Por último, queremos cambiar el nombre de esa tabla por uno que sea descriptivo. En el panel Configuración de la consulta, en Propiedades, escriba el nuevo nombre de la tabla y seleccione Entrar. Vamos a llamar a esta tabla EstadísticasJubilación.

    Cambie el nombre de la tabla en Configuración de la consulta

    Cuando empezamos a crear informes, resulta útil emplear nombres de tabla descriptivos, sobre todo cuando vamos a conectarnos a varios orígenes de datos y todos aparecen en el panel Campos de la vista Informe.

    Ahora, hemos dado a los datos la forma que necesitábamos. A continuación, vamos a conectarnos a otro origen de datos y combinar datos.

Combinar datos

Los datos sobre diferentes estados resultan interesantes y serán útiles para crear otras consultas y análisis. Pero hay un problema: la mayoría de los datos usa una abreviatura de dos letras para los códigos de estado, no el nombre completo del estado. Debemos encontrar un modo de asociar las abreviaturas con los nombres de los estados.

Estamos de suerte: hay otro origen de datos públicos que hace justamente eso, pero necesita unos buenos ajustes para que podamos conectarlo a nuestra tabla sobre la jubilación. Para dar forma a los datos, siga estos pasos:

  1. En la cinta de opciones Inicio de Editor de Power Query, seleccione Nuevo origen > Web.

  2. Escriba la dirección del sitio web que contiene las abreviaturas de los estados, https://en.wikipedia.org/wiki/List_of_U.S._state_abbreviations , y seleccione Conectar.

    En Navegador, se muestra el contenido del sitio web.

    Página Navegador

  3. Seleccione Codes and abbreviations (Códigos y abreviaturas).

    Sugerencia

    Llevará algo de tiempo dar forma a los datos de la tabla para reducirlos y que se adapten a lo que queremos. ¿Hay una forma más rápida o fácil de realizar los siguientes pasos? Sí, podríamos crear una relación entre las dos tablas y dar forma a los datos según esa relación. Los siguientes pasos nos ayudarán a aprender a trabajar con tablas. Sin embargo, las relaciones permiten utilizar rápidamente datos de distintas tablas.

Para ajusta los datos, siga estos pasos:

  1. Quite la fila superior. Esta fila es el resultado del modo en que se creó la tabla de la página web, así que no la necesitamos. Desde la cinta de opciones Inicio, seleccione Quitar filas > Quitar filas superiores.

    Seleccione Quitar filas superiores

    Aparece la ventana Quitar las primeras filas, lo cual permite especificar el número de filas que desea quitar.

    Nota

    Si Power BI importa accidentalmente los encabezados de tabla como una fila en la tabla de datos, puede seleccionar Usar la primera fila como encabezado en la pestaña Inicio o desde la pestaña Transformar en la cinta de opciones para corregir la tabla.

  2. Quite las 26 filas inferiores. Estas filas son territorios de EE. UU. y no necesitamos incluirlas. Desde la cinta de opciones Inicio, seleccione Quitar filas > Quitar filas inferiores.

    Seleccione Quitar filas inferiores

  3. Como la tabla EstadísticasJubilación no tiene información sobre Washington D. C., debemos filtrarla en nuestra lista. Seleccione el menú desplegable Estado de región y desactive la casilla situada junto a Distrito federal.

    Desactive la casilla Distrito federal

  4. Quite algunas columnas innecesarias. Como solo necesitamos asignar a cada estado su abreviatura oficial de dos letras, podemos quitar varias columnas. En primer lugar, seleccione una columna, mantenga presionada la tecla CTRL y seleccione las demás columnas que quiera quitar. En la pestaña Inicio de la cinta, seleccione Quitar columnas > Quitar columnas.

    Quitar columna

    Nota

    Es un buen momento para señalar que la secuencia de los pasos aplicados en el Editor de Power Query es importante y puede afectar a la forma en que se ajustan los datos. También es importante tener en cuenta cómo un paso puede afectar a otro paso posterior; si quita un paso de los Pasos aplicados, es posible que los pasos siguientes no tengan el efecto buscado originalmente, debido al impacto de la secuencia de pasos de la consulta.

    Nota

    Al cambiar el tamaño de la ventana del Editor de Power Query para reducir el ancho, algunos elementos de la cinta de opciones se comprimen para optimizar el uso del espacio visible. Al aumentar el ancho de la ventana de Editor de Power Query, se expanden los elementos de la cinta de opciones para hacer el mayor uso posible del área aumentada de esta.

  5. Cambie el nombre de las columnas y la tabla. Hay un par de formas de cambiar el nombre de una columna. En primer lugar, seleccione la columna y, después, puede seleccionar Cambiar nombre en la pestaña Transformar de la cinta de opciones, o bien hacer clic con el botón derecho y seleccionar Cambiar nombre. La siguiente imagen tiene flechas que apuntan a ambas opciones; solo necesitará elegir una.

    Cambio de nombre de una columna en Editor de Power Query

  6. Vamos a llamarlas Nombre de estado y Código de estado. Para cambiar el nombre de la tabla, escriba el nombre en el panel Configuración de la consulta. Llame a esta tabla CódigosEstado.

Combinación de consultas

Ahora que hemos dado a la tabla CódigosEstado la forma que queríamos, vamos a combinar estas dos tablas (o consultas) en una sola. Como las tablas que tenemos ahora son el resultado de las consultas que aplicamos a los datos, a menudo también se les llama consultas.

Hay dos formas principales de combinar las consultas: combinar y anexar.

  • Cuando se tienen una o varias columnas para agregar a otra consulta, se fusionan las consultas.
  • Cuando se tienen filas de datos adicionales que desea agregar a una consulta existente, se anexa la consulta.

En este caso, queremos combinar las consultas. Para ello, siga estos pasos:

  1. En el panel izquierdo de Editor de Power Query, seleccione la consulta en la que quiere combinar la otra consulta. En este caso, será EstadísticasJubilación.

  2. Seleccione Combinar consultas > Combinar consultas en la pestaña Inicio de la cinta de opciones.

    Seleccione Combinar consultas

    Es posible que tenga que establecer los niveles de privacidad para garantizar que los datos se combinan sin que se incluyan o transfieran datos no deseados.

    Aparece la ventana Combinar. Le pedirá que seleccione la tabla que desea combinar con la tabla seleccionada y las columnas correspondientes que se van a utilizar para realizar la combinación.

  3. Seleccione Estado en la tabla EstadísticasJubilación y la consulta CódigosEstado.

    Cuando haya seleccionado las columnas correspondientes apropiadas, se habilitará el botón Aceptar.

    Ventana Combinar

  4. Seleccione Aceptar.

    El Editor de Power Query crea una columna al final de la consulta con el contenido de la tabla (consulta) que se ha combinado con la consulta actual. Todas las columnas de la consulta combinada se comprimen en la columna, pero puede expandir la tabla e incluir las columnas que quiera.

    Columna NewColumn

  5. Para expandir la tabla combinada y seleccionar las columnas que desea incluir, haga clic en el icono de Expandir (icono de Expandir).

    Aparecerá la ventana Expandir.

    NewColumn en una consulta

  6. En este caso, solo vamos a utilizar la columna Código de estado. Seleccione esa columna, desactive Usar el nombre de columna original como prefijo y seleccione Aceptar.

    Si dejáramos activada la casilla Usar el nombre de columna original como prefijo, la columna combinada se llamaría NewColumn.Código de estado.

    Nota

    ¿Le gustaría saber cómo puede incorporar la tabla NewColumn? Puede experimentar un poco y si no le gustan los resultados, elimine ese paso de la lista de Pasos aplicados en el panel Configuración de consulta y la consulta regresará al estado anterior a la aplicación del paso Expandir. Puede realizar esta operación tantas veces como quiera hasta que el proceso de expansión tenga la apariencia deseada.

    Ahora tenemos una sola consulta (tabla) que combina dos orígenes de datos, cada uno de los cuales se ha adaptado para satisfacer nuestras necesidades. Esta consulta puede servir como base de muchas conexiones de datos interesantes, como estadísticas de costos de alojamiento, datos demográficos u oportunidades de trabajo en cualquier estado.

  7. Para aplicar los cambios y cerrar Editor de Power Query, seleccione Cerrar y aplicar en la pestaña Inicio de la cinta de opciones.

    El conjunto de datos aparece en Power BI Desktop, listo para usarse para la creación de informes.

    Seleccione Cerrar y aplicar

Pasos siguientes

Para más información sobre Power BI Desktop y sus funcionalidades, consulte los siguientes recursos: