Análisis de datos en Azure Data Lake Storage Gen2 con Power BI

En este artículo aprenderá a usar Power BI Desktop para analizar y visualizar los datos que están almacenados en una cuenta de almacenan con un espacio de nombres jerárquico (Azure Data Lake Storage Gen2).

Requisitos previos

Antes de comenzar este tutorial, debe cumplir los siguientes requisitos previos:

  • Suscripción a Azure. Consulte Obtención de una versión de evaluación gratuita.
  • Una cuenta de almacenamiento con un espacio de nombres jerárquico. Siga estas instrucciones para crear uno. En este artículo se da por supuesto que ha creado una cuenta de almacenamiento denominada myadlsg2 .
  • Se le concede uno de los roles siguientes para la cuenta de almacenamiento: Lector de datos de blobs, Colaborador de datos de blob o Propietario de datos de blob.
  • Un archivo de datos de ejemplo denominado Drivers.txt ubicado en la cuenta de almacenamiento. Puede descargar este ejemplo desde el repositorio Git de Azure Data Lake y, luego, cargue ese archivo en la cuenta de almacenamiento.
  • Power BI Desktop. Puede descargar este componente desde el Centro de descarga de Microsoft.

Creación de un informe en Power BI Desktop

  1. Inicie Power BI Desktop en el equipo.

  2. En la pestaña Inicio de la cinta de opciones, seleccione Obtener datos y, a continuación, seleccione Más.

  3. En el cuadro de diálogo Obtener datos, seleccione Azure > Azure Data Lake Store Gen2 y, a continuación, seleccione Conectar.

    Página Obtener datos

  4. En el Azure Data Lake Storage Gen2 de diálogo, puede proporcionar la dirección URL a la cuenta de Azure Data Lake Storage Gen2, el sistema de archivos o la subcarpeta mediante el formato de punto de conexión del contenedor. Las direcciones URL Data Lake Storage Gen2 tienen el siguiente patrón:

    https://<accountname>.dfs.core.windows.net/<filesystemname>/<subfolder>

    También puede seleccionar si desea usar la vista del sistema de archivos o la vista Common Data Model carpeta.

    Seleccione OK (Aceptar) para continuar.

    URL

  5. Si es la primera vez que usa esta dirección URL, se le pedirá que seleccione el método de autenticación.

    Si selecciona el método Cuenta organizativa, seleccione Iniciar sesión para iniciar sesión en la cuenta de almacenamiento. Se le redirigirá a la página de inicio de sesión de su organización. Siga las indicaciones para iniciar sesión en la cuenta. Una vez que haya iniciado sesión correctamente, seleccione Conectar.

    Si selecciona el método Clave de cuenta, escriba la clave de cuenta y, a continuación, seleccione Conectar.

    Página de inicio de sesión

  6. En el siguiente cuadro de diálogo se muestran todos los archivos en la dirección URL que proporcionó en el paso 4 anterior, incluido el archivo que cargó en la cuenta de almacenamiento. Compruebe la información y, a continuación, seleccione Cargar.

    Sistemas de archivos

  7. Después de cargar correctamente los datos en Power BI, verá los siguientes campos en la pestaña Campos.

    Pestaña Campos

    Sin embargo, para visualizar y analizar los datos, es posible que prefiera que los datos estén disponibles mediante los campos siguientes.

    Campos

    En los pasos siguientes, actualizará la consulta para convertir los datos importados al formato deseado.

  8. En la pestaña Inicio de la cinta de opciones, seleccione Editar consultas.

    Selección de editar consultas

  9. En el Editor de consultas, en la columna Contenido, seleccione Binario. El archivo se detectará automáticamente como archivo .csv y se debería ver una salida como la que se muestra a continuación. Los datos están ahora disponibles en un formato que puede usar para crear visualizaciones.

    Resultados

  10. En la pestaña Inicio de la cinta de opciones, seleccione Cerrar & Aplicar.

    Cerrar y aplicar

  11. Después de actualizar la consulta, la pestaña Campos mostrará los nuevos campos disponibles para su visualización.

    Nuevos campos

  12. Ahora puede crear un gráfico circular para representar los controladores de cada ciudad de un país determinado. Para ello, realice las selecciones siguientes.

    En la pestaña Visualizaciones, seleccione el símbolo de un gráfico circular.

    Selección del símbolo del gráfico circular en Visualizaciones

    En este ejemplo, las columnas que va a usar son Columna 4 (nombre de la ciudad) y Columna 7 (nombre del país). Arrastre estas columnas desde la pestaña Campos hasta la pestaña Visualizaciones, como se muestra a continuación.

    Arrastrar campos

    El gráfico circular debe parecerse ahora al que se muestra a continuación.

    Gráfico circular

  13. Si selecciona un país específico en los filtros de nivel de página, ahora puede ver el número de conductores de cada ciudad del país seleccionado. Por ejemplo, en la pestaña Visualizaciones, en Filtros de nivel de página, seleccione Brasil.

    Filtros de página

  14. El gráfico circular se actualiza automáticamente para mostrar los conductores de las ciudades de Brasil.

    Brasil

  15. En el menú Archivo, seleccione Guardar para guardar la visualización como Power BI Desktop archivo.

Publicación del informe en el servicio Power BI

Después de crear las visualizaciones en Power BI Desktop, puede compartirlas con otros usuarios publicándolas en el servicio Power BI. Para obtener instrucciones sobre cómo hacerlo, consulte Publicar desde Power BI Desktop.

Solucionar problemas

Actualmente, en Power Query Online, el conector Azure Data Lake Storage Gen2 solo admite rutas de acceso con contenedor, no subcarpetas ni archivos.

https:// .dfs.core.windows.net/ funcionará, mientras que https:// .dfs.core.windows.net/ o <accountname> <container> https:// <accountname> <container> / <filename> <accountname> .dfs.core.windows.net/ producirá un <container> / <subfolder> error.