Análisis de datos en Azure Data Lake Storage Gen2 con Power BI

En este artículo aprenderá a usar Power BI Desktop para analizar y visualizar los datos que están almacenados en una cuenta de almacenan con un espacio de nombres jerárquico (Azure Data Lake Storage Gen2).

Requisitos previos

Antes de comenzar este tutorial, debe cumplir los siguientes requisitos previos:

  • Suscripción a Azure. Consulte Obtención de una versión de evaluación gratuita.
  • Una cuenta de almacenamiento con un espacio de nombres jerárquico. Siga estas instrucciones para crear uno. En este artículo se da por supuesto que ha creado una cuenta de almacenamiento denominada myadlsg2 .
  • Se le concede uno de los roles siguientes para la cuenta de almacenamiento: Lector de datos de blobs, Colaborador de datos de blob o Propietario de datos de blob.
  • Un archivo de datos de ejemplo denominado Drivers.txt ubicado en la cuenta de almacenamiento. Puede descargar este ejemplo desde el repositorio Git de Azure Data Lake y, luego, cargue ese archivo en la cuenta de almacenamiento.
  • Power BI Desktop. Puede descargar este componente desde el Centro de descarga de Microsoft.

Creación de un informe en Power BI Desktop

  1. Inicie Power BI Desktop en el equipo.

  2. En la pestaña Inicio de la cinta de opciones, seleccione Obtener datos y, a continuación, seleccione Más.

  3. En el cuadro de diálogo Obtener datos, seleccione Azure > Azure Data Lake Store Gen2 y, a continuación, seleccione Conectar.

    Página Obtener datos.

  4. En el cuadro de diálogo Azure Data Lake Storage Gen2, puede proporcionar la dirección URL a la cuenta, el sistema de archivos o la subcarpeta de Azure Data Lake Storage Gen2 mediante el formato de punto de conexión del contenedor. Las direcciones URL de Data Lake Storage Gen2 tienen el siguiente patrón:

    https://<accountname>.dfs.core.windows.net/<filesystemname>/<subfolder>

    También puede seleccionar si desea usar la vista del sistema de archivos o la vista Common Data Model carpeta.

    Seleccione OK (Aceptar) para continuar.

    dirección URL.

  5. Si es la primera vez que usa esta dirección URL, se le pedirá que seleccione el método de autenticación.

    Si selecciona el método Cuenta organizativa, seleccione Iniciar sesión para iniciar sesión en la cuenta de almacenamiento. Se le redirigirá a la página de inicio de sesión de su organización. Siga las indicaciones para iniciar sesión en la cuenta. Una vez que haya iniciado sesión correctamente, seleccione Conectar.

    Si selecciona el método Clave de cuenta, escriba la clave de cuenta y, a continuación, seleccione Conectar.

    Página de inicio de sesión.

  6. En el siguiente cuadro de diálogo se muestran todos los archivos en la dirección URL que proporcionó en el paso 4 anterior, incluido el archivo que cargó en la cuenta de almacenamiento. Compruebe la información y, a continuación, seleccione Cargar.

    Sistemas de archivos.

  7. Después de cargar correctamente los datos en Power BI, verá los siguientes campos en la pestaña Campos.

    Pestaña Campos.

    Sin embargo, para visualizar y analizar los datos, es posible que prefiera que los datos estén disponibles mediante los campos siguientes.

    Campos.

    En los pasos siguientes, actualizará la consulta para convertir los datos importados al formato deseado.

  8. En la pestaña Inicio de la cinta de opciones, seleccione Editar consultas.

    Seleccione Editar consultas.

  9. En el Editor de consultas, en la columna Contenido, seleccione Binario. El archivo se detectará automáticamente como archivo .csv y se debería ver una salida como la que se muestra a continuación. Los datos están ahora disponibles en un formato que puede usar para crear visualizaciones.

    Salida.

  10. En la pestaña Inicio de la cinta de opciones, seleccione Cerrar & Aplicar.

    Cerrar y aplicar.

  11. Después de actualizar la consulta, la pestaña Campos mostrará los nuevos campos disponibles para su visualización.

    Nuevos campos.

  12. Ahora puede crear un gráfico circular para representar los controladores de cada ciudad de un país determinado. Para ello, realice las selecciones siguientes.

    En la pestaña Visualizaciones, seleccione el símbolo de un gráfico circular.

    Seleccione el símbolo del gráfico circular en Visualizaciones.

    En este ejemplo, las columnas que va a usar son Columna 4 (nombre de la ciudad) y Columna 7 (nombre del país). Arrastre estas columnas desde la pestaña Campos a la pestaña Visualizaciones como se muestra a continuación.

    Arrastre campos.

    El gráfico circular debe parecerse ahora al que se muestra a continuación.

    Gráfico circular.

  13. Si selecciona un país específico en los filtros de nivel de página, ahora puede ver el número de conductores de cada ciudad del país seleccionado. Por ejemplo, en la pestaña Visualizaciones, en Filtros de nivel de página, seleccione Brasil.

    Filtros de página.

  14. El gráfico circular se actualiza automáticamente para mostrar los conductores de las ciudades de Brasil.

    Brasil.

  15. En el menú Archivo, seleccione Guardar para guardar la visualización como Power BI Desktop archivo.

Publicación del informe en el servicio Power BI

Después de crear las visualizaciones en Power BI Desktop, puede compartirlas con otros usuarios publicándolas en el servicio Power BI. Para obtener instrucciones sobre cómo hacerlo, consulte Publicar desde Power BI Desktop.

Solución de problemas

Actualmente, en Power Query Online, el conector de Azure Data Lake Storage Gen2 solo admite rutas de acceso con contenedor y no con subcarpetas o archivos. Por ejemplo, https:// .dfs.core.windows.net/ funcionará, mientras https:// .dfs.core.windows.net/ o <accountname> <container> https:// <accountname> <container> / <filename> <accountname> .dfs.core.windows.net/ producirá un <container> / <subfolder> error.

Microsoft no admite la actualización del flujo de datos o del conjunto de datos mediante la autenticación de OAuth2 cuando la cuenta de Azure Data Lake Storage Gen 2 (ADLS) está en un inquilino diferente. Esta limitación solo se aplica a ADLS cuando el método de autenticación es OAuth2, es decir, al intentar conectarse a un ADLS entre inquilinos mediante una cuenta Azure AD inquilino. En este caso, se recomienda usar un método de autenticación diferente que no sea OAuth2/AAD, como el método de autenticación de clave.