Azure Data Lake Storage Gen2

Resumen

Elemento Descripción
Estado de la versión Disponibilidad general
Productos Power BI (Modelos semánticos)
Power BI (Flujos de datos)
Fabric (Flujo de datos Gen2)
Power Apps (Flujos de datos)
Dynamics 365 Customer Insights
Analysis Services
Tipos de autenticación admitidos Cuenta de organización
Clave de cuenta
Clave de firma de acceso compartido (SAS)
Entidad de servicio
Documentación de referencia de funciones AzureStorage.DataLake
AzureStorage.DataLakeContents

Nota:

Algunas capacidades pueden estar presentes en un producto, pero otras no, debido a los programas de implementación y las capacidades específicas del host.

Requisitos previos

  • Suscripción a Azure. Vaya a Obtener evaluación gratuita de Azure.

  • Una cuenta de almacenamiento con un espacio de nombres jerárquico. Siga las instrucciones que se proporcionan en Creación de una cuenta de almacenamiento para crear una. En este artículo se da por supuesto que ha creado una cuenta de almacenamiento denominada myadlsg2.

  • Asegúrese de que se le ha concedido uno de los siguientes roles para la cuenta de almacenamiento: lector de datos de Storage Blob, colaborador de datos de Storage Blob o propietario de datos de Storage Blob.

  • Un archivo de datos de ejemplo denominado Drivers.txt ubicado en la cuenta de almacenamiento. Puede descargar este ejemplo desde el repositorio Git de Azure Data Lake y, luego, cargue ese archivo en la cuenta de almacenamiento.

Funcionalidades admitidas

  • Importar
  • Vista del sistema de archivos
  • Vista de carpeta CDM

Conexión a Azure Data Lake Storage Gen2 desde Power Query Desktop

  1. Seleccione Azure Data Lake Storage Gen2 en la experiencia de obtención de datos. La experiencia de obtención de datos en Power Query Desktop varía entre las aplicaciones. Para obtener más información sobre la experiencia de obtención de datos de Power Query Desktop para la aplicación, vaya a Dónde obtener datos.

  2. En el cuadro de diálogo Azure Data Lake Storage Gen2, proporcione la dirección URL de su cuenta, contenedor o subcarpeta de Azure Data Lake Storage Gen2 con el formato de punto de conexión del contenedor. Las direcciones URL de Data Lake Storage Gen2 tienen el siguiente patrón:

    https://<nombreDeCuenta>.dfs.core.windows.net/<contenedor>/<subcarpeta>

    También puede seleccionar si desea utilizar la vista del sistema de archivos o la vista de carpeta CDM (Common Data Model).

    Seleccione OK (Aceptar) para continuar.

    Captura de pantalla del cuadro de diálogo Azure Data Lake Storage Gen2, con la dirección URL especificada.

  3. Si es la primera vez que usa esta dirección URL, se le pedirá que seleccione el método de autenticación.

    Si selecciona el método de cuenta profesional, elija Iniciar sesión para iniciar sesión en la cuenta de almacenamiento. Se le redirigirá a la página de inicio de sesión de su organización. Siga las indicaciones para iniciar sesión en la cuenta. Una vez que haya iniciado sesión correctamente, seleccione Conectar.

    Si selecciona el método de clave de cuenta, escriba la clave de cuenta y seleccione Conectar.

    Captura de pantalla del cuadro de diálogo de inicio de sesión de Azure Data Lake Storage Gen2, con la cuenta profesional seleccionada y lista para iniciar sesión.

  4. El cuadro de diálogo Navegador muestra todos los archivos de la dirección URL proporcionada. Compruebe la información y seleccione Transformar datos para transformar los datos en Power Query o Cargar para cargar los datos.

    Captura de pantalla del navegador abierto y que contiene los datos del archivo Drivers.text.

Conexión a Azure Data Lake Storage Gen2 desde Power Query Online

  1. Seleccione la opción Azure Data Lake Storage Gen2 en la experiencia de obtención de datos. Las distintas aplicaciones tienen diferentes formas de obtener datos en Power Query Online. Para obtener más información sobre cómo acceder a la experiencia de obtención de datos de Power Query Online desde la aplicación, vaya a Dónde obtener datos.

    Captura de pantalla de la ventana Obtener datos con Azure Data Lake Storage Gen2 enfatizado.

  2. En Conectarse a un origen de datos, escriba la dirección URL de la cuenta de Azure Data Lake Storage Gen2. Consulte Limitaciones para determinar la dirección URL que se va a usar.

    Captura de pantalla de la página de Conectar al origen de datos de Azure Data Lake Storage Gen2, con la dirección URL especificada.

  3. Seleccione si desea usar la vista del sistema de archivos o la vista de carpeta Common Data Model.

  4. Si es necesario, seleccione la puerta de enlace de datos local en Puerta de enlace de datos.

  5. Seleccione Iniciar sesión para iniciar sesión en la cuenta de Azure Data Lake Storage Gen2. Se le redirigirá a la página de inicio de sesión de su organización. Siga las indicaciones para iniciar sesión en la cuenta.

  6. Una vez que haya iniciado sesión correctamente, seleccione Siguiente.

  7. La página Elegir datos muestra todos los archivos de la dirección URL proporcionada. Compruebe la información y seleccione Transformar datos para transformar los datos en Power Query.

    Captura de pantalla de la página Elegir datos que contiene los datos del archivo Drivers.text.

Limitaciones

Subcarpeta o archivo no compatible con Power Query Online

Actualmente, en Power Query Online, el conector de Azure Data Lake Storage Gen2 solo admite rutas de acceso con contenedor, no con subcarpetas ni archivos. Por ejemplo, https://<nombreDeCuenta>.dfs.core.windows.net/<contenedor> funcionará, mientras que https://<nombreDeCuenta>.dfs.core.windows.net/<contenedor>/<nombreDeArchivo> o https://<nombreDeCuenta>.dfs.core.windows.net/<contenedor>/<subcarpeta> no funcionarán.

Actualización de autenticación

Microsoft no admite la actualización del flujo de datos o del modelo semántico mediante la autenticación de OAuth2 cuando la cuenta de Azure Data Lake Storage (ADLS) Gen2 está en un inquilino diferente. Esta limitación solo se aplica a ADLS cuando el método de autenticación es OAuth2, es decir, cuando intenta conectarse a una instancia de ADLS entre inquilinos con una cuenta de Microsoft Entra ID. En este caso, se recomienda usar un método de autenticación diferente que no sea OAuth2/Microsoft Entra ID, como el uso de una clave.

Requisitos de proxy y firewall

Cuando crea un flujo de datos con una puerta de enlace, es posible que tenga que cambiar algunos de los puertos del firewall o de los valores de configuración del proxy para poder conectarse al lago de datos de Azure. Si se produce un error en un flujo de datos con una actualización enlazada a la puerta de enlace, puede deberse a un problema de firewall o proxy en la puerta de enlace para los puntos de conexión de Azure Storage.

Si usa un proxy con la puerta de enlace, es posible que tenga que configurar el archivo Microsoft.Mashup.Container.NetFX45.exe.config en la puerta de enlace de datos local. Más información: Configuración de los valores del proxy para la puerta de enlace de datos local.

Para habilitar la conectividad entre su red y Azure Data Lake, es posible que tenga que indicar direcciones IP específicas en la máquina de la puerta de enlace. Por ejemplo, si la red tiene reglas de firewall que podrían bloquear estos intentos, deberá desbloquear las conexiones de red salientes para el lago de datos de Azure. Para indicar las direcciones de salida necesarias, use la etiqueta de servicio AzureDataLake. Más información: Etiquetas de servicio de red virtual.

Los flujos de datos también admiten la opción "Bring Your Own" para lagos de datos, lo que significa que crea su propio lago de datos, administra sus permisos y lo conecta explícitamente a su flujo de datos. En este caso, cuando se conecta al entorno de desarrollo o producción con una cuenta profesional, debe habilitar uno de los siguientes roles para la cuenta de almacenamiento: lector de datos de Storage Blob, colaborador de datos de Storage Blob o propietario de datos de Storage Blob.

Power Query Online y Azure Storage están en la misma región

No se admite el acceso directo a una cuenta de Azure Storage con el firewall habilitado y en la misma región que Power Query Online. Esta limitación surge porque los servicios de Power Query, cuando se implementan en la misma región que la cuenta de almacenamiento de Azure, usan direcciones IP privadas de Azure para la comunicación. Para más información, consulte la documentación de Azure sobre la seguridad de la red de almacenamiento.

Para solucionar esta limitación y habilitar el acceso a Azure Storage desde Power Query Online en la misma región, use uno de los métodos siguientes:

Consulte también