Conexión a Azure Data Lake Storage Gen2 para el almacenamiento del flujo de datos

Puede configurar flujos de datos para almacenar sus datos en la cuenta de Azure Data Lake Storage Gen2 de su organización. En este artículo se describen los pasos generales necesarios para hacerlo y se proporcionan además instrucciones y procedimientos recomendados.

Importante

La característica Flujo de datos con tablas analíticas usa Azure Synapse Link para el servicio Dataverse, que puede ofrecer distintos niveles de cumplimiento, privacidad, seguridad y compromisos de ubicación de datos. Para obtener más información sobre Azure Synapse Link para Dataverse, vaya al artículo de blog.

Hay algunas ventajas de configurar flujos de datos para almacenar sus definiciones y archivos de datos en el lago de datos, como:

  • Azure Data Lake Storage Gen2 proporciona una instalación de almacenamiento enormemente escalable para los datos.
  • Los desarrolladores del departamento de TI pueden aprovechar los archivos de definición y datos de flujo de datos para aprovechar los servicios de datos e inteligencia artificial (AI) de Azure, como se muestra en los ejemplos de GitHub de los servicios de datos de Azure.
  • Permite a los desarrolladores de su organización integrar datos de flujo de datos en aplicaciones internas y soluciones de línea de negocio, mediante recursos de desarrollador para flujos de datos y Azure.

Requisitos

Para usar Azure Data Lake Storage Gen2 para los flujos de datos, necesita lo siguiente:

  • Un Power Apps de datos. Cualquier Power Apps plan le permitirá crear flujos de datos con Azure Data Lake Storage Gen2 como destino. Tendrá que estar autorizado en el entorno como creador.
  • Suscripción a Azure. Necesita una suscripción de Azure para usar Azure Data Lake Storage Gen2.
  • Un grupo de recursos. Use un grupo de recursos que ya tenga o cree uno nuevo.
  • Una cuenta de almacenamiento de Azure. La cuenta de almacenamiento debe tener habilitada la característica Data Lake Storage Gen2.

Sugerencia

Si no tiene una suscripción a Azure, cree una cuenta de evaluación gratuita antes de empezar.

Preparación de Azure Data Lake Storage Gen2 para flujos Power Platform datos

Antes de configurar el entorno con una cuenta de Azure Data Lake Storage Gen2, debe crear y configurar una cuenta de almacenamiento. Estos son los requisitos para Power Platform flujos de datos:

  1. La cuenta de almacenamiento debe crearse en el mismo inquilino Azure Active Directory que el Power Apps de almacenamiento.
  2. Se recomienda que la cuenta de almacenamiento se cree en la misma región que el Power Apps en el que planea usarla. Para determinar dónde se encuentra Power Apps entorno, póngase en contacto con el administrador del entorno.
  3. La cuenta de almacenamiento debe tener habilitada la característica Espacio de nombres jerárquico.
  4. Se le debe conceder un rol de propietario en la cuenta de almacenamiento.

Las secciones siguientes le indican los pasos necesarios para configurar la cuenta de Azure Data Lake Storage Gen2.

Creación de la cuenta de almacenamiento

Siga los pasos descritos en Creación de una cuenta de almacenamiento de Azure Data Lake Storage Gen2.

  1. Asegúrese de seleccionar la misma región que el entorno y establezca el almacenamiento como StorageV2 (uso general v2).
  2. Asegúrese de habilitar la característica de espacio de nombres jerárquico.
  3. Se recomienda establecer la configuración de replicación en Almacenamiento con redundancia geográfica con acceso de lectura (RA-GRS).

Conectar Azure Data Lake Storage Gen2 a Power Apps

Una vez que haya configurado la cuenta de Azure Data Lake Storage Gen2 en el Azure Portal, estará listo para conectarla a un flujo de datos específico o a un entorno Power Apps. La conexión del lago a un entorno permite a otros creadores y administradores del entorno crear flujos de datos que almacenen también sus datos en el lago de la organización.

Para conectar la cuenta de Azure Data Lake Storage Gen2 con el flujo de datos, siga estos pasos:

  1. Inicie sesión en Power Appsy compruebe en qué entorno se encuentra. El conmutador de entorno se encuentra en el lado derecho del encabezado.

  2. En el panel de navegación izquierdo, seleccione la flecha abajo situada junto a Datos.

    Power Apps de datos del portal del creador.

  3. En la lista que aparece, seleccione Flujos de datos y, a continuación, en la barra de comandos, seleccione Nuevo flujo de datos.

    Cree un nuevo flujo de datos.

  4. Seleccione las tablas analíticas que desee. Estas tablas indican qué datos desea almacenar en la cuenta de Azure Data Lake Store Gen2 de su organización.

    Seleccione tablas analíticas.

Selección de la cuenta de almacenamiento que se usará para el almacenamiento de flujo de datos

Si aún no se ha asociado una cuenta de almacenamiento con el entorno, aparece un cuadro de diálogo Vincular al lago de datos. Deberá iniciar sesión y encontrar el lago de datos que creó en los pasos anteriores. En este ejemplo, no hay ningún lago de datos asociado al entorno y, por tanto, se produce un aviso para agregar uno.

  1. Seleccione cuenta de almacenamiento.

    Aparecerá la pantalla Seleccionar Storage cuenta.

    Seleccione cuenta de almacenamiento.

  2. Seleccione el identificador de suscripción de la cuenta de almacenamiento.

  3. Seleccione el nombre del grupo de recursos en el que se creó la cuenta de almacenamiento.

  4. Escriba el nombre de la cuenta de almacenamiento.

  5. Seleccione Guardar.

Una vez que estos pasos se completan correctamente, la cuenta de Azure Data Lake Storage Gen2 se conecta a Power Platform Dataflows y puede continuar con la creación de un flujo de datos.

Consideraciones y limitaciones

Hay algunas consideraciones y limitaciones que se deben tener en cuenta al trabajar con el almacenamiento de flujo de datos:

  • La vinculación de una cuenta de Azure Data Lake Store Gen2 para el almacenamiento de flujo de datos no se admite en el entorno predeterminado.
  • Una vez configurada una ubicación de almacenamiento de flujo de datos para un flujo de datos, no se puede cambiar.
  • De forma predeterminada, cualquier miembro del entorno puede acceder a los datos del flujo de datos mediante el Power Platform dataflows Connector. Sin embargo, solo los propietarios de un flujo de datos pueden acceder a sus archivos directamente en Azure Data Lake Storage Gen2. Para autorizar a más personas a acceder a los datos de flujos de datos directamente en el lago, debe autorizarlos a la carpeta cdm del flujo de datos en el lago de datos o en el propio lago de datos.
  • Cuando se elimina un flujo de datos, también se eliminará su carpeta cdm en el lago.

Importante

No debe cambiar los archivos creados por flujos de datos en el lago de la organización ni agregar archivos a la carpeta CDM de un flujo de datos. El cambio de archivos puede dañar los flujos de datos o modificar su comportamiento y no se admite. Power Platform Dataflows solo concede acceso de lectura a los archivos que crea en el lago. Si autoriza a otras personas o servicios al sistema de archivos utilizado por Power Platform Dataflows, concédales acceso de lectura solo a los archivos o carpetas de ese sistema de archivos.

Aviso de privacidad

Al habilitar la creación de flujos de datos con tablas analíticas en su organización, a través del servicio Azure Synapse Link for Dataverse, los detalles sobre la cuenta de almacenamiento de Azure Data Lake, como el nombre de la cuenta de almacenamiento, se enviarán y almacenarán en el servicio Azure Synapse Link for Dataverse, que se encuentra actualmente fuera del límite de cumplimiento de PowerApps y puede emplear medidas de privacidad y seguridad menores o diferentes que las que normalmente se usan en PowerApps. Tenga en cuenta que puede quitar la asociación de Data Lake en cualquier momento para dejar de usar esta funcionalidad y los detalles de la cuenta de Almacenamiento de Azure Data Lake se quitarán del servicio Azure Synapse Link for Dataverse. Puede encontrar más información Azure Synapse Link for Dataverse en este artículo.

Preguntas más frecuentes

¿Qué ocurre si previamente hubiera creado flujos de datos en Azure Data Lake Storage Gen2 de mi organización y quisiera cambiar su ubicación de almacenamiento?

No se puede cambiar la ubicación de almacenamiento de un flujo de datos después de crearlo.

¿Cuándo puedo cambiar la ubicación de almacenamiento del flujo de datos de un entorno?

Actualmente no se admite el cambio de la ubicación de almacenamiento del flujo de datos del entorno.

Pasos siguientes

En este artículo se proporcionan instrucciones sobre cómo conectar una cuenta de Azure Data Lake Storage Gen2 para el almacenamiento de flujos de datos.

Para obtener más información sobre los flujos de datos, Common Data Model y Azure Data Lake Storage Gen2, vaya a estos artículos:

Para más información sobre Azure Storage, vaya a este artículo:

Para obtener más información sobre la Common Data Model, vaya a estos artículos:

Puede hacer preguntas en el Power Apps Community.