Flujos de datos

Completado

Los flujos de datos son servicios de extracción, transformación y carga (ETL) basados en la nube que ayudan a ingerir datos de varios orígenes y luego convertirlos en un formato listo para el análisis. Power BI puede usar flujos de datos para procesar e ingerir grandes volúmenes de datos.

Diagrama que muestra el proceso de flujo de datos en los paneles

Los flujos de datos están diseñados para admitir los siguientes escenarios:

  • Crear una lógica de transformación reutilizable que pueda ser compartida por muchos conjuntos de datos e informes en Power BI. Los flujos de datos promueven la reutilización de los elementos de datos subyacentes, evitando la necesidad de crear conexiones independientes con su nube u orígenes de datos locales.
  • Exponer los datos en su propio almacenamiento de Azure Data Lake Gen 2, lo que le permite conectar otros servicios de Azure a los datos subyacentes sin procesar.
  • Crear una origen único de la verdad obligando a los analistas a conectarse a los flujos de datos en lugar de conectarse a los sistemas subyacentes. Eso le permite controlar a qué datos se accede y cómo se exponen los datos a los creadores de informes. También puede asignar los datos a definiciones estándar del sector, lo que le permite crear vistas ordenadas, que pueden funcionar con otros servicios y productos en Microsoft Power Platform.
  • Si desea trabajar con grandes volúmenes de datos y realizar ETL a escala, los flujos de datos con Power BI Premium se escalan de manera más eficiente y le brindan más flexibilidad. Los flujos de datos admiten una amplia gama de orígenes locales y en la nube.
  • Evitar que los analistas tengan acceso directo al origen de datos subyacente. Debido a que los creadores de informes pueden construir sobre flujos de datos, podría ser más conveniente para usted permitir el acceso a los orígenes de datos subyacentes solo a unas pocas personas y luego proporcionar acceso a los flujos de datos para que los analistas construyan sobre ellos. Este enfoque reduce la carga de los sistemas subyacentes y brinda a los administradores un control más preciso de cuándo se cargan los sistemas desde las actualizaciones.

Los flujos de datos pueden transformar datos mediante Power Query y enriquecerlos mediante Microsoft Azure Cognitive Services y Azure Machine Learning, como se muestra en el siguiente diagrama.

Diagrama que muestra las capacidades de flujo de datos

Una vez que crea un flujo de datos, puede usar Power BI Desktop y el servicio Power BI para crear estos elementos que utilizan Common Data Model para generar información detallada sobre sus datos empresariales:

  • Conjuntos de datos
  • Informes
  • Paneles de información
  • Aplicaciones

Los datos que se exportan de Dataverse a Azure Data Lake Storage se pueden importar a Power BI mediante el uso de flujos de datos.

Conjunto de datos y flujo de datos

Los flujos de datos son opcionales, pero los conjuntos de datos no lo son. No puede utilizar un flujo de datos directamente; el flujo de datos llena el conjunto de datos.

Si no usa un flujo de datos y solo usa conjuntos de datos, la preparación del conjunto de datos se realiza repetidamente en cada conjunto de datos. Con los flujos de datos, el flujo de datos realiza la preparación de los datos una vez y, luego, cada conjunto de datos usa la preparación preestablecida. Los flujos de datos también pueden tener entidades calculadas, que son la información necesaria para un informe.

Siempre utiliza conjuntos de datos, pero puede optar por utilizar un flujo de datos si le resulta útil.

El servicio Azure Synapse Link permite la replicación continua de datos de tablas de Dataverse a una cuenta Azure Data Lake Storage Gen 2 o a un espacio de trabajo de Azure Synapse. A continuación, puede usarlo para ejecutar análisis como la elaboración de informes de Power BI, Microsoft Azure Machine Learning, almacenamiento de datos y otros escenarios de integración.

Captura de pantalla de la exportación a Data Lake

Azure Synapse Link simplifica la complejidad técnica y administrativa de exportar tablas para análisis. Con tan solo unas cuantas selecciones sencillas, los clientes pueden vincular su entorno de Dataverse a un lago de datos en su suscripción de Azure, y luego seleccionar tablas y exportarlas a Azure Data Lake Storage. Todos los cambios realizados en datos y metadatos (delta inicial e incremental) de Dataverse se envían automáticamente a Azure Data Lake Gen 2 sin más acciones.

Los datos se almacenan en formato Common Data Model, que puede utilizar Power BI y otros servicios de análisis de Azure.

BI empresarial

BI empresarial, donde los datos se extraen para su uso en herramientas de informes empresariales más amplias, tiene muchos beneficios:

  • Reduce la carga en los almacenes de datos operativos
  • Permite la transformación y el análisis histórico.
  • Permite su uso con herramientas de informes de otros orígenes.

El siguiente diagrama muestra el uso de Azure Synapse Link para extraer datos de Dataverse y llenar un espacio de trabajo que herramientas de informes como Power BI pueden usar.

El diagrama muestra Azure Synapse Link copiando datos al almacenamiento ADLS Gen2 y Power BI conectándose a Azure Synapse Analytics.

Para obtener más información, consulte Guía de modelado de Power BI para Power Platform.