¿Qué son los flujos de entrada?

Nota

A partir del 2020 de noviembre:

  • Se ha cambiado el nombre de Common Data Service a Microsoft inverso. Más información
  • Se ha actualizado alguna terminología en Microsoft inverso. Por ejemplo, la entidad ahora es tabla y el campo es ahora columna. Más información

Este artículo se actualizará pronto para reflejar la terminología más reciente.

Los flujos de datos son una tecnología de preparación de datos basada en la nube y de autoservicio. Los flujos de datos permiten a los clientes ingerir, transformar y cargar datos en entornos de Microsoft Dataverse, áreas de trabajo de Power BI o en la cuenta de Azure Data Lake Storage su organización. Los flujos de datos se han creado mediante Power Query, una experiencia unificada de preparación y conectividad de datos que ya se ha destacado en muchos productos de Microsoft, incluidos Excel y Power BI. Los clientes pueden desencadenar flujos de datos para que se ejecuten a petición o automáticamente según una programación. los datos siempre se mantienen actualizados.

Los flujos de datos se pueden crear en varios productos de Microsoft

Los flujos de datos se incluyen en varios productos de Microsoft y no requieren que se cree o ejecute una licencia específica del flujo de datos. Los flujos de datos están disponibles en Power Apps, Power BI y Dynamics 365 Customer Insights. La capacidad de crear y ejecutar flujos de datos se incluye con las licencias de esos productos. Las características de flujo de datos son principalmente comunes en todos los productos en los que se incluyen, pero algunas características específicas del producto pueden existir en flujos de datos creados en un producto frente a otro.

¿Cómo funciona el flujo de datos?

Cómo funcionan los flujos de datos.

La imagen anterior muestra una vista general de cómo se define un flujo de datos. Un flujo de datos obtiene datos de diferentes orígenes de datos (ya se admiten más de 80 orígenes de datos). A continuación, en función de las transformaciones configuradas con la Power Query de creación, el flujo de datos transforma los datos mediante el motor de flujo de datos. Por último, los datos se cargan en el destino de salida, que puede ser un entorno de Microsoft Power Platform, un área de trabajo de Power BI o la cuenta de azure data lake Storage de la organización.

Los flujos de datos se ejecutan en la nube

Los flujos de datos se basan en la nube. Cuando se cree y guarde un flujo de datos, su definición se almacena en la nube. Un flujo de datos también se ejecuta en la nube. Sin embargo, si un origen de datos es local, se puede usar una puerta de enlace de datos local para extraer los datos en la nube. Cuando se desencadena una ejecución de flujo de datos, la transformación y el cálculo de datos se produce en la nube y el destino siempre está en la nube.

Los flujos de datos se ejecutan en la nube.

Los flujos de datos usan un motor de transformación eficaz

Power Query es el motor de transformación de datos que se usa en el flujo de datos. Este motor es lo suficientemente capaz de admitir muchas transformaciones avanzadas. También usa una interfaz gráfica de usuario sencilla, pero eficaz, denominada Power Query Editor. Puede usar flujos de datos con este editor para desarrollar sus soluciones de integración de datos de forma más rápida y sencilla.

Power Query transformaciones.

Integración del flujo de datos con Microsoft Power Platform y Dynamics 365

Dado que un flujo de datos almacena las entidades resultantes en el almacenamiento basado en la nube, otros servicios pueden interactuar con los datos generados por los flujos de datos.

Integración del flujo de datos con Microsoft Power Platform y Dynamics 365.

Por ejemplo, las aplicaciones Power BI, Power Apps, Power Automate, Power Virtual Agents y Dynamics 365 pueden obtener los datos generados por el flujo de datos mediante la conexión a Dataverse, un conector de flujo de datos de Power Platform o directamente a través del lago, según el destino configurado en el momento de la creación del flujo de datos.

Ventajas de los flujos de datos

En la lista siguiente se resaltan algunas de las ventajas de usar flujos de datos:

  • Un flujo de datos desacopla la capa de transformación de datos de la capa de modelado y visualización en Power BI solución.

  • El código de transformación de datos puede residir en una ubicación central, un flujo de datos, en lugar de estar distribuido entre varios artefactos.

  • Un creador de flujo de datos solo necesita Power Query habilidades. En un entorno con varios creadores, el creador del flujo de datos puede formar parte de un equipo que, juntos, compila toda la solución de BI o la aplicación operativa.

  • Un flujo de datos es independiente del producto. No es un componente de Power BI solo; puede obtener sus datos en otras herramientas y servicios.

  • Los flujos de datos aprovechan Power Query, una experiencia de transformación de datos eficaz, gráfica y de autoservicio.

  • Los flujos de datos se ejecutan completamente en la nube. No se requiere ninguna infraestructura adicional.

  • Tiene varias opciones para empezar a trabajar con flujos de datos, mediante licencias para Power Apps, Power BI y Customer Insights.

  • Aunque los flujos de datos son capaces de transformaciones avanzadas, están diseñados para escenarios de autoservicio y no requieren ningún fondo de TI o desarrollador.

Escenarios de casos de uso para flujos de datos

Puede usar flujos de datos para muchos fines. Los escenarios siguientes proporcionan algunos ejemplos de casos de uso comunes para flujos de datos.

Migración de datos desde sistemas heredados

En este escenario, una organización ha tomado la decisión de usar Power Apps para la nueva experiencia de interfaz de usuario en lugar del sistema local heredado. Power Apps, Power Automate y AI Builder usan Dataverse como sistema de almacenamiento de datos principal. Los datos actuales del sistema local existente se pueden migrar a Dataverse mediante un flujo de datos y, a continuación, estos productos pueden usar esos datos.

Uso de flujos de datos para crear un almacenamiento de datos

Puede usar flujos de datos como reemplazo de otras herramientas de extracción, transformación y carga (ETL) para crear un almacenamiento de datos. En este escenario, los ingenieros de datos de una empresa deciden usar flujos de datos para crear su almacenamiento de datos diseñado con esquema de estrella, incluidas las tablas de hechos y dimensiones en – Data Lake Storage. A Power BI se usa para generar informes y paneles mediante la obtención de datos de los flujos de datos.

Creación de un almacenamiento de datos mediante flujos de datos.

Uso de flujos de datos para crear un modelo dimensional

Puede usar flujos de datos como reemplazo de otras herramientas ETL para crear un modelo dimensional. Por ejemplo, los ingenieros de datos de una empresa deciden usar flujos de datos para crear el modelo dimensional diseñado con esquema de estrella, incluidas las tablas de hechos y dimensiones en Azure Data Lake Storage Gen2. A Power BI se usa para generar informes y paneles mediante la obtención de datos de los flujos de datos.

Creación de un modelo dimensional mediante flujos de datos.

Centralización de la preparación y reutilización de datos en varias soluciones Power BI datos

Si varias Power BI están usando la misma versión transformada de una tabla, el proceso para crear la tabla se repetirá varias veces. Esto aumenta la carga en el sistema de origen, consume más recursos y crea datos duplicados con varios puntos de error. En su lugar, se puede crear un flujo de datos único para calcular los datos de todas las soluciones. Power BI puede reutilizar el resultado de la transformación en todas las soluciones. El flujo de datos, si se usa de este modo, puede formar parte de una sólida arquitectura de implementación de Power BI que evita que el código Power Query se duplique y reduzca los costos de mantenimiento de la capa de integración de datos.

Volver a usar tablas en varias soluciones.

Pasos siguientes

En los artículos siguientes se proporcionan más materiales de estudio para flujos de datos.