Configurar y consumir un flujo de datos

Con los flujos de datos, puede unificar los datos de varios orígenes y preparar los datos unificados para el modelado. Cada vez que crea un flujo de datos, se le solicita que actualice los datos para el flujo de datos. Es necesario actualizar un flujo de datos para que se pueda consumir en un conjunto de datos en Power BI Desktop, o bien para que se pueda hacer referencia a él como una tabla vinculada o calculada.

Nota:

Los flujos de datos en el servicio Power BI podrían no estar disponibles para todos los clientes DoD del gobierno de Estados Unidos. Para obtener más información sobre qué características están disponibles y cuáles no, consulte Disponibilidad de características de Power BI para los clientes de la Administración Pública de Estados Unidos.

Configuración de un flujo de datos

Para configurar la actualización de un flujo de datos, seleccione el menú Más opciones (los puntos suspensivos) y elija Configuración.

Captura de pantalla de la configuración desplegable de un flujo de datos de Power BI.

Las opciones de Configuración ofrecen diversas alternativas para el flujo de datos, como se describe en las secciones siguientes.

Captura de pantalla de la página Configuración de un flujo de datos después de seleccionar Configuración en la lista desplegable del flujo de datos.

  • Tomar posesión: si usted no es el propietario del flujo de datos, muchas de estas opciones estarán deshabilitadas. Para tomar posesión del flujo de datos, seleccione Tomar control para encargarse de controlarlo. Se le pedirá que proporcione credenciales para asegurarse de que cuenta con el nivel de acceso necesario.

  • Conexión de puerta de enlace: en esta sección, puede elegir si el flujo de datos usa una puerta de enlace y seleccionar qué puerta de enlace se usa. Si has especificado la puerta de enlace como parte del flujo de datos de edición, al tomar posesión, es posible que tengas que actualizar las credenciales mediante la opción editar flujo de datos.

  • Credenciales del origen de datos: en esta sección, se eligen las credenciales que se usan y se puede cambiar la forma de autenticarse en el origen de datos.

  • Etiqueta de confidencialidad: aquí puede definir la confidencialidad de los datos del flujo de datos. Para obtener más información sobre las etiquetas de confidencialidad, vea Aplicación de etiquetas de confidencialidad en Power BI.

  • Actualización programada: aquí puede definir a qué horas del día se actualiza el flujo de datos seleccionado. Un flujo de datos se puede actualizar con la misma frecuencia que un modelo semántico.

  • Configuración mejorada del motor de proceso: aquí puede definir si el flujo de datos se almacena en el motor de proceso. El motor de proceso permite que los flujos de datos posteriores, que hacen referencia a este flujo de datos, realicen fusiones, combinaciones y otras transformaciones más rápido. También permite el uso de DirectQuery en el flujo de datos. Al seleccionar Activar, se garantiza que el flujo de datos se admita siempre en el modo DirectQuery, de modo que todas las referencias se benefician del motor. Al seleccionar Optimizado, el motor solo se usa si hay una referencia a este flujo de datos. Al seleccionar Desactivar, se deshabilita el motor de proceso y la función DirectQuery para este flujo de datos.

  • Aprobación: puede definir si el flujo de datos está certificado o promovido.

Nota

Los usuarios con una licencia Pro o Premium por usuario (PPU) pueden crear un flujo de datos en un área de trabajo Premium.

Precaución

Si se elimina un área de trabajo que contiene flujos de datos, también se eliminan todos los flujos de datos de esa área de trabajo. Incluso si es posible la recuperación del área de trabajo, no puede recuperar flujos de datos eliminados, ya sea directamente o a través del soporte técnico de Microsoft.

Actualización de un flujo de datos

Los flujos de datos actúan como bloques de creación que se colocan unos sobre otros. Supongamos que tiene un flujo de datos denominado Datos sin procesar y una tabla vinculada denominada Datos transformados que contiene una tabla vinculada a Datos sin procesar. Cuando se desencadena la actualización programada para el flujo llamado Datos sin procesar, se desencadenan todos los flujos de datos que hacen referencia a este una vez finalizada. Esta funcionalidad crea un efecto en cadena de actualizaciones, lo que le evita tener que programar flujos de datos manualmente. Hay algunos matices que deben tenerse en cuenta cuando se trabaja con actualizaciones de tablas vinculadas:

  • Una actualización desencadenará una tabla vinculada solo si existe en la misma área de trabajo.

  • Si se actualiza una tabla de origen o se cancela la actualización de la tabla de origen, no se podrá editar una tabla vinculada. Si alguno de los flujos de datos de una cadena de referencia no puede actualizarse, todos los flujos de datos se revertirán a los datos antiguos (las actualizaciones de flujos de datos son transaccionales dentro de un área de trabajo).

  • Únicamente se actualizan las tablas a las que se hace referencia cuando se desencadenan como consecuencia de la finalización de una actualización de origen. Para programar todas las tablas, debe establecer también una actualización programada en la tabla vinculada. Evite establecer una programación de la actualización en los flujos de datos vinculados para evitar una actualización doble.

Cancelar actualización Flujos de datos admiten la capacidad de cancelar una actualización, a diferencia de los modelos semánticos. Si una actualización se ejecuta durante mucho tiempo, puede seleccionar Más opciones (puntos suspensivos junto al flujo de datos) y, luego, elegir Cancelar actualización.

Actualización incremental (solo Premium): los flujos de datos también se pueden establecer para que se actualicen de manera incremental. Para ello, seleccione el flujo de datos que quiere configurar para la actualización incremental y, después, haga clic en el icono Actualización incremental.

Captura de pantalla en la que se resalta la acción de actualización incremental de una tabla.

Al establecer la actualización incremental, se agregan parámetros al flujo de datos para especificar el intervalo de fechas. Para obtener información detallada sobre cómo configurar la actualización incremental, consulte Uso de actualización incremental con flujos de datos.

Hay algunas circunstancias en las que no se debe establecer la actualización incremental:

  • Las tablas vinculadas no deben usar la actualización incremental si hacen referencia a un flujo de datos. Los flujos de datos no admiten el plegado de consultas (incluso si la tabla está habilitada para DirectQuery).

  • Los modelos semánticos que hacen referencia a flujos de datos no deben usar la actualización incremental. Las actualizaciones de los flujos de datos suelen optimizar el rendimiento, por lo que las actualizaciones incrementales no deberían ser necesarias. Si las actualizaciones tardan demasiado, considere la posibilidad de usar el motor de proceso o el modo DirectQuery.

Consumo de un flujo de datos

Un flujo de datos se puede consumir de las tres maneras siguientes:

  • Crear una tabla vinculada desde el flujo de datos para permitir que otro autor de flujo de datos use los datos.

  • Cree un modelo semántico desde el flujo de datos para permitir que un usuario emplee los datos para crear informes.

  • Crear una conexión desde herramientas externas que pueden leer el formato CDM (Common Data Model).

Consumo desde Power BI Desktop: para consumir un flujo de datos, abra Power BI Desktop y seleccione flujos de datos en el cuadro de diálogo Obtener datos.

Nota:

El conector de flujos de datos usa un conjunto de credenciales diferentes a las del usuario que ha iniciado sesión actualmente. Esto es así por diseño, para admitir usuarios de varios inquilinos.

Captura de pantalla de Power BI Desktop en la que se resalta la opción flujos de datos en la lista desplegable Obtener datos.

Seleccione el flujo de datos y las tablas a las que quiere conectarse.

Nota

Puede conectarse a cualquier flujo de datos o tabla, independientemente del área de trabajo en la que resida y de si se definió en un área de trabajo Premium o no Premium.

Captura de pantalla del navegador en Power BI Desktop para elegir flujos de datos a los que conectarse.

Si DirectQuery está disponible, se le pedirá que elija si quiere conectarse a las tablas mediante DirectQuery o Importar.

En el modo DirectQuery, puede interrogar rápidamente modelos semánticos a gran escala de forma local. Sin embargo, no se pueden realizar más transformaciones.

El uso de Import incluye los datos en Power BI y requiere que el modelo semántico se actualice independientemente del flujo de datos.

En los artículos siguientes encontrará más información sobre los flujos de datos y Power BI: