Preparación de datos de autoservicio en Power BI (versión preliminar)Self-service data prep in Power BI (Preview)

A medida que aumenta el volumen de datos, también se complica el desafío de limpiar y transformar dichos datos en información accionable y con un formato correcto.As data volume continues to grow, so does the challenge of wrangling that data into well-formed, actionable information. Queremos datos que estén listos para análisis, para rellenar objetos viduales, informes y paneles, a fin de que podamos convertir los volúmenes de datos rápidamente en información procesable.We want data that’s ready for analytics, to populate visuals, reports, and dashboards, so we can quickly turn our volumes of data into actionable insights. Con la preparación de datos de autoservicio para macrodatos en Power BI, puede convertir los datos en información de Power BI con tan solo unos clics.With self-service data prep for big data in Power BI, you can go from data to Power BI insights with just a few clicks.

Uso de flujos de datos en Power BI

Power BI presenta los flujos de datos para ayudar a las organizaciones a unificar datos desde fuentes diversas y a prepararlos para el modelado.Power BI introduces dataflows to help organizations unify data from disparate sources and prepare it for modeling. Los analistas pueden crear flujos de datos con facilidad, con el uso de herramientas familiares de autoservicio.Analysts can easily create dataflows, using familiar, self-service tools. Los flujos de datos se usan para ingerir, transformar, integrar y enriquecer macrodatos con la definición de conexiones de orígenes de datos, lógica de ETL, programas de actualizaciones y mucho más.Dataflows are used to ingest, transform, integrate, and enrich big data by defining data source connections, ETL logic, refresh schedules, and more. Además, el nuevo motor de cálculo basado en modelos que forma parte de los flujos de datos facilita la administración del proceso de preparación de datos, porque resulta más determinista y menos engorroso para los analistas de datos y los creadores de informes.In addition, the new model-driven calculation engine that's part of dataflows makes the process of data preparation more manageable, more deterministic, and less cumbersome for data analysts and report creators alike. De forma similar a como las hojas de cálculo administran los recálculos de todas las fórmulas afectadas, los flujos de datos administran los cambios de una entidad o de un elemento de datos en nombre del usuario, automatizando las actualizaciones y aliviando lo que solían ser comprobaciones lógicas tediosas que consumían mucho tiempo incluso para una actualización de datos básica.Similar to how spreadsheets handle recalculations for all affected formulas, dataflows manage changes for an entity or data element on your behalf, automating updates, and alleviating what used to be tedious and time consuming logic checks for even a basic data refresh. Con los flujos de datos, las tareas que requerían el control de los científicos de datos y también muchas horas y días para completarse, ahora los analistas y los creadores de informes pueden administrarlas con tan solo unos clics.With dataflows, tasks that once required data scientists to oversee (and many hours or days to complete) can now be handled with a few clicks by analysts and report creators.

Los datos se almacenan como entidades en Common Data Service en Azure Data Lake Storage Gen2.Data is stored as entities in the Common Data Model in Azure Data Lake Storage Gen2. Los flujos de datos se crean y administran en las áreas de trabajo de la aplicación mediante el servicio Power BI.Dataflows are created and managed in app workspaces by using the Power BI service.

Nota

La funcionalidad de flujos de datos se encuentra en versión preliminar y está sujeta a cambios y actualizaciones antes de la disponibilidad general.The dataflows functionality is in preview, and is subject to change and updates prior to general availability.

Los flujos de datosse han diseñado para usarCommon Data Service, una colección estandarizada, modular y extensible de esquemas de datos publicados por Microsoft que están diseñados para facilitarle la compilación, el uso y el análisis de datos.Dataflows are designed to use the Common Data Model, a standardized, modular, extensible collection of data schemas published by Microsoft that are designed to make it easier for you to build, use, and analyze data. Con este modelo, puede pasar de los orígenes de datos a los paneles de Power BI prácticamente sin hacer nada.With this model, you can go from data sources to Power BI dashboards with nearly zero friction.

Puede usar los flujos de datos para ingerir datos desde un conjunto grande y creciente de orígenes de datos basados en la nube y locales compatibles, incluidos Dynamics 365, Salesforce, Azure SQL Database, Excel, SharePoint y muchos más.You can use dataflows to ingest data from a large and growing set of supported on-premises and cloud- based data sources including Dynamics 365, Salesforce, Azure SQL Database, Excel, SharePoint, and more.

Después puede asignar datos a entidades estándar en Common Data Service, modificar y extender las entidades existentes y crear entidades personalizadas.You can then map data to standard entities in the Common Data Model, modify and extend existing entities, and create custom entities. Los usuarios avanzados pueden crear flujos de datos completamente personalizados, mediante una experiencia de creación de Power Query integrada, con poco código o ninguno y de autoservicio, similar a la experiencia de Power Query que millones de usuarios de Power BI Desktop y Excel ya conocen.Advanced users can create fully customized dataflows, using a self-service, low- code/no-code, built-in Power Query authoring experience, similar to the Power Query experience that millions of Power BI Desktop and Excel users already know.

Una vez que ha creado un flujo de datos, puede usar Power BI Desktop y el servicio Power BI para crear conjuntos de datos, informes, paneles y aplicaciones que aprovechan la eficacia de Common Data Service para integrar información detallada en las actividades empresariales.Once you’ve created a dataflow, you can use Power BI Desktop and the Power BI service to create datasets, reports, dashboards, and apps that leverage the power of the Common Data Model to drive deep insights into your business activities.

La programación de actualizaciones de los flujos de datos se administra directamente desde el área de trabajo en la que se creó el flujo de datos, al igual que los conjuntos de datos.Dataflow refresh scheduling is managed directly from the workspace in which your dataflow was created, just like your datasets.

Funcionamiento de los flujos de datosHow dataflows work

Estos son algunos ejemplos de para qué pueden servir los flujos de datos:Here are some examples of how dataflows can work for you:

  • Las organizaciones pueden asignar sus datos a entidades estándar en Common Data Service o crear sus propias entidades personalizadas.Organizations can map their data to standard entities in the Common Data Model or create their own custom entities. Estas entidades se pueden usar después como bloques de creación para compilar informes, paneles y aplicaciones listos para usar, y también se pueden distribuir a los usuarios de la organización.These entities can then be used as building blocks to create reports, dashboards, and apps that work out of the box, and distribute them to users across their organization.

  • Con el uso de la amplia colección de conectores de datos de Microsoft, las organizaciones pueden conectar sus propios orígenes de datos a los flujos de datos, mediante Power Query para asignar los datos desde su origen e integrarlos en Power BI.Using the extensive collection of Microsoft data connectors, organizations can connect their own data sources to dataflows, using Power Query to map the data from its origin and bring it into Power BI. Una vez que un flujo de datos importa dichos datos y tras su actualización con una frecuencia determinada, las entidades del flujo de datos se pueden usar en la aplicación de Power BI Desktop para crear atractivos informes y paneles.Once that data is imported by a dataflow (and refreshed at a specified frequency), those dataflow entities may be used in the Power BI Desktop application to create compelling reports and dashboards.

Uso de los flujos de datosHow to use dataflows

En la sección anterior se describe una serie de formas en que se pueden usar los flujos de datos para crear rápidamente análisis eficaces en Power BI.The previous section described a handful of ways dataflows can be used to quickly create powerful analytics in Power BI. En esta sección se ofrece orientación sobre cómo crear rápidamente información detallada con el uso de flujos de datos de una organización, cómo obtener una vista rápida de la forma en que los profesionales de inteligencia empresarial pueden crear sus propios flujos de datos y cómo personalizar la información detallada según las necesidades de cada organización.In this section, you get a tour of how quickly you can create insights using dataflows in an organization, get a quick view into how BI Pros can create their own dataflows, and customize insights for their own organization.

Nota

Debe tener una cuenta de Power BI de pago para usar los flujos de datos, como una cuenta de Power BI Pro o Power BI Premium, pero no se le cobrará por separado por usarlos.You must have a paid Power BI account to use dataflows, such as a Power BI Pro or Power BI Premium account, but you are not charged separately for using dataflows.

Ampliación del modelo de datos común para satisfacer las necesidades empresarialesExtend the common data model for your business needs

Para las organizaciones que desean ampliar Common Data Service (CDM), los flujos de datos permiten a los profesionales de inteligencia empresarial personalizar las entidades estándar o crear nuevas.For organizations that want to extend the Common Data Model (CDM), dataflows enable business intelligence professionals to customize the standard entities, or create new ones. Este enfoque de autoservicio para personalizar el modelo de datos puede utilizarse con flujos de datos para crear aplicaciones y paneles de Power BI que se adaptan a una organización.This self-service approach to customizing the data model can then be used with dataflows to build apps and Power BI dashboards that are tailored to an organization.

Definición de flujos de datos mediante programaciónDefine dataflows programmatically

También puede desarrollar sus propias soluciones mediante programación para crear flujos de datos.You might also want to develop your own programmatic solutions to create dataflows. Con las API públicas y la funcionalidad de crear archivos de definición de flujos de datos personalizados (model.json), puede crear una solución personalizada que se adapte a las necesidades de análisis y datos exclusivas de su organización.With public APIs and the capability to programmatically create custom dataflow definition files (model.json), you create a custom solution that fits your organization’s unique data and analytics needs.

Las API públicas permiten a los desarrolladores interactuar de forma sencilla con Power BI y los flujos de datos.Public APIs allow developers simple and easy ways to interact with Power BI and dataflows.

Ampliación de las funcionalidades con AzureExtend your capabilities with Azure

Azure Data Lake Storage Gen2 se incluye con cada suscripción de Power BI de pago (10 GB por usuario y 100 TB por nodo de P1).Azure Data Lake Storage Gen2 is included with every paid Power BI subscription (10 GB per user, 100 TB per P1 node). De esta forma, puede comenzar fácilmente con la preparación de datos de autoservicio en Azure Data Lake.So, you can easily get started with self-service data prep on Azure Data Lake.

Power BI puede configurarse para almacenar datos de flujo de datos en la cuenta de Azure Data Lake Storage Gen2 de su organización.Power BI can be configured to store dataflow data in your organization’s Azure Data Lake Storage Gen2 account. Cuando Power BI se conecta a su suscripción de Azure, los desarrolladores de datos y los científicos de datos pueden beneficiarse de los eficaces productos de Azure, como Azure Machine Learning, Azure Databricks, Azure Data Factory y muchos más.When Power BI is connected to your Azure subscription, data developers and data scientists can leverage powerful Azure products such as Azure Machine Learning, Azure Databricks, Azure Data Factory, and more.

Power BI también se puede conectar a carpetas con datos esquematizados con el formato Common Data Model, que se almacenan en la cuenta de Azure Data Lake Storage de la organización.Power BI can also connect to folders with schematized data in the Common Data Model format, which are stored in your organization’s Azure Data Lake Storage account. Estas carpetas pueden crearse como servicios, como los servicios de datos de Azure.These folders can be created by services such as Azure data services. Al conectarse a estas carpetas, los analistas pueden trabajar sin problema con estos datos en Power BI.By connecting to these folders, analysts can work seamlessly with this data in Power BI.

Para más información sobre la integración con Azure Data Lake Storage Gen2 y flujos de datos, lo que incluye cómo crear flujos de datos que residen en la instancia de Azure Data Lake de su organización, consulte Integración de flujos de datos y Azure Data Lake (versión preliminar).For more information about Azure Data Lake Storage Gen2 and dataflows integration, including how to create dataflows that reside in your organization's Azure Data Lake, see dataflows and Azure Data Lake integration (Preview).

Funcionalidades de flujo de datos en Power BI PremiumDataflow capabilities on Power BI Premium

Para que las características y las cargas de trabajo de flujos de datos funcionen en una suscripción de Power BI Premium, la carga de trabajo del flujo de datos de dicha capacidad Premium debe estar activada.For dataflow features and workloads to operate on a Power BI Premium subscription, the dataflow workload for that Premium capacity must be turned on. En la tabla siguiente se describen las características de los flujos de datos y sus funcionalidades cuando se usa una cuenta de Power BI Pro y se establece una comparación con el uso de Power BI Premium.The following table describes dataflow features and their capacities when using a Power BI Pro account, and how that compares to using Power BI Premium.

Funcionalidad de flujo de datosDataflow capability Power BI ProPower BI Pro Power BI PremiumPower BI Premium
Actualización programadaScheduled refresh 8 al día8 per day 4848
Almacenamiento totalTotal Storage 10 GB/usuario10 GB/user 100 TB/nodo100 TB/node
Creación de flujos de datos con Power Query OnlineDataflow Authoring with Power Query Online + +
Administración de flujo de datos en Power BIDataflow Management within Power BI + +
Conector de datos de flujos de datos en Power BI DesktopDataflows Data Connector in the Power BI Desktop + +
Integración con AzureIntegration with Azure + +
Entidades calculadas (transformaciones en almacenamiento mediante M)Computed Entities (in-storage transformations via M) +
Nuevos conectoresNew connectors + +
Actualización incremental de flujos de datosDataflow incremental refresh +
Ejecución en capacidad Premium de Power BI/ejecución paralela de transformacionesRunning on Power BI Premium capacity / Parallel execution of transforms +
Entidades vinculadas a flujos de datosDataflow linked entities +
Esquema estandarizado/soporte integrado para Common Data ServiceStandardized Schema / Built-In Support for the Common Data Model + +

Para obtener más información sobre cómo habilitar las cargas de trabajo de flujo de datos en una capacidad Premium, consulte Configure workloads in a Premium capacity (Configuración de cargas de trabajo en una capacidad Premium).For more information about how to enable dataflows workloads on premium capacity, see the Configure workloads in a Premium capacity. Las cargas de trabajo de flujo de datos no están actualmente disponibles en las funciones de Multi-Geo.Dataflow workloads are not currently available in multi-geo capacities.

Resumen de la preparación de datos de autoservicio para macrodatos en Power BISummary of self-service data prep for big data in Power BI

Como se mencionó anteriormente en este artículo, existen varios escenarios y ejemplos donde los flujos de datos pueden permitirle obtener un mejor control e información más rápida de sus datos empresariales.As mentioned previously in this article, there are multiple scenarios and examples where dataflows can enable you to get better control – and faster insights – from your business data. Mediante un modelo de datos estándar (esquema) definido por Common Data Service, los flujos de datos pueden importar sus datos profesionales importantes y tener los datos listos para el modelado y la creación de información detallada de inteligencia empresarial en muy poco tiempo... cuya creación solía llevar meses, o incluso más.Using a standard data model (schema) defined by the Common Data Model, dataflows can import your valuable business data, and have the data ready for modeling and creation of BI insights in a very short period... in what used to take months, or longer, to create.

Al almacenar datos empresariales en formato estandarizado de Common Data Service, los desarrolladores o profesionales de inteligencia empresarial pueden crear aplicaciones que generan objetos visuales e informes automáticos de forma rápida y sencilla.By storing business data in the standardized format of the Common Data Model, your BI Pros (or developers) can create apps that generate quick, easy, and automatic visuals and reports. Entre las ventajas se incluyen:Those include, but aren’t limited to:

  • Asignación de los datos a entidades estándar en Common Data Service para unificar datos y utilizar el esquema conocido para integrar información detallada lista para usarMapping your data to standard entities in the Common Data Model to unify data and leverage the known schema to drive out-of-the-box insights
  • Creación de entidades personalizadas propias para unificar los datos de toda la organizaciónCreating your own custom entities to unify data across your organization
  • Usar y actualizar datos externos como parte de un flujo de datos y habilitar la importación de esos datos para proporcionar la informaciónUse and refresh external data as part of a dataflow, and enable import of that data to drive insights
  • Introducción a flujos de datos para desarrolladoresGetting started with dataflows for developers

Pasos siguientesNext Steps

En este artículo se proporciona información general sobre la preparación de datos de autoservicio para macrodatos en Power BI y las numerosas formas en que pueden usarse.This article provided an overview of self service data prep for big data in Power BI, and the many ways you can use it. En los siguientes artículos se ofrecen más detalles sobre escenarios de uso común de los flujos de datos.The following articles go into more detail about common usage scenarios for dataflows.

Para obtener más información sobre Power Query y la actualización programada, puede leer estos artículos:For more information about Power Query and scheduled refresh, you can read these articles:

Para más información sobre Common Data Service, puede leer su artículo de introducción:For more information about the Common Data Model, you can read its overview article: