Conjuntos de datos grandes en Power BI Premium

Los conjuntos de datos de Power BI pueden almacenar datos en una memoria caché en memoria muy comprimida para optimizar el rendimiento de las consultas, a fin de permitir una rápida interactividad del usuario. Gracias a las capacidades Prémium, se pueden habilitar conjuntos de datos grandes que superen el límite predeterminado por medio de la opción Formato de almacenamiento de conjunto de datos de gran tamaño. Si esta opción está habilitada, el tamaño de los conjuntos de datos estará limitado por el tamaño de la capacidad prémium o por el tamaño máximo establecido por el administrador.

Los conjuntos de datos grandes se pueden habilitar para todas las SKU P de la versión Premium, las SKU A de la versión Embedded y con Premium por usuario (PPU). El límite de tamaño de los conjuntos de datos grandes en Premium es comparable al de Azure Analysis Services en cuanto a la limitación del tamaño del modelo de datos.

Aunque es necesario que los conjuntos de datos tengan más de 10 GB, habilitar la opción Formato de almacenamiento de conjunto de datos de gran tamaño tiene otros beneficios. Si tiene previsto usar herramientas basadas en puntos de conexión XMLA para realizar operaciones de escritura en el conjunto de datos, procure habilitar esta opción, incluso en el caso de aquellos conjuntos de datos que no se caractericen necesariamente por ser un conjunto de datos grande. Si se habilita, el formato de almacenamiento de conjuntos de datos grandes puede mejorar el rendimiento de las operaciones de escritura de XMLA.

Los conjuntos de datos grandes del servicio no afectan al tamaño de carga de modelos de Power BI Desktop, que sigue estando restringido a 10 GB. En su lugar, los conjuntos de datos pueden superar dicho límite en el servicio al actualizarse.

Importante

Power BI Prémium no admite conjunto de datos grandes. Habilite la opción Formato de almacenamiento de conjunto de datos de gran tamaño para usar conjuntos de datos en Power BI Prémium con un tamaño superior al límite predeterminado.

Habilitar conjuntos de datos grandes

Con estos pasos se explica cómo habilitar conjuntos de datos grandes para un modelo nuevo publicado en el servicio. Para los conjuntos de datos existentes, solo es necesario el paso 3.

  1. Cree un modelo en Power BI Desktop. Si el conjunto de datos va a ir creciendo y consumiendo más memoria progresivamente, asegúrese de configurar la opción Actualización incremental.

  2. Publique el modelo como un conjunto de datos en el servicio.

  3. En servicio > conjunto de datos > Configuración, expanda Formato de almacenamiento de conjunto de datos de gran tamaño, haga clic en el control deslizante para activarlo y, después, haga clic en Aplicar.

    Habilitar el control deslizante de conjuntos de datos grandes

  4. Invoque una actualización para cargar los datos históricos basada en la directiva de actualización incremental. La primera actualización podría tardar bastante tiempo en cargar el historial. Las actualizaciones posteriores deberían ser más rápidas, dependiendo de cómo sea su directiva de actualización incremental.

Establecer el formato de almacenamiento predeterminado

Todos los conjuntos de datos nuevos que se creen en un área de trabajo asignada a una capacidad Premium pueden tener habilitado el formato de almacenamiento de conjuntos de datos grandes de forma predeterminada.

  1. En el área de trabajo, haga clic en Configuración > Premium.

  2. En Formato de almacenamiento predeterminado,seleccione Formato de almacenamiento de conjunto de datos de gran tamaño y, después, haga clic en Guardar.

    Habilitar el formato de almacenamiento predeterminado

Habilitar con PowerShell

El formato de almacenamiento de los conjuntos de datos grandes también se puede habilitar con PowerShell. Debe tener privilegios de administrador de áreas de trabajo y de la capacidad para ejecutar los cmdlets de PowerShell.

  1. Busque el identificador del conjunto de datos (GUID). En la pestaña Conjuntos de datos del área de trabajo, en la configuración del conjunto de datos, puede ver el identificador en la dirección URL.

    GUID del conjunto de datos

  2. En un símbolo del sistema de administrador de PowerShell, instale el módulo MicrosoftPowerBIMgmt.

    Install-Module -Name MicrosoftPowerBIMgmt
    
  3. Ejecute los siguientes cmdlets para iniciar sesión y comprobar el modo de almacenamiento del conjunto de datos.

    Login-PowerBIServiceAccount
    
    (Get-PowerBIDataset -Scope Organization -Id <Dataset ID> -Include actualStorage).ActualStorage
    

    La respuesta será la siguiente. El modo de almacenamiento es ABF (archivo de copia de seguridad de Analysis Services), que es el valor predeterminado.

    Id                   StorageMode
    
    --                   -----------
    
    <Dataset ID>         Abf
    
  4. Ejecute los siguientes cmdlets para establecer el modo de almacenamiento. La conversión a Azure Files Premium puede tardar unos segundos.

    Set-PowerBIDataset -Id <Dataset ID> -TargetStorageMode PremiumFiles
    
    (Get-PowerBIDataset -Scope Organization -Id <Dataset ID> -Include actualStorage).ActualStorage
    

    La respuesta será la siguiente. El modo de almacenamiento ahora está establecido en Azure Files Premium.

    Id                   StorageMode
    
    --                   -----------
    
    <Dataset ID>         PremiumFiles
    

Puede comprobar el estado de las conversiones del conjunto de datos hacia y desde Azure Files Premium con el cmdlet Get-PowerBIWorkspaceMigrationStatus.

Expulsión del conjunto de datos

Power BI usa la administración dinámica de la memoria para expulsar los conjuntos de datos inactivos de la memoria. Power BI expulsa los conjuntos de datos para poder cargar otros conjuntos de datos para direccionar las consultas de los usuarios. La administración dinámica de la memoria permite que la suma de los tamaños de los conjunto de datos sea bastante mayor que la memoria disponible en la capacidad, pero debe caber un solo conjunto de datos en la memoria. Para más información sobre la administración dinámica de la memoria, consulte Funcionamiento de las capacidades.

Tenga en cuenta el impacto de la expulsión en los modelos grandes. A pesar de los tiempos de carga de conjuntos de datos relativamente rápidos, los usuarios podrían notar un retraso considerable si tienen que esperar a que se recarguen los conjuntos de datos grandes expulsados. Por esta razón, en su forma actual, se recomienda usar la característica de modelos grandes principalmente para las capacidades dedicadas a los requisitos de inteligencia empresarial en lugar de a capacidades mixtas con requisitos de inteligencia empresarial con características de autoservicio. Las capacidades dedicadas a los requisitos de inteligencia empresarial son menos propensas a desencadenar expulsiones y por lo que no necesitan volver a cargar los conjuntos de datos con tanta frecuencia. Por otro lado, las capacidades de inteligencia empresarial con características de autoservicio pueden tener muchos conjuntos de datos pequeños que se cargan con más frecuencia dentro y fuera de la memoria.

Comprobación del tamaño del conjunto de datos

Después de cargar los datos históricos, puede usar SSMS a través del punto de conexión de XMLA para comprobar el tamaño estimado del conjunto de datos en la ventana de propiedades del modelo.

Tamaño estimado del conjunto de datos

Para comprobar el tamaño del conjunto de datos, también puede ejecutar las siguientes consultas DMV desde SSMS. Sume las columnas DICTIONARY_SIZE y USED_SIZE de la salida para ver el tamaño del conjunto de datos en bytes.

SELECT * FROM SYSTEMRESTRICTSCHEMA
($System.DISCOVER_STORAGE_TABLE_COLUMNS,
 [DATABASE_NAME] = '<Dataset Name>') //Sum DICTIONARY_SIZE (bytes)

SELECT * FROM SYSTEMRESTRICTSCHEMA
($System.DISCOVER_STORAGE_TABLE_COLUMN_SEGMENTS,
 [DATABASE_NAME] = '<Dataset Name>') //Sum USED_SIZE (bytes)

Tamaño de segmento predeterminado

Para los conjuntos de datos que usan el formato de almacenamiento de conjunto de datos grande, Power BI establece automáticamente el tamaño de segmento predeterminado en 8 millones de filas para encontrar el equilibrio correcto entre los requisitos de memoria y el rendimiento de las consultas para tablas grandes. Es el mismo tamaño de segmento que en Azure Analysis Services. Mantener los tamaños de segmento alineados ayuda a garantizar características de rendimiento comparables al migrar un modelo de datos grande de Azure Analysis Services a Power BI.

Consideraciones y limitaciones

Tenga en cuenta las siguientes restricciones cuando use conjuntos de datos grandes:

  • Se necesitan áreas de trabajo nuevas: los conjuntos de datos grandes solo funcionan con áreas de trabajo nuevas.

  • Descarga en Power BI Desktop: si un conjunto de datos se almacena en Files Premium, se producirá un error al descargar como archivo .pbix.

  • Regiones admitidas: los conjuntos de datos grandes se pueden usar en todas las regiones de Azure que admitan el almacenamiento de archivos Premium. Para más información, vea Productos disponibles por región y consulte la tabla de la siguiente sección.

  • Configuración del tamaño máximo del conjunto de datos: los administradores pueden configurar el tamaño máximo del conjunto de datos. Se puede configurar el valor máximo desde 0,1 GB hasta la capacidad máxima de la SKU.

  • Conjuntos de datos de inserción: los conjuntos de datos de inserción no admiten el formato de almacenamiento de conjuntos de datos grandes.

  • No se pueden habilitar conjuntos de datos grandes mediante la API REST.

Disponibilidad en regiones

Los conjuntos de datos grandes de Power BI solo están disponibles en determinadas regiones de Azure que admiten Azure Premium Files Storage.

En la siguiente lista se indican las regiones en las que hay disponibles conjuntos de datos grandes en Power BI. Las regiones que no están en la lista siguiente no se admiten para los modelos grandes:

Región de Azure Abreviatura de la región de Azure
Este de Australia australiaeast
Sudeste de Australia australiasoutheast
Este de Canadá canadaeast
Centro de Canadá canadacentral
India central centralindia
Centro de EE. UU. centralus
Este de Asia eastasia
Este de EE. UU. estado
Este de EE. UU. 2 eastus2
Japón Oriental japaneast
Japón Occidental japanwest
Centro de Corea del Sur koreacentral
Corea del Sur koreasouth
Centro-Norte de EE. UU northcentralus
Norte de Europa northeurope
Centro-sur de EE. UU. southcentralus
Sudeste de Asia southeastasia
Sur de Reino Unido uksouth
Oeste de Reino Unido ukwest
Oeste de Europa westeurope
Oeste de la India westindia
Oeste de EE. UU. westus
Oeste de EE. UU. 2 westus2

Pasos siguientes

Los vínculos siguientes proporcionan información que puede ser útil para trabajar con modelos grandes:

Power BI ha introducido Power BI Premium Gen2 como una oferta en versión preliminar, lo que mejora la experiencia con Power BI Premium mediante mejoras en los siguientes aspectos:

  • Rendimiento
  • Concesión de licencias por usuario
  • Mayor escala
  • Métricas mejoradas
  • Escalado automático
  • Menor sobrecarga de administración

Para obtener más información sobre Power BI Premium Gen2, vea Power BI Premium Generation 2.