Настройка рабочих нагрузок потока данных Power BI Premium

Рабочие нагрузки потока данных можно создать в подписке Power BI Premium. Power BI использует концепцию рабочих нагрузок для описания содержимого класса Premium. Рабочие нагрузки включают наборы данных, отчеты с разбивкой на страницы, потоки данных и ИИ. Рабочая нагрузка потоков данных позволяет использовать самостоятельную подготовку данных для приема, преобразования, интеграции и обогащения данных. Потоки данных Power BI Premium управляются на портале Администратор.

В следующих разделах описывается, как включить потоки данных в организации, как уточнить их параметры в емкости Premium и рекомендации по общему использованию.

Включение потоков данных в Power BI Premium

Первое требование использования потоков данных в подписке Power BI Premium — включение создания и использования потоков данных для вашей организации. На портале Администратор выберите "Клиент Параметры" и переключите ползунок в разделе "Включено", как показано на следующем рисунке.

Admin portal for dataflows in Power BI premium

После включения рабочей нагрузки потоков данных она настраивается с параметрами по умолчанию. Вам может потребоваться настроить эти параметры по мере их соответствия. Далее мы рассмотрим, где эти параметры живут, описываются и помогут вам понять, когда может потребоваться изменить значения для оптимизации производительности потока данных.

Уточнение параметров потока данных в Premium

После включения потоков данных можно использовать портал Администратор для изменения или уточнения, создания потоков данных и использования ресурсов в подписке Power BI Premium. Power BI Premium не требует изменения параметров памяти. Память в Power BI Premium автоматически управляется базовой системой. Ниже показано, как настроить параметры потока данных.

  1. На портале Администратор выберите параметры клиента, чтобы перечислить все созданные емкости. Выберите емкость для управления параметрами.

    Select a capacity to manage settings

  2. Емкость Power BI Premium отражает ресурсы, доступные для потоков данных. Размер емкости можно изменить, нажав кнопку "Изменить размер ", как показано на следующем рисунке.

    Change the size of a capacity

Номера SKU емкости Premium — увеличение масштаба оборудования

Рабочие нагрузки Power BI Premium используют виртуальные ядра для быстрого выполнения запросов в различных типах рабочих нагрузок. Емкости и номера SKU включают диаграмму, которая иллюстрирует текущие спецификации для каждого из доступных предложений рабочей нагрузки. Емкости A3 и выше могут воспользоваться преимуществами вычислительного ядра, поэтому, когда вы хотите использовать расширенный вычислительный модуль, запустите его.

Расширенная подсистема вычислений — возможность повышения производительности

Расширенный вычислительный модуль — это подсистема , которая может ускорить запросы. Power BI использует подсистему вычислений для обработки запросов и операций обновления. Улучшенная подсистема вычислений — это улучшение по сравнению со стандартным механизмом и работает путем загрузки данных в кэш SQL и использования SQL для ускорения преобразования таблиц, операций обновления и включения подключения DirectQuery. При настройке включено или оптимизировано для вычисляемых сущностей, если бизнес-логика позволяет ей, Power BI использует SQL для ускорения производительности. Наличие подсистемы On также обеспечивает подключение DirectQuery. Убедитесь, что использование потока данных правильно использует расширенный вычислительный модуль. Пользователи могут настроить расширенный вычислительный механизм, оптимизированный или отключенный на основе потока данных.

Примечание.

Расширенный вычислительный модуль еще недоступен во всех регионах.

Руководство по общим сценариям

В этом разделе приведены рекомендации по общим сценариям при использовании рабочих нагрузок потока данных с Power BI Premium.

Время медленного обновления

Время медленного обновления обычно является проблемой параллелизма. Чтобы просмотреть следующие параметры, выполните следующие действия.

  1. Ключевым понятием медленного времени обновления является характер подготовки данных. Каждый раз, когда вы можете оптимизировать время медленного обновления, используя преимущества источника данных, фактически выполняя подготовку и выполнение логики запроса заранее, это необходимо сделать. В частности, при использовании реляционной базы данных, например SQL в качестве источника, проверьте, можно ли запустить исходный запрос в источнике и использовать этот исходный запрос для исходного потока данных извлечения для источника данных. Если вы не можете использовать собственный запрос в исходной системе, выполните операции, которые подсистема потоков данных может сложить в источник данных.

  2. Оцените время распространения обновления в одной емкости. Операции обновления — это процесс, требующий значительных вычислений. Используя аналогию нашего ресторана, распространение времени обновления сродни ограничению количества гостей в вашем ресторане. Так же, как рестораны запланируют гостей и планируют для емкости, вы также хотите рассмотреть возможность обновления операций во время, когда использование не находится на полном пике. Это может пройти долгий путь к сокращению нагрузки на емкость.

Если действия, описанные в этом разделе, не предоставляют нужную степень параллелизма, рассмотрите возможность обновления емкости до более высокого номера SKU. Затем выполните предыдущие шаги в этой последовательности еще раз.

Использование подсистемы вычислений для повышения производительности

Выполните следующие действия, чтобы рабочие нагрузки могли активировать подсистему вычислений и всегда повысить производительность:

Для вычисляемых и связанных сущностей в одной рабочей области:

  1. Чтобы получить данные в хранилище как можно быстрее, используйте фильтры только в том случае, если они снижают общий размер набора данных. Рекомендуется сохранить логику преобразования отдельно от этого шага и разрешить подсистеме сосредоточиться на первоначальном сборе ингредиентов. Затем отделите преобразование и бизнес-логику в отдельном потоке данных в той же рабочей области с помощью связанных или вычисляемых сущностей; это позволяет подсистеме активировать и ускорить вычисления. Ваша логика должна быть подготовлена отдельно, прежде чем она сможет воспользоваться преимуществами вычислительной подсистемы.

  2. Убедитесь, что вы выполняете операции, которые сворачивать, например слиянием, соединениями, преобразованием и другими.

  3. Создание потоков данных в рамках опубликованных рекомендаций и ограничений.

Вы также можете использовать DirectQuery.

Подсистема вычислений включена, но производительность замедляется

Выполните следующие действия при изучении сценариев, в которых подсистема вычислений включена, но вы видите более низкую производительность:

  1. Ограничить вычисляемые и связанные сущности, которые существуют в рабочей области.

  2. При первоначальном обновлении с включенным подсистемой вычислений данные записываются в озере и кэше. Это двойное запись означает, что эти обновления будут медленнее.

  3. Если у вас есть связывание потока данных с несколькими потоками данных, убедитесь, что вы планируете обновление исходных потоков данных, чтобы они не обновлялись одновременно.

Дополнительные сведения о потоках данных и Power BI см. в следующих статьях.