Funkcje premium przepływów danych

Przepływy danych są obsługiwane dla użytkowników usługi Power BI Pro, Premium na użytkownika (PPU) i usługi Power BI Premium. Niektóre funkcje są dostępne tylko w ramach subskrypcji usługi Power BI Premium (czyli pojemności Premium lub licencji PPU). W tym artykule opisano i szczegółowo opisano funkcje ppu i tylko w warstwie Premium oraz ich zastosowania.

Następujące funkcje są dostępne tylko w przypadku usługi Power BI Premium (PPU lub subskrypcji pojemności Premium):

  • Ulepszony aparat obliczeniowy
  • DirectQuery
  • Obliczone jednostki
  • Połączone jednostki
  • Odświeżanie przyrostowe

W poniższych sekcjach opisano szczegółowo każdą z tych funkcji.

Ważne

Ten artykuł dotyczy pierwszej generacji przepływów danych (Gen1) i nie dotyczy drugiej generacji przepływów danych (Gen2), które są dostępne w usłudze Microsoft Fabric (wersja zapoznawcza). Aby uzyskać więcej informacji, zobacz Pobieranie z przepływów danych generacji 1 do przepływów danych generacji 2.

Ulepszony aparat obliczeniowy

Ulepszony aparat obliczeniowy w usłudze Power BI umożliwia subskrybentom usługi Power BI Premium korzystanie z pojemności w celu zoptymalizowania użycia przepływów danych. Korzystanie z ulepszonego aparatu obliczeniowego zapewnia następujące korzyści:

  • Drastycznie skraca czas odświeżania wymagany przez długotrwałe operacje ETL (wyodrębnianie, przekształcanie, ładowanie) dla obliczonych jednostek, takich jak wykonywanie sprzężeń, odrębnych, filtrów i grupowanie według.
  • Wykonuje zapytania DirectQuery dla jednostek.

Uwaga

  • Procesy walidacji i odświeżania informują o przepływach danych schematu modelu. Aby ustawić schemat tabel samodzielnie, użyj Edytor Power Query i ustaw typy danych.
  • Ta funkcja jest dostępna we wszystkich klastrach usługi Power BI z wyjątkiem WABI-INDIA-CENTRAL-A-PRIMARY

Włączanie ulepszonego aparatu obliczeniowego

Ważne

Ulepszony aparat obliczeniowy działa tylko w przypadku pojemności A3 lub większej usługi Power BI.

W usłudze Power BI Premium ulepszony aparat obliczeniowy jest indywidualnie ustawiany dla każdego przepływu danych. Istnieją trzy konfiguracje do wyboru:

  • Disabled

  • Zoptymalizowane (ustawienie domyślne) — ulepszony aparat obliczeniowy jest wyłączony. Jest on automatycznie włączony, gdy tabela w przepływie danych jest przywołyowana przez inną tabelę lub gdy przepływ danych jest połączony z innym przepływem danych w tym samym obszarze roboczym.

  • On

Aby zmienić ustawienie domyślne i włączyć ulepszony aparat obliczeniowy, wykonaj następujące kroki:

  1. W obszarze roboczym obok przepływu danych, dla którego chcesz zmienić ustawienia, wybierz pozycję Więcej opcji.

  2. Z menu Więcej opcji przepływu danych wybierz pozycję Ustawienia.

    Screenshot of a dataflows more options menu with the settings setting highlighted.

  3. Rozwiń ustawienia ulepszonego aparatu obliczeniowego.

    Screenshot of a dataflow settings page with the enhanced compute engine settings setting highlighted.

  4. W ustawieniach ulepszonego aparatu obliczeniowego wybierz pozycję Włączone, a następnie wybierz pozycję Zastosuj.

    Screenshot of the enhanced compute engine settings with the on selection turned on and the apply button highlighted.

Korzystanie z ulepszonego aparatu obliczeniowego

Po uruchomieniu ulepszonego aparatu obliczeniowego wróć do przepływów danych i powinna zostać wyświetlona poprawa wydajności w dowolnej obliczonej tabeli, która wykonuje złożone operacje, takie jak sprzężenia lub grupowanie według operacji dla przepływów danych utworzonych na podstawie istniejących połączonych jednostek w tej samej pojemności.

Aby jak najlepiej wykorzystać aparat obliczeniowy, podziel etap ETL na dwa oddzielne przepływy danych w następujący sposób:

  • Przepływ danych 1 — ten przepływ danych powinien pozyskiwać tylko wszystkie wymagane elementy ze źródła danych.
  • Przepływ danych 2 — wykonaj wszystkie operacje ETL w tym drugim przepływie danych, ale upewnij się, że odwołujesz się do przepływu danych 1, który powinien znajdować się w tej samej pojemności. Upewnij się również, że wykonujesz operacje, które mogą składać się jako pierwsze: filtr, grupować według, odrębne, sprzężenia). I wykonaj te operacje przed inną operacją, aby upewnić się, że aparat obliczeniowy jest używany.

Typowe pytania i odpowiedzi

Pytanie: Włączono ulepszony aparat obliczeniowy, ale moje odświeżanie jest wolniejsze. Dlaczego?

Odpowiedź: Jeśli włączysz ulepszony aparat obliczeniowy, istnieją dwa możliwe wyjaśnienia, które mogą prowadzić do wolniejszego czasu odświeżania:

  • Po włączeniu ulepszonego aparatu obliczeniowego wymagana jest odpowiednia pamięć. W związku z tym ilość pamięci dostępnej do wykonania odświeżania jest ograniczona i zwiększa prawdopodobieństwo, że odświeżenia zostaną w kolejce. Spowoduje to zmniejszenie liczby przepływów danych, które mogą być odświeżane współbieżnie. Aby rozwiązać ten problem, podczas włączania rozszerzonych zasobów obliczeniowych zwiększ ilość pamięci przypisanej dla przepływów danych, aby zapewnić, że pamięć dostępna dla współbieżnych odświeżeń przepływu danych pozostanie taka sama.

  • Innym powodem, dla którego może wystąpić wolniejsze odświeżanie, jest to, że aparat obliczeniowy działa tylko na podstawie istniejących jednostek. Jeśli przepływ danych odwołuje się do źródła danych, które nie jest przepływem danych, nie zobaczysz poprawy. Nie będzie żadnych wzrostów wydajności, ponieważ w niektórych scenariuszach danych big data początkowy odczyt ze źródła danych będzie wolniejszy, ponieważ dane muszą zostać przekazane do ulepszonego aparatu obliczeniowego.

Pytanie: Nie widzę przełącznika ulepszonego aparatu obliczeniowego. Dlaczego?

Odpowiedź: Ulepszony aparat obliczeniowy jest udostępniany na etapach w regionach na całym świecie, ale nie jest jeszcze dostępny w każdym regionie.

Pytanie: Jakie są obsługiwane typy danych dla aparatu obliczeniowego?

Odpowiedź: Ulepszony aparat obliczeniowy i przepływy danych obecnie obsługują następujące typy danych. Jeśli przepływ danych nie używa jednego z następujących typów danych, podczas odświeżania wystąpi błąd:

  • Data/godzina
  • Liczba dziesiętna
  • Text
  • Liczba całkowita
  • Data/godzina/strefa
  • Prawda/fałsz
  • Data
  • Godzina

Używanie trybu DirectQuery z przepływami danych w usłudze Power BI

Możesz użyć trybu DirectQuery, aby połączyć się bezpośrednio z przepływami danych, a tym samym połączyć się bezpośrednio z przepływem danych bez konieczności importowania danych.

Korzystanie z trybu DirectQuery z przepływami danych umożliwia następujące ulepszenia procesów usługi Power BI i przepływów danych:

  • Unikaj oddzielnych harmonogramów odświeżania — tryb DirectQuery łączy się bezpośrednio z przepływem danych, usuwając konieczność utworzenia zaimportowanego modelu semantycznego. W związku z tym użycie trybu DirectQuery z przepływami danych oznacza, że nie potrzebujesz już oddzielnych harmonogramów odświeżania dla przepływu danych i modelu semantycznego w celu zapewnienia synchronizacji danych.

  • Filtrowanie danych — zapytanie bezpośrednie przydaje się do pracy z filtrowanym widokiem danych wewnątrz przepływu danych. Tryb DirectQuery z aparatem obliczeniowym umożliwia filtrowanie danych przepływu danych i pracę z filtrowanym podzestawem. Filtrowanie danych umożliwia pracę z mniejszym i bardziej zarządzanym podzbiorem danych w przepływie danych.

Używanie trybu DirectQuery dla przepływów danych

Korzystanie z trybu DirectQuery z przepływami danych jest dostępne w programie Power BI Desktop.

Istnieją wymagania wstępne dotyczące używania trybu DirectQuery z przepływami danych:

  • Przepływ danych musi znajdować się w obszarze roboczym z włączoną obsługą usługi Power BI Premium.
  • Aparat obliczeniowy musi być włączony.

Aby dowiedzieć się więcej na temat trybu DirectQuery z przepływami danych, zobacz Using DirectQuery with dataflows (Używanie zapytania bezpośredniego z przepływami danych).

Włączanie trybu DirectQuery dla przepływów danych

Aby upewnić się, że przepływ danych jest dostępny dla dostępu w trybie DirectQuery, ulepszony aparat obliczeniowy musi być w stanie zoptymalizowanym. Aby włączyć tryb DirectQuery dla przepływów danych, ustaw nową opcję Rozszerzone ustawienia aparatu obliczeniowego na wartość Włączone.

Screenshot of the enhanced compute engine settings with the on option selected.

Po zastosowaniu tego ustawienia odśwież przepływ danych, aby optymalizacja została zastosowana.

Zagadnienia i ograniczenia dotyczące zapytania bezpośredniego

Istnieje kilka znanych ograniczeń dotyczących trybu DirectQuery i przepływów danych:

  • Modele złożone/mieszane z importem i źródłami danych DirectQuery nie są obecnie obsługiwane.

  • Duże przepływy danych mogą mieć problemy z przekroczeniem limitu czasu podczas wyświetlania wizualizacji. Duże przepływy danych, które napotykają problemy z przekroczeniem limitu czasu, powinny używać trybu importu.

  • W obszarze Ustawienia źródła danych łącznik przepływu danych wyświetli nieprawidłowe poświadczenia, jeśli używasz trybu DirectQuery. To ostrzeżenie nie ma wpływu na zachowanie, a semantyczny model będzie działać prawidłowo.

Obliczone jednostki

Obliczenia w magazynie można wykonywać podczas korzystania z przepływów danych z subskrypcją usługi Power BI Premium. Ta funkcja umożliwia wykonywanie obliczeń na istniejących przepływach danych i zwracanie wyników, które umożliwiają skoncentrowanie się na tworzeniu i analizie raportów.

Screenshot of a Power Query Editor, highlighting a table that is being edited.

Aby wykonać obliczenia w magazynie, należy najpierw utworzyć przepływ danych i przenieść dane do magazynu przepływu danych usługi Power BI. Po utworzeniu przepływu danych zawierającego dane można utworzyć obliczone jednostki, które są jednostkami wykonującymi obliczenia w magazynie.

Zagadnienia i ograniczenia obliczonych jednostek

  • Podczas pracy z przepływami danych utworzonymi na koncie usługi Azure Data Lake Storage Gen2 organizacji połączone jednostki i obliczone jednostki działają prawidłowo tylko wtedy, gdy jednostki znajdują się na tym samym koncie magazynu.

Najlepszym rozwiązaniem w przypadku wykonywania obliczeń na danych przyłączonych przez dane lokalne i w chmurze utwórz nowy przepływ danych dla każdego źródła (jeden dla środowiska lokalnego i jeden dla chmury), a następnie utwórz trzeci przepływ danych w celu scalenia/obliczenia w tych dwóch źródłach danych.

Połączone jednostki

Możesz odwoływać się do istniejących przepływów danych przy użyciu połączonych jednostek z subskrypcją usługi Power BI Premium, która umożliwia wykonywanie obliczeń na tych jednostkach przy użyciu obliczonych jednostek lub umożliwia utworzenie tabeli "pojedynczego źródła prawdy", którą można ponownie użyć w wielu przepływach danych.

Odświeżanie przyrostowe

Przepływy danych można ustawić na odświeżanie przyrostowe, aby uniknąć konieczności ściągania wszystkich danych przy każdym odświeżeniu. W tym celu wybierz przepływ danych, a następnie wybierz ikonę Odświeżanie przyrostowe.

Screenshot of the table in a Power BI dataflow with the Incremental Refresh icon highlighted.

Ustawienie odświeżania przyrostowego powoduje dodanie parametrów do przepływu danych w celu określenia zakresu dat. Aby uzyskać szczegółowe informacje na temat konfigurowania odświeżania przyrostowego, zobaczUsing incremental refresh with dataflows (Używanie odświeżania przyrostowego z przepływami danych).

Zagadnienia dotyczące tego, kiedy nie należy ustawiać odświeżania przyrostowego

Nie ustawiaj przepływu danych na odświeżanie przyrostowe w następujących sytuacjach:

  • Połączone jednostki nie powinny używać odświeżania przyrostowego, jeśli odwołują się do przepływu danych.

Następujące artykuły zawierają więcej informacji na temat przepływów danych i usługi Power BI: