Funkcje okna w przepływie danych mapowania

DOTYCZY: Azure Data Factory Azure Synapse Analytics

Napiwek

Wypróbuj usługę Data Factory w usłudze Microsoft Fabric — rozwiązanie analityczne typu all-in-one dla przedsiębiorstw. Usługa Microsoft Fabric obejmuje wszystko, od przenoszenia danych do nauki o danych, analizy w czasie rzeczywistym, analizy biznesowej i raportowania. Dowiedz się, jak bezpłatnie rozpocząć nową wersję próbną !

Przepływy danych są dostępne zarówno w usłudze Azure Data Factory, jak i w potokach usługi Azure Synapse. Ten artykuł dotyczy przepływów danych mapowania. Jeśli dopiero zaczynasz transformacje, zapoznaj się z artykułem wprowadzającym Przekształcanie danych przy użyciu przepływu danych mapowania.

Poniższe artykuły zawierają szczegółowe informacje o funkcjach okien obsługiwanych przez usługę Azure Data Factory i usługę Azure Synapse Analytics w przepływach danych mapowania.

Lista funkcji okna

Następujące funkcje są dostępne tylko w przekształceniach okien.

Funkcja Window Zadanie
cumeDist Funkcja CumeDist oblicza położenie wartości względem wszystkich wartości w partycji. Wynikiem jest liczba wierszy poprzedzających lub równych bieżącemu wierszowi w kolejności partycji podzielonej przez łączną liczbę wierszy w partycji okna. Wszystkie wartości wiązania w kolejności będą obliczane na tej samej pozycji.
denseRank Oblicza rangę wartości w grupie wartości określonych w kolejności okna według klauzuli. Wynik jest jednym plus liczbą wierszy poprzedzających lub równych bieżącemu wierszowi w kolejności partycji. Wartości nie spowodują przerw w sekwencji. Funkcja Gęsta ranga działa nawet wtedy, gdy dane nie są sortowane i szukają zmian w wartościach.
Lagi Pobiera wartość pierwszego parametru ocenianego n wierszy przed bieżącym wierszem. Drugi parametr to liczba wierszy do wyszukania wstecz, a wartość domyślna to 1. Jeśli nie ma tyle wierszy, zwracana jest wartość null, chyba że zostanie określona wartość domyślna.
Prowadzić Pobiera wartość pierwszego parametru ocenianego n wierszy po bieżącym wierszu. Drugi parametr to liczba wierszy do przodu, a wartość domyślna to 1. Jeśli nie ma tyle wierszy, zwracana jest wartość null, chyba że zostanie określona wartość domyślna.
Ntile Funkcja NTile dzieli wiersze dla każdej partycji okna na n zasobniki z zakresu od 1 do co najwyżej n. Wartości zasobnika będą się różnić co najwyżej o 1. Jeśli liczba wierszy w partycji nie jest dzielona równomiernie na liczbę zasobników, pozostałe wartości są rozdzielane pojedynczo na zasobnik, począwszy od pierwszego zasobnika. Funkcja jest przydatna NTile do obliczania tertiles, kwartylów, decyli i innych typowych statystyk podsumowania. Funkcja oblicza dwie zmienne podczas inicjowania: rozmiar zwykłego zasobnika będzie miał dodany do niego jeden dodatkowy wiersz. Obie zmienne są oparte na rozmiarze bieżącej partycji. Podczas procesu obliczania funkcja śledzi bieżący numer wiersza, bieżący numer zasobnika i numer wiersza, w którym zasobnik zmieni się (bucketThreshold). Gdy bieżąca liczba wierszy osiągnie próg zasobnika, wartość zasobnika jest zwiększana o jeden, a próg jest zwiększany przez rozmiar zasobnika (plus jeden dodatkowy, jeśli jest wypełniony bieżący zasobnik).
Rank Oblicza rangę wartości w grupie wartości określonych w kolejności okna według klauzuli. Wynik jest jednym plus liczbą wierszy poprzedzających lub równych bieżącemu wierszowi w kolejności partycji. Wartości spowodują luki w sekwencji. Funkcja Rank działa nawet wtedy, gdy dane nie są sortowane i szukają zmian w wartościach.
Rownumber Przypisuje sekwencyjne numerowanie wierszy dla wierszy w oknie rozpoczynającym się od 1.