Udostępnij za pośrednictwem


basket, wtyczka

Wtyczka basket znajduje częste wzorce atrybutów w danych i zwraca wzorce, które przechodzą próg częstotliwości w tych danych. Wzorzec reprezentuje podzestaw wierszy, które mają tę samą wartość w co najmniej jednej kolumnie. Wtyczka basket jest oparta na algorytmie Apriori opracowanym pierwotnie na potrzeby wyszukiwania danych analizy koszyka.

Składnia

T | evaluatebasket([ Próg,Kolumna wagowa,MaxDimensions,CustomWildcard,CustomWildcard, ... ])

Dowiedz się więcej o konwencjach składniowych.

Parametry

Nazwa Typ Wymagane Opis
Próg long Wartość double w zakresie od 0,015 do 1, która określa minimalny stosunek wierszy do częstego uznać. Wzorce o mniejszym współczynniku nie zostaną zwrócone. Wartość domyślna to 0,05. Aby użyć wartości domyślnej, wprowadź tyldę: ~.

Przykład: T | evaluate basket(0.02)
Kolumna wagowa string Nazwa kolumny do użycia do rozważenia każdego wiersza w danych wejściowych zgodnie z określoną wagą. Musi być nazwą kolumny typu liczbowego, takiej jak int, long, real. Domyślnie każdy wiersz ma wagę 1. Aby użyć wartości domyślnej, wprowadź tyldę: ~. Typowym zastosowaniem kolumny wagi jest uwzględnienie próbkowania lub zasobników/agregacji danych, które są już osadzone w każdym wierszu.

Przykład: T | evaluate basket('~', sample_Count)
MaxDimensions int Ustawia maksymalną liczbę niekorzystywalnych wymiarów na koszyk, ograniczony domyślnie, aby zminimalizować środowisko uruchomieniowe zapytania. Wartość domyślna to 5. Aby użyć wartości domyślnej, wprowadź tyldę: ~.

Przykład: T | evaluate basket('~', '~', 3)
CustomWildcard string Ustawia wartość symboli wieloznacznych dla określonego typu w tabeli wyników, która będzie wskazywać, że bieżący wzorzec nie ma ograniczenia dla tej kolumny. Wartość domyślna jest null wyjątkiem kolumn ciągów, których wartość domyślna jest pustym ciągiem. Jeśli wartość domyślna jest dobrą wartością w danych, należy użyć innej wartości wieloznacznych, takiej jak *. Aby użyć wartości domyślnej, wprowadź tyldę: ~.

Przykład: T | evaluate basket('~', '~', '~', '*', int(-1), double(-1), long(0), datetime(1900-1-1))

Uwaga

Aby określić opcjonalny parametr, który jest zgodny z opcjonalnym parametrem, upewnij się, że podano wartość dla poprzedniego opcjonalnego parametru. Aby uzyskać więcej informacji, zobacz Praca z opcjonalnymi parametrami.

Zwraca

Wtyczka basket zwraca częste wzorce, które przechodzą próg współczynnika. Domyślny próg to 0,05.

Każdy wzorzec jest reprezentowany przez wiersz w wynikach. Pierwsza kolumna to identyfikator segmentu. Następne dwie kolumny to liczba i procent wierszy z oryginalnego zapytania zgodnego ze wzorcem. Pozostałe kolumny odnoszą się do oryginalnego zapytania z określoną wartością z kolumny lub z wartością wieloznacznymi, która jest domyślnie null, co oznacza wartość zmiennej.

Uwaga

Algorytm używa próbkowania do określania początkowych częstych wartości. W związku z tym wyniki mogą nieznacznie różnić się między wieloma przebiegami dla wzorców, których częstotliwość jest zbliżona do progu.

Przykład

StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2)

Dane wyjściowe

Identyfikator segmentu Liczba Procent Stan Typ zdarzenia Uszkodzenia Szkody
0 4574 77.7 NO 0
1 2278 38.7 Grad NO 0
2 5675 96,4 0
3 2371 40.3 Grad 0
4 1279 21.7 Burza wiatru 0
5 2468 41.9 Grad
6 1310 22,3 TAK
7 1291 21.9 Burza wiatru

Przykład z niestandardowymi symbolami wieloznacznymi

StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2, '~', '~', '*', int(-1))

Dane wyjściowe

Identyfikator segmentu Liczba Procent Stan Typ zdarzenia Uszkodzenia DamageCrops
0 4574 77.7 * * NO 0
1 2278 38.7 * Grad NO 0
2 5675 96,4 * * * 0
3 2371 40.3 * Grad * 0
4 1279 21.7 * Burza z piorunami * 0
5 2468 41.9 * Grad * -1
6 1310 22,3 * * TAK -1
7 1291 21.9 * Burza z piorunami * -1