Compartilhar via


Plug-in basket

O basket plug-in localiza padrões frequentes de atributos nos dados e retorna os padrões que passam um limite de frequência nesses dados. Um padrão representa um subconjunto das linhas que têm o mesmo valor em uma ou mais colunas. O basket plug-in é baseado no algoritmo Apriori originalmente desenvolvido para mineração de dados de análise de cesta.

Syntax

T | evaluatebasket([ Limite,WeightColumn,MaxDimensions,CustomWildcard,CustomWildcard, ... ])

Saiba mais sobre as convenções de sintaxe.

Parâmetros

Nome Tipo Obrigatório Descrição
Limite long Um double no intervalo de 0,015 a 1 que define a taxa mínima das linhas a ser considerada frequente. Padrões com uma taxa menor não serão retornados. O valor padrão é 0,05. Para usar o valor padrão, insira o bloco: ~.

Exemplo: T | evaluate basket(0.02)
WeightColumn string O nome da coluna a ser usado para considerar cada linha na entrada de acordo com o peso especificado. Deve ser um nome de uma coluna de tipo numérico, como int, long, real. Por padrão, cada linha tem um peso de 1. Para usar o valor padrão, insira o bloco: ~. Um uso comum de uma coluna de peso é para amostragem de conta ou agregação/segmentação de dados já incorporados a cada linha.

Exemplo: T | evaluate basket('~', sample_Count)
MaxDimensions int Define o número máximo de dimensões não relacionadas por cesta, limitadas por padrão, para minimizar o runtime de consulta. O padrão é 5. Para usar o valor padrão, insira o bloco: ~.

Exemplo: T | evaluate basket('~', '~', 3)
CustomWildcard string Define o valor do curinga como um tipo específico na tabela de resultados, que indicará que o padrão atual não tem uma restrição para essa coluna. O padrão é null exceto para colunas de cadeia de caracteres cujo valor padrão é uma cadeia de caracteres vazia. Se o padrão for um bom valor nos dados, um valor curinga diferente deverá ser usado, como *. Para usar o valor padrão, insira o bloco: ~.

Exemplo: T | evaluate basket('~', '~', '~', '*', int(-1), double(-1), long(0), datetime(1900-1-1))

Observação

Para especificar um parâmetro opcional que segue um parâmetro opcional, certifique-se de fornecer um valor para o parâmetro opcional anterior. Para obter mais informações, consulte Trabalhando com parâmetros opcionais.

Retornos

O basket plug-in retorna padrões frequentes que passam um limite de taxa. O limite padrão é 0,05.

Cada padrão é representado por uma linha nos resultados. A primeira coluna é a ID do segmento. As próximas duas colunas são a contagem e o percentual de linhas, da consulta original que correspondem ao padrão. As colunas restantes estão relacionadas à consulta original, com um valor específico da coluna ou um valor curinga, que é nulo por padrão, o que significa um valor variável.

Observação

O algoritmo usa amostragem para determinar os valores frequentes iniciais. Portanto, os resultados podem ser ligeiramente diferentes entre várias execuções para padrões cuja frequência está próxima do limite.

Exemplo

StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2)

Saída

SegmentId Contagem Porcentagem Estado EventType Danos DamageCrops
0 4574 77.7 Não 0
1 2278 38.7 Granizo Não 0
2 5675 96.4 0
3 2371 40.3 Granizo 0
4 1279 21.7 Thunderstorm Wind 0
5 2468 41.9 Granizo
6 1310 22,3 YES
7 1291 21.9 Thunderstorm Wind

Exemplo com curingas personalizados

StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2, '~', '~', '*', int(-1))

Saída

SegmentId Contagem Porcentagem Estado EventType Danos DamageCrops
0 4574 77.7 * * Não 0
1 2278 38.7 * Granizo Não 0
2 5675 96.4 * * * 0
3 2371 40.3 * Granizo * 0
4 1279 21.7 * Thunderstorm Wind * 0
5 2468 41.9 * Granizo * -1
6 1310 22,3 * * YES -1
7 1291 21.9 * Thunderstorm Wind * -1