Plug-in basketbasket plugin

T | evaluate basket()

Basket trova tutti i modelli frequenti di attributi discreti (dimensioni) nei dati.Basket finds all frequent patterns of discrete attributes (dimensions) in the data. Restituisce quindi i modelli frequenti che hanno superato la soglia di frequenza nella query originale.It then returns the frequent patterns that passed the frequency threshold in the original query. Per il basket è garantita l'individuazione di ogni modello frequente nei dati, ma non è garantito il runtime polinomiale.Basket is guaranteed to find every frequent pattern in the data, but isn't guaranteed to have polynomial runtime. Il runtime della query è lineare nel numero di righe, ma potrebbe essere esponenziale nel numero di colonne (dimensioni).The runtime of the query is linear in the number of rows, but it might be exponential in the number of columns (dimensions). Basket è basato sull'algoritmo Apriori sviluppato originariamente per il data mining di basket analysis.Basket is based on the Apriori algorithm originally developed for basket analysis data mining.

SintassiSyntax

T | evaluate basket(argomenti di)T | evaluate basket( arguments )

RestituisceReturns

Basket restituisce tutti i modelli frequenti visualizzati al di sopra della soglia di rapporto delle righe.Basket returns all frequent patterns appearing above the ratio threshold of the rows. La soglia predefinita è 0,05.The default threshold is 0.05. Ogni modello è rappresentato da una riga nei risultati.Each pattern is represented by a row in the results.

La prima colonna è l'ID del segmento.The first column is the segment ID. Le due colonne successive rappresentano il numero e la percentuale di righe dellaquery originale acquisite dal modello.The next two columns are the count and percentage of rows, from the original query, that are captured by the pattern. Le colonne rimanenti provengono dalla query originale.The remaining columns are from the original query. Il valore è un valore specifico della colonna o un valore jolly, che è per impostazione predefinita null, ovvero un valore di variabile.Their value is either a specific value from the column or a wildcard value, which is by default null, meaning a variable value.

Argomenti (tutti facoltativi)Arguments (all optional)

T | evaluate basket([Threshold, WeightColumn, MaxDimensions, CustomWildcard, CustomWildcard,...])T | evaluate basket([Threshold, WeightColumn, MaxDimensions, CustomWildcard, CustomWildcard, ...])

Tutti gli argomenti sono facoltativi, ma devono essere ordinati come riportato sopra.All arguments are optional, but they must be ordered as above. Per indicare che deve essere usato il valore predefinito, usare il valore tilde stringa-"~".To indicate that the default value should be used, use the string tilde value - '~'. Vedere gli esempi di seguito.See examples below.

Argomenti disponibili:Available arguments:

  • Soglia-0,015 < double < 1 [valore predefinito: 0,05]Threshold - 0.015 < double < 1 [default: 0.05]

    Imposta il rapporto minimo delle righe da considerare frequente.Sets the minimal ratio of the rows to be considered frequent. Non verranno restituiti modelli con un rapporto di dimensioni inferiori.Patterns with a smaller ratio won't be returned.

    Esempio: T | evaluate basket(0.02)Example: T | evaluate basket(0.02)

  • WeightColumn - column_nameWeightColumn - column_name

    Considera ogni riga nell'input in base al peso specificato.Considers each row in the input according to the specified weight. Per impostazione predefinita, ogni riga ha un peso pari a "1".By default, each row has a weight of '1'. L'argomento deve essere un nome di una colonna numerica, ad esempio int, Long, Real.The argument must be a name of a numeric column, such as int, long, real. Un utilizzo comune di una colonna di ponderazione consiste nel prendere in considerazione il campionamento o il bucket/aggregazione dei dati già incorporati in ogni riga.A common use of a weight column, is to take into account sampling or bucketing/aggregation of the data that is already embedded into each row.

    Esempio: T | evaluate basket('~', sample_Count)Example: T | evaluate basket('~', sample_Count)

  • MaxDimensions-1 < int [valore predefinito: 5]MaxDimensions - 1 < int [default: 5]

    Imposta il numero massimo di dimensioni non correlate per ogni cestino, limitato per impostazione predefinita, per ridurre al minimo il runtime di query.Sets the maximal number of uncorrelated dimensions per basket, limited by default, to minimize the query runtime.

    Esempio: T | evaluate basket('~', '~', 3)Example: T | evaluate basket('~', '~', 3)

  • CustomWildcard- "any_value_per_type"CustomWildcard - "any_value_per_type"

    Imposta il valore del carattere jolly per un tipo specifico nella tabella dei risultati, che indica che il criterio corrente non prevede una restrizione su questa colonna.Sets the wildcard value for a specific type in the result table that will indicate that the current pattern doesn't have a restriction on this column. Il valore predefinito è null.Default is null. Il valore predefinito per una stringa è una stringa vuota.The default for a string is an empty string. Se il valore predefinito è un valore valido nei dati, è necessario utilizzare un valore jolly diverso, ad esempio * .If the default is a good value in the data, a different wildcard value should be used, such as *.

    Ad esempio:For example:

    T | evaluate basket('~', '~', '~', '*', int(-1), double(-1), long(0), datetime(1900-1-1))

EsempioExample

StormEvents 
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2)
SegmentIdSegmentId ConteggioCount PercentualePercent StateState EventTypeEventType DanniDamage DamageCropsDamageCrops
00 45744574 77.777.7 NONO 00
11 22782278 38.738.7 GrandineHail NONO 00
22 56755675 96.496.4 00
33 23712371 40.340.3 GrandineHail 00
44 12791279 21.721.7 Vento di tempestaThunderstorm Wind 00
55 24682468 41.941.9 GrandineHail
66 13101310 22.322.3 YESYES
77 12911291 21.921.9 Vento di tempestaThunderstorm Wind

Esempio con caratteri jolly personalizzatiExample with custom wildcards

StormEvents 
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2, '~', '~', '*', int(-1))
SegmentIdSegmentId ConteggioCount PercentualePercent StateState EventTypeEventType DanniDamage DamageCropsDamageCrops
00 45744574 77.777.7 * * NONO 00
11 22782278 38.738.7 * GrandineHail NONO 00
22 56755675 96.496.4 * * * 00
33 23712371 40.340.3 * GrandineHail * 00
44 12791279 21.721.7 * Vento di tempestaThunderstorm Wind * 00
55 24682468 41.941.9 * GrandineHail * -1-1
66 13101310 22.322.3 * * YESYES -1-1
77 12911291 21.921.9 * Vento di tempestaThunderstorm Wind * -1-1