Оператор top-hitterstop-hitters operator

Возвращает приближение первых N результатов (предполагая равномерное распределение входных данных).Returns an approximation of the first N results (assuming skewed distribution of the input).

T | top-hitters 25 of Page by Views 

Примечание

top-hitters — это алгоритм приближения, который должен использоваться при работе с большими данными.top-hitters is an approximation algorithm and should be used when running with large data. Приближение значения Top-hitters основано на алгоритме Count-min-эскиза .The approximation of the the top-hitters is based on the Count-Min-Sketch algorithm.

СинтаксисSyntax

T | top-hitters NumberOfRows of sort_key [ by Выражение sort_key T NumberOfRows]T | top-hitters NumberOfRows of sort_key [ by expression ]

АргументыArguments

  • NumberOfRows: число возвращаемых строк T .NumberOfRows: The number of rows of T to return. Можно указать любое числовое выражение.You can specify any numeric expression.
  • sort_key: имя столбца, по которому сортируются строки.sort_key: The name of the column by which to sort the rows.
  • выражение: (необязательно) выражение, которое будет использоваться для оценки Top-hitters.expression: (optional) An expression which will be used for the top-hitters estimation.
    • выражение: Top-hitters вернет строки NumberOfRows , которые имеют приблизительное максимальное значение Sum (выражение).expression: top-hitters will return NumberOfRows rows which have an approximated maximum of sum(expression). Выражение может быть столбцом или любым другим выражением, результатом вычисления которого является число.Expression can be a column, or any other expression that evaluates to a number.
    • Если выражение не упоминается, то алгоритм Top-hitters будет подсчитывать количество вхождений ключа сортировки.If expression is not mentioned, top-hitters algorithm will count the occurrences of the sort-key.

ПримерыExamples

Получение наиболее частых элементовGet most frequent items

В следующем примере показано, как найти топ-5 языков с большинством страниц в Википедии (доступ к которому осуществляется после апреля 2016).The next example shows how to find top-5 languages with most pages in Wikipedia (accessed after during April 2016).

PageViews
| where Timestamp > datetime(2016-04-01) and Timestamp < datetime(2016-05-01) 
| top-hitters 5 of Language 
ЯзыкLanguage approximate_count_Languageapproximate_count_Language
enen 15399541271539954127
zhzh 339827659339827659
dede 262197491262197491
ruru 227003107227003107
frfr 207943448207943448

Получение Top hitters на основе значения столбцаGet top hitters based on column value

В следующем примере показано, как найти наиболее просмотренные англоязычные страницы Википедии из 2016 года.The next example shows how to find most viewed English pages of Wikipedia of the year 2016. Запрос использует представления (целочисленное число) для вычисления популярности страницы (число представлений).The query uses 'Views' (integer number) to calculate page popularity (number of views).

PageViews
| where Timestamp > datetime(2016-01-01)
| where Language == "en"
| where Page !has 'Special'
| top-hitters 10 of Page by Views
СтраницаPage approximate_sum_Viewsapproximate_sum_Views
Main_PageMain_Page 13258567541325856754
Web_scrapingWeb_scraping 4397915343979153
Java_ (programming_language)Java_(programming_language) 1648949116489491
United_StatesUnited_States 1392884113928841
ВикипедииWikipedia 1358491513584915
Donald_TrumpDonald_Trump 1237644812376448
YouTubeYouTube 1191725211917252
The_Revenant_ (2015_film)The_Revenant_(2015_film) 1071426310714263
Star_Wars: _The_Force_AwakensStar_Wars:_The_Force_Awakens 97706539770653
Портал: Current_eventsPortal:Current_events 95780009578000