Агрегатные функции в потоке данных для сопоставления

Статья
01/05/2024

Область применения:Фабрика данных Azure Azure Synapse Analytics

Совет

Попробуйте использовать фабрику данных в Microsoft Fabric, решение для аналитики с одним интерфейсом для предприятий. Microsoft Fabric охватывает все, от перемещения данных до обработки и анализа данных в режиме реального времени, бизнес-аналитики и отчетности. Узнайте, как бесплатно запустить новую пробную версию !

Потоки данных доступны в конвейерах как Фабрики данных Azure, так и Azure Synapse. Эта статья относится к потокам данных для сопоставления. Если вы не знакомы с преобразованиями, см. вводную статью Преобразование данных с помощью потока данных для сопоставления.

В следующих статьях приведены сведения об агрегатных функциях, поддерживаемых Фабрикой данных Azure и Azure Synapse Analytics в потоках данных для сопоставления.

Список агрегатных функций

Следующие функции доступны только в преобразованиях агрегатов, сводок, отмены свертывания и окон.

Агрегатная функция	Задача
approxDistinctCount	Возвращает приблизительное общее число различных значений для столбца. Необязательный второй параметр предназначен для управления ошибкой оценки.
avg	Возвращает среднее значение столбца.
avgIf	Возвращает среднее значение столбца на основе критериев.
collect	Собирает все значения выражения в агрегированной группе в массив. Во время этого процесса структуры можно собирать и преобразовывать в альтернативные структуры. Количество элементов будет равно количеству строк в этой группе и может содержать значения NULL. Количество собранных элементов должно быть небольшим.
collectUnique	Собирает все значения выражения в агрегированной группе в уникальный массив. Структуры можно собирать и преобразовывать в альтернативные структуры во время этого процесса. Число элементов будет меньше или равно числу строк в этой группе и может содержать значения NULL. Количество собранных элементов должно быть небольшим.
count	Возвращает совокупное количество значений. Если указан дополнительный столбец (столбцы), это выражение игнорирует значения NULL в операторе COUNT.
countAll	Получает совокупное количество значений, включая значения NULL.
countDistinct	Возвращает совокупное число различных значений набора столбцов.
countAllDistinct	Получает совокупное количество отдельных значений набора столбцов, включая значения NULL.
countIf	Возвращает совокупное количество значений на основе критериев. Если указан дополнительный столбец, выражение игнорирует значения NULL в операторе COUNT.
covariancePopulation	Возвращает ковариацию по всей совокупности значений двух столбцов.
covariancePopulationIf	Возвращает ковариацию по всей совокупности значений двух столбцов на основе критериев.
covarianceSample	Возвращает ковариацию выборки двух столбцов.
covarianceSampleIf	Возвращает ковариацию выборки двух столбцов на основе критериев.
first	Возвращает первое значение группы столбцов. Если второй параметр ignoreNulls опущен, считается, что он имеет значение false.
isDistinct	Определяет, является ли столбец или набор столбцов уникальным. Значение NULL не учитывается как отдельное значение
kurtosis	Возвращает эксцесс столбца.
kurtosisIf	Возвращает эксцесс столбца на основе критериев.
last	Возвращает последнее значение группы столбцов. Если второй параметр ignoreNulls опущен, считается, что он имеет значение false.
max	Возвращает максимальное значение столбца.
maxIf	Возвращает максимальное значение столбца на основе критериев.
mean	Возвращает среднее значение столбца. Аналогично оператору AVG.
meanIf	Возвращает среднее значение столбца на основе критериев. Аналогично оператору avgIf.
min	Возвращает минимальное значение столбца.
minIf	Возвращает минимальное значение столбца на основе критериев.
skewness	Возвращает асимметрию столбца.
skewnessIf	Возвращает асимметрию столбца на основе критериев.
stddev	Возвращает стандартное отклонение для столбца.
stddevIf	Возвращает стандартное отклонение для столбца на основе критериев.
stddevPopulation	Возвращает стандартное отклонение по всей совокупности значений столбца.
stddevPopulationIf	Возвращает стандартное отклонение по всей совокупности значений столбца на основе критериев.
stddevSample	Возвращает выборочное стандартное отклонение для столбца.
stddevSampleIf	Возвращает выборочное стандартное отклонение для столбца на основе критериев.
sum	Возвращает общую сумму числового столбца.
sumDistinct	Возвращает общую сумму различных значений числового столбца.
sumDistinctIf	Возвращает общую сумму числового столбца на основе критериев. Условие может быть основано на любом столбце.
sumIf	Возвращает общую сумму числового столбца на основе критериев. Условие может быть основано на любом столбце.
topN	Получает значения topN для этого столбца.
variance	Возвращает дисперсию столбца.
varianceIf	Возвращает дисперсию столбца на основе критериев.
variancePopulation	Возвращает дисперсию по всей совокупности значений столбца.
variancePopulationIf	Возвращает дисперсию по всей совокупности значений столбца на основе критериев.
varianceSample	Возвращает несмещенную дисперсию столбца.
varianceSampleIf	Возвращает несмещенную дисперсию столбца на основе критериев.

Список всех функций массивов.
Список всех функций кэшированного поиска.
Список всех функций преобразования.
Список всех функций даты и времени.
Список всех функций выражений.
Список всех функций сопоставления.
Список всех метафункций.
Список всех оконных функций.
Сведения об использовании всех выражений преобразования данных.
Создание выражений в потоке данных для сопоставления

Агрегатные функции в потоке данных для сопоставления

Список агрегатных функций

Связанный контент

Дополнительные ресурсы