Агрегатные функции в потоке данных для сопоставления

Область применения:Фабрика данных Azure Azure Synapse Analytics

Совет

Попробуйте использовать фабрику данных в Microsoft Fabric, решение для аналитики с одним интерфейсом для предприятий. Microsoft Fabric охватывает все, от перемещения данных до обработки и анализа данных в режиме реального времени, бизнес-аналитики и отчетности. Узнайте, как бесплатно запустить новую пробную версию !

Потоки данных доступны в конвейерах как Фабрики данных Azure, так и Azure Synapse. Эта статья относится к потокам данных для сопоставления. Если вы не знакомы с преобразованиями, см. вводную статью Преобразование данных с помощью потока данных для сопоставления.

В следующих статьях приведены сведения об агрегатных функциях, поддерживаемых Фабрикой данных Azure и Azure Synapse Analytics в потоках данных для сопоставления.

Список агрегатных функций

Следующие функции доступны только в преобразованиях агрегатов, сводок, отмены свертывания и окон.

Агрегатная функция Задача
approxDistinctCount Возвращает приблизительное общее число различных значений для столбца. Необязательный второй параметр предназначен для управления ошибкой оценки.
avg Возвращает среднее значение столбца.
avgIf Возвращает среднее значение столбца на основе критериев.
collect Собирает все значения выражения в агрегированной группе в массив. Во время этого процесса структуры можно собирать и преобразовывать в альтернативные структуры. Количество элементов будет равно количеству строк в этой группе и может содержать значения NULL. Количество собранных элементов должно быть небольшим.
collectUnique Собирает все значения выражения в агрегированной группе в уникальный массив. Структуры можно собирать и преобразовывать в альтернативные структуры во время этого процесса. Число элементов будет меньше или равно числу строк в этой группе и может содержать значения NULL. Количество собранных элементов должно быть небольшим.
count Возвращает совокупное количество значений. Если указан дополнительный столбец (столбцы), это выражение игнорирует значения NULL в операторе COUNT.
countAll Получает совокупное количество значений, включая значения NULL.
countDistinct Возвращает совокупное число различных значений набора столбцов.
countAllDistinct Получает совокупное количество отдельных значений набора столбцов, включая значения NULL.
countIf Возвращает совокупное количество значений на основе критериев. Если указан дополнительный столбец, выражение игнорирует значения NULL в операторе COUNT.
covariancePopulation Возвращает ковариацию по всей совокупности значений двух столбцов.
covariancePopulationIf Возвращает ковариацию по всей совокупности значений двух столбцов на основе критериев.
covarianceSample Возвращает ковариацию выборки двух столбцов.
covarianceSampleIf Возвращает ковариацию выборки двух столбцов на основе критериев.
first Возвращает первое значение группы столбцов. Если второй параметр ignoreNulls опущен, считается, что он имеет значение false.
isDistinct Определяет, является ли столбец или набор столбцов уникальным. Значение NULL не учитывается как отдельное значение
kurtosis Возвращает эксцесс столбца.
kurtosisIf Возвращает эксцесс столбца на основе критериев.
last Возвращает последнее значение группы столбцов. Если второй параметр ignoreNulls опущен, считается, что он имеет значение false.
max Возвращает максимальное значение столбца.
maxIf Возвращает максимальное значение столбца на основе критериев.
mean Возвращает среднее значение столбца. Аналогично оператору AVG.
meanIf Возвращает среднее значение столбца на основе критериев. Аналогично оператору avgIf.
min Возвращает минимальное значение столбца.
minIf Возвращает минимальное значение столбца на основе критериев.
skewness Возвращает асимметрию столбца.
skewnessIf Возвращает асимметрию столбца на основе критериев.
stddev Возвращает стандартное отклонение для столбца.
stddevIf Возвращает стандартное отклонение для столбца на основе критериев.
stddevPopulation Возвращает стандартное отклонение по всей совокупности значений столбца.
stddevPopulationIf Возвращает стандартное отклонение по всей совокупности значений столбца на основе критериев.
stddevSample Возвращает выборочное стандартное отклонение для столбца.
stddevSampleIf Возвращает выборочное стандартное отклонение для столбца на основе критериев.
sum Возвращает общую сумму числового столбца.
sumDistinct Возвращает общую сумму различных значений числового столбца.
sumDistinctIf Возвращает общую сумму числового столбца на основе критериев. Условие может быть основано на любом столбце.
sumIf Возвращает общую сумму числового столбца на основе критериев. Условие может быть основано на любом столбце.
topN Получает значения topN для этого столбца.
variance Возвращает дисперсию столбца.
varianceIf Возвращает дисперсию столбца на основе критериев.
variancePopulation Возвращает дисперсию по всей совокупности значений столбца.
variancePopulationIf Возвращает дисперсию по всей совокупности значений столбца на основе критериев.
varianceSample Возвращает несмещенную дисперсию столбца.
varianceSampleIf Возвращает несмещенную дисперсию столбца на основе критериев.