Поделиться через


Преобразование окна в потоке данных для сопоставления

Область применения:Фабрика данных Azure Azure Synapse Analytics

Совет

Попробуйте использовать фабрику данных в Microsoft Fabric, решение для аналитики с одним интерфейсом для предприятий. Microsoft Fabric охватывает все, от перемещения данных до обработки и анализа данных в режиме реального времени, бизнес-аналитики и отчетности. Узнайте, как бесплатно запустить новую пробную версию !

Потоки данных доступны в конвейерах как Фабрики данных Azure, так и Azure Synapse. Эта статья относится к потокам данных для сопоставления. Если вы не знакомы с преобразованиями, см. вводную статью Преобразование данных с помощью потока данных для сопоставления.

Преобразование окна позволяет определять агрегирования столбцов на основе окон в ваших потоках данных. В построителе выражений вы можете определить различные типы объединений на основе данных или временных окон (предложение SQL OVER, например LEAD, LAG, NTILE, CUMEDIST, RANK и т. д.). В ваших выходных данных будет сгенерировано новое поле, которое будет включать такие агрегаты. Вы также можете включить дополнительные поля "Группировать по".

Screenshot shows Windowing selected from the menu.

Более

Задайте секционирование данных столбцов для своего преобразования окна. Эквивалент в SQL — это параметр Partition By в предложении Over в SQL. Если вы хотите создать расчет или выражение для секционирования, вы можете сделать это, наведя курсор на имя столбца и выбрав "Вычисляемый столбец".

Screenshot shows Windowing Settings with the Over tab selected.

Сортировать

Еще одна функция предложения Over —это установка параметра Order By. Он задает порядок сортировки данных. Вы также можете создать выражение для значения расчета в этом поле столбца для сортировки.

Screenshot shows Windowing Settings with the Sort tab selected.

Range By

Затем задайте для рамки окна параметр "Неограниченная" или "Ограниченная". Чтобы сделать рамку окна неограниченной, установите ползунок в положение "Неограниченная" с двух концов. Если вы выберете вариант между положениями "Неограниченная" и "Текущая строка", вам нужно задать начальное и конечное значение смещения. Оба значения должны быть положительными целыми числами. Вы можете использовать относительные числа или значения из своих данных.

Ползунок окна задает два значения: значения перед текущей строкой и значения после текущей строки. Начальное и конечное значения смещения соответствуют двум селекторам на ползунке.

Screenshot shows Windowing Settings with the Range by tab selected.

Столбцы окна

Наконец, с помощью построителя выражений определите объединения, которые вы хотите использовать с окнами данных, например RANK, COUNT, MIN, MAX, DENSE RANK, LEAD, LAG и т. д.

Screenshot shows the result of the windowing action.

Полный список агрегатных и аналитических функций, которые доступны для использования в языке выражений потоков данных ADF в построителе выражений, приведен в разделе Выражения преобразования данных в потоке данных для сопоставления.

Если вам требуется простое агрегирование по группам, используйте преобразование "Статистическая обработка".