Функции массива в потоке данных для сопоставления

Область применения:Фабрика данных Azure Azure Synapse Analytics

Совет

Попробуйте использовать фабрику данных в Microsoft Fabric, решение для аналитики с одним интерфейсом для предприятий. Microsoft Fabric охватывает все, от перемещения данных до обработки и анализа данных в режиме реального времени, бизнес-аналитики и отчетности. Узнайте, как бесплатно запустить новую пробную версию !

Потоки данных доступны в конвейерах как Фабрики данных Azure, так и Azure Synapse. Эта статья относится к потокам данных для сопоставления. Если вы не знакомы с преобразованиями, см. вводную статью Преобразование данных с помощью потока данных для сопоставления.

В следующих статьях приведены сведения о функциях массива, поддерживаемых Фабрикой данных Azure и Azure Synapse Analytics в потоках данных для сопоставления.

Список функций массива

Функции массива выполняют преобразование структур данных, которые являются массивами. К ним относятся специальные ключевые слова для указания элементов и индексов массива:

  • #acc представляет значение, которое необходимо включить в отдельные выходные данные при сокращении массива;
  • #index представляет текущий индекс массива вместе с номерами индексов массива #index2, #index3 ...;
  • #item представляет значение текущего элемента в массиве.
Функция массива Задача
array. Создает массив элементов. Все элементы должны быть одного типа. Если элементы не указаны, по умолчанию используется пустой массив строк. То же, что и оператор создания [].
at Находит элемент в индексе массива. Индекс основан на 1. Индекс вне допустимого диапазона возвращает значение NULL. Находит значение в сопоставлении с заданным ключом. Если ключ не найден, возвращает значение NULL.
contains Возвращает значение true, если какой-либо элемент в указанном массиве оценивается как true в предоставленном предикате. Функция Contains ожидает ссылку на один элемент в функции предиката в качестве #item.
distinct Возвращает отдельный набор элементов из массива.
except Возвращает набор отличий одного массива от другого, удаляя дубликаты.
filter Фильтрует элементы массива, которые не соответствуют предоставленному предикату. Функция Filter ожидает ссылку на один элемент в функции предиката в качестве #item.
find Поиск первого элемента в массиве, соответствующего условию. Принимает функцию фильтра, в которой можно указать элемент массива как #item. Для глубоко вложенных сопоставлений можно ссылаться на родительские сопоставления, используя нотацию #item_n(#item_1, #item_2...).
flatten Сводит массив или массивы в единый массив. Массивы атомарных элементов возвращаются без изменений. Последний аргумент является необязательным, и его значение по умолчанию false для рекурсивного сведения при наличии более одного уровня вложенности.
в папке Проверяет, находится ли элемент в массиве.
intersect Возвращает набор пересечений различных элементов из 2 массивов.
map Сопоставляет каждый элемент массива с новым элементом, используя предоставленное выражение. Функция map ожидает ссылку на один элемент в функции выражения в качестве #item.
mapIf Условно сопоставляет массив с другим массивом с той же или меньшей длиной. Значения могут принадлежать к любому типу данных, включая structTypes. Принимает функцию сопоставления, в которой можно указать элемент массиве как #item, а текущий индекс как #index. Для глубоко вложенных сопоставлений можно ссылаться на родительские сопоставления, используя нотацию #item_[n](#item_1, #index_1...).
mapIndex Сопоставляет каждый элемент массива с новым элементом, используя предоставленное выражение. Функция map ожидает ссылку на один элемент в функции выражения в качестве #item, а также ссылку на индекс элемента в качестве #index.
mapLoop Перебирает от 1 до length, чтобы создать массив этой длины. Принимает функцию сопоставления, в которой можно указать индекс в массиве как #index. Для глубоко вложенных сопоставлений можно ссылаться на родительские сопоставления, используя нотацию #index_n(#index_1, #index_2...).
reduce Накапливает элементы в массиве. Функция reduce ожидает ссылку на аккумулятор и один элемент в первой функции выражения в качестве #acc и #item и ожидает, что результирующее значение #result будет использоваться во второй функции выражения.
size Определяет размер массива или типа сопоставления.
slice Извлекает подмножество массива из позиции. Позиция отсчитывается от единицы. Если длина опущена, то по умолчанию позиция отсчитывается от конца строки.
sort Сортирует массив, используя предоставленную функцию предиката. Функция sort ожидает ссылку на два последовательных элемента в функции выражения в качестве #item1 и #item2.
unfold Разворачивает массив в набор строк и повторяет значения для оставшихся столбцов в каждой строке
union Возвращает набор объединения различных элементов из 2 массивов.