Источник "Гибкая работа с файлами"

Применимо к: SQL Server Integration Runtime служб SSIS в Фабрика данных Azure

Источник Гибкая работа с файлами позволяет пакету служб SSIS считывать данные из различных поддерживаемых служб хранилища. Сейчас поддерживаются службы хранилища

Чтобы отобразить редактор источника "Гибкая работа с файлами", перетащите источник Гибкая работа с файлами в конструктор потока данных и дважды щелкните его, чтобы открыть редактор.

Источник Гибкая работа с файлами входит в состав пакета дополнительных компонентов SQL Server Integration Services (SSIS) для Azure.

Доступны следующие свойства редактора "Гибкая работа с файлами".

  • Тип диспетчера соединений с файлами. Определяет тип диспетчера подключений к источникам. Затем выберите один из указанных типов или создайте новый.
  • Путь к папке. Указывает путь к папке источника.
  • Имя файла. Указывает имя файла источника.
  • Формат файла. Указывает формат файла источника. Поддерживаемые форматы: текст, Avro, ORC, Parquet. Java требуется для ORC/Parquet. Подробные сведения см. здесь.
  • Знак-разделитель столбцов. Указывает символ, используемый в качестве разделителя столбцов (многосимвольные разделители не поддерживаются).
  • Использовать первую строку в качестве имен столбцов. Указывает, следует ли рассматривать первую строку как имена столбцов.
  • Распаковать файл. Указывает, нужно ли распаковать исходный файл.
  • Тип сжатия. Указывает формат сжатия для файла источника. Поддерживаемые форматы: GZIP, DEFLATE, BZIP2.

Доступны следующие свойства расширенного редактора.

  • rowDelimiter: символ, используемый для разделения строк в файле. Допускается только один знак. Значение по умолчанию — \r\n.
  • escapeChar: Специальный символ, используемый для экранирования разделителя столбцов в содержимом входного файла. Не следует указывать escapeChar и quoteChar для таблицы одновременно. Допускается только один знак. Нет значения по умолчанию.
  • quoteChar: Символ, используемый для заключения строкового значения в кавычки. Разделители столбцов и строк внутри знаков кавычек будут рассматриваться как часть строкового значения. Это свойство применяется к входному и выходному наборам данных. Не следует указывать escapeChar и quoteChar для таблицы одновременно. Допускается только один знак. Нет значения по умолчанию.
  • nullValue: один или несколько символов, используемых для представления значения NULL. Значением по умолчанию является \N.
  • encodingName: задает имя кодировки. См. раздел Encoding.EncodingName.
  • skipLineCount: указывает количество непустых строк, которые нужно пропустить при чтении данных из входных файлов. Если указаны skipLineCount и firstRowAsHeader, то сначала пропускаются строки, а затем считываются данные заголовка из входного файла.
  • treatEmptyAsNull: Указывает, следует ли интерпретировать NULL или пустую строку как значение NULL при считывании данных из входного файла. Значение по умолчанию — true.

Указав сведения о соединении, переключитесь на страницу Столбцы, чтобы сопоставить столбцы источника со столбцами назначения для потока данных служб SSI.

Примечания о настройке разрешений для субъекта-службы

Для работы тестового подключения (к хранилищу BLOB-объектов или Data Lake Storage 2-го поколения) субъекту-службе следует назначить по крайней мере роль Читатель данных в хранилище BLOB-объектов в учетной записи хранения. Это осуществляется посредством управление доступом на основе ролей (RBAC).

Для хранилища BLOB-объектов разрешение на чтение предоставляется путем назначения по крайней мере роли Читатель данных в хранилище BLOB-объектов.

Для Data Lake Storage 2-го поколения разрешение определяется как посредством управления доступом на основе ролей (RBAC), так и с помощью списков управления доступом (ACL). Обратите внимание на то, что списки ACL настраиваются с помощью идентификатора объекта (OID) субъекта-службы для регистрации приложения, как описано здесь. Для конфигурации RBAC, напротив, используется идентификатор приложения (клиента). Когда субъекту безопасности предоставляются разрешения на данные RBAC посредством встроенной или пользовательской роли, эти разрешения сначала оцениваются при авторизации запроса. Если запрошенная операция разрешена в соответствии с назначенными субъекту безопасности ролями RBAC, авторизация происходит немедленно и дополнительные проверки ACL не проводятся. Если же субъекту безопасности роль RBAC не назначена или если запрошенная операция не соответствует предоставленному разрешению, проводятся проверки ACL, цель которых — определить, разрешено ли субъекту безопасности выполнять запрошенную операцию. Для разрешения на чтение необходимо предоставить по крайней мере разрешение на выполнение начиная с исходной файловой системы, а также разрешение на чтение целевых файлов. Можно также предоставить разрешение не ниже чтения данных из хранилища BLOB-объектов с помощью RBAC. Подробные сведения см. в этой статье.