Проектирование потока данных пакета

Поток данных в пакете служб Integration Services создается с использованием различных типов элементов потока данных: источники извлекают данные, преобразования изменяют и объединяют данные, целевые объекты загружают данные, а пути соединяют выходы и входы компонентов потока данных, формируя поток данных.

Перед созданием потока данных пакет должен содержать хотя бы одну задачу потока данных. Дополнительные сведения см. в разделах Задача потока данных и Добавление задачи потока данных.

Поток данных пакета создается с помощью конструктора потоков данных в области конструктора на вкладке Поток данных конструктора SSIS.

Создание потока данных включает следующие шаги.

  • Добавление одного или более источников для извлечения данных из файлов и баз данных.

  • Добавление преобразований, удовлетворяющих бизнес-требования пакета. Поток данных не обязательно должен содержать преобразования.

  • Соединение компонентов потока данных путем соединения выходов источников и преобразований с входами преобразований и целевых объектов.

  • Добавление одного или более целевых объектов для загрузки данных в хранилища данных, такие как файлы и базы данных.

  • Настройка вывода данных об ошибках компонентов для обработки таких проблем, как ошибки или усечения значений данных.

Если поток данных включает в себя компоненты, подключающиеся к источникам данных, необходимо также добавить в пакет диспетчеры соединений. Диспетчеры соединений можно добавить либо с помощью конструктора потоков данных, либо на вкладках Поток управления или Обработчики событий.

ПримечаниеПримечание

При создании нового пакета можно воспользоваться мастером, который поможет правильно настроить диспетчеры соединений, источники и назначения. Дополнительные сведения см. в разделе Создание пакета с помощью мастера.

Конструктор SSIS также включает аннотации, которые можно использовать, чтобы сделать поток данных самодокументируемым.

Использование конструктора потоков данных

При активной вкладке Поток данных конструктор служб SSIS отображает область конструктора для создания потока данных пакета и область Диспетчеров соединений для добавления диспетчеров соединений, используемых в пакете. При этом область элементов изменяется таким образом, что в нем отображаются узлы Поток данных, Источники, Преобразования потока данных и Целевые объекты потока данных. 

На следующей диаграмме показан поток данных простого пакета в конструкторе потоков данных. Показанный на диаграмме поток данных состоит из источника с обычным выходом и выходом ошибок, двух преобразований и двух целевых объектов.

Вкладка «Поток данных» конструктора служб SSIS

Извлечение данных

Службы Integration Services обеспечивает различные источники для извлечения данных из различных типов источников данных. Используя источник данных служб Integration Services, можно извлекать данные из неструктурированных файлов, XML-файлов, книг Microsoft Excel и файлов, содержащих необработанные данные. Данные можно извлекать путем доступа к таблицам и представлениям баз данных, а также с помощью запросов. Дополнительные сведения см. в разделах Источники служб Integration Services и Извлечение данных из источников.

Для подключения к источникам данных источники используют диспетчеры соединений. Можно добавить и настроить диспетчер соединений при настройке источника или добавить необходимые для пакета диспетчеры соединений до начала создания потока данных.

Преобразование данных

Службы Integration Services обеспечивают разнообразие преобразований для изменения данных, выполнения операций бизнес-аналитики, а также разделения, копирования и слияния данных. Используя службы Integration Services преобразования, можно изменять значения в столбцах, выполнять поиск значений в таблицах, очищать данные и выполнять статистические вычисления по значениям столбцов. Дополнительные сведения см. в разделах Преобразования служб Integration Services и Преобразование данных с помощью преобразований.

Некоторые преобразования используют диспетчеры соединений. Например, преобразование «Уточняющий запрос» использует диспетчер соединений для подключения к базе данных, содержащей искомые данные. Диспетчер соединений можно добавить и настроить при настройке преобразования или добавить необходимые для пакета диспетчеры соединений до начала создания потока данных.

Загрузка данных

Integration Services предоставляет различные целевые объекты для загрузки данных в различные типы хранилищ данных. Используя целевой объект служб Integration Services, можно загружать данные в неструктурированные файлы, объединять аналитические объекты и предоставлять данные для других процессов. Данные можно загружать путем доступа к таблицам и представлениям баз данных, а также с помощью запросов. Дополнительные сведения см. в разделах Назначения служб Integration Services и Загрузка данных в целевые назначения.

Целевые объекты используют диспетчеры соединений для подключения к источникам данных. Можно добавить и настроить диспетчер соединений при настройке целевого объекта или добавить необходимые для пакета диспетчеры соединений до начала создания потока данных.

Связующие компоненты

Соединение компонентов потока данных осуществляется путем соединения выходов источников и преобразований с входами преобразований и целевых объектов. При создании потока данных обычно соединяются второй и последующие компоненты — так же, как их добавляли к потоку данных. После соединения компонента входные столбцы могут быть использованы при настройке компонента. Когда нет доступных входных столбцов, настройка компонента завершится после его подсоединения к потоку данных. Дополнительные сведения см. в разделах Пути служб Integration Services и Соединение компонентов с путями.

Обработка ошибок данных

Многие источники, преобразования и целевые объекты служб Integration Services поддерживают выходы ошибок. Если компонент потока данных поддерживает выход ошибок, можно управлять воздействием результатов усечений и ошибок в каждом столбце на поведение компонента в режиме выполнения. Выход ошибки может быть подсоединен к преобразованиям, что инициирует дополнительные преобразования или направляет данные в другой целевой объект. Дополнительные сведения см. в разделе Обработка ошибок в данных в потоке данных.

Добавление диспетчеров соединений

Многие компоненты потока данных подключаются к источниками данных. Добавить диспетчеры соединений, необходимые для компонентов пакета, следует до того, как компонент будет правильно настроен. Диспетчеры соединений можно добавить при создании потока данных или до начала его создания. Дополнительные сведения см. в разделах Соединения служб Integration Services и Добавление диспетчеров соединений.

Заметки

Конструктор служб SSIS включает поддержку заметок, которые можно добавить к потоку данных. Добавление заметок в области конструктора позволяет сделать пакеты самодокументируемыми. Дополнительные сведения см. в разделе Использование заметок в пакетах.

Внешние ресурсы

Презентация How Microsoft IT Leverages SQL Server 2008 SSIS Dataflow Engine Enhancements (на английском языке) на сайте sqlcat.com.

Значок служб Integration Services (маленький) Оставайтесь в курсе новых возможностей служб Integration Services

Чтобы получить новейшую документацию, статьи, образцы и видеоматериалы корпорации Майкрософт, а также лучшие решения участников сообщества, посетите страницу служб Integration Services на сайте MSDN:


Чтобы получать автоматические уведомления об этих обновлениях, подпишитесь на RSS-каналы, предлагаемые на этой странице.