сбор данных

Применимо к:SQL Server

Сборщик данных — это компонент SQL Server, который собирает различные наборы данных. Сбор данных выполняется постоянно или по расписанию, назначенному пользователем. Собранные данные сборщик данных сохраняет в реляционной базе данных, называемой хранилищем данных управления.

Что такое сборщик данных?

Сборщик данных — это основной компонент платформы сбора данных для SQL Server и средств, предоставляемых SQL Server. Он предоставляет единую централизованную точку сбора данных со всех серверов баз данных и приложений. Эта точка сбора может получать данные из различных источников и не ограничивается данными о производительности, в отличие от трассировки SQL.

Сборщик данных позволяет задавать область сбора данных в соответствии с требованиями тестовой и рабочей сред. Сборщик данных также использует хранилище данных, реляционную базу данных, которая предоставляет возможность управлять собираемыми данными, задавая различные сроки их хранения.

Сборщик данных поддерживает динамическую настройку сбора данных и его возможности можно расширить посредством API-интерфейса сборщика данных. Дополнительные сведения см. в статье Data Collector Programming.

На следующем рисунке показано, как сборщик данных соответствует общей стратегии сбора данных и управления данными в SQL Server.

Diagram of the data collector's role in data management.

Основные понятия

Сборщик данных интегрирован с агент SQL Server и службами Integration Services и использует как широкое использование. Прежде чем работать с сборщиком данных, необходимо понимать определенные понятия, связанные с каждым из этих компонентов SQL Server.

агент SQL Server используется для планирования и запуска заданий коллекции. Обратите внимание на следующие основные понятия:

  • Работа
  • Шаг задания
  • расписание заданий;
  • Подсистема
  • учетные записи-посредники.

Дополнительные сведения см. в статье "Автоматизированные задачи Администратор истации" (агент SQL Server).

Службы Integration Services (SSIS) используются для выполнения пакетов, которые собирают данные из отдельных поставщиков данных. Вы должны ознакомиться со следующими инструментами и понятиями служб SSIS:

  • Пакет SSIS
  • Конфигурация пакета служб SSIS

Дополнительные сведения см. в разделе Пакеты служб Integration Services (SSIS).

Терминология

Термин Description
Целевой объект Экземпляр ядро СУБД в выпуске SQL Server, поддерживающем сбор данных. Дополнительные сведения о поддерживаемых выпусках см. в разделе "Управляемость" выпусков и поддерживаемых функциях SQL Server 2022.

Целевой корневой элемент определяет поддерево в иерархии целей. Набор целей — это группа целей, получаемая в результате применения фильтра к поддереву, определенному целевым корневым элементом. Целевой корневой каталог может быть базой данных, экземпляром SQL Server или экземпляром компьютера.
Тип целевого объекта Тип цели, имеющий определенные характеристики и поведение. Например, целевой объект экземпляра SQL Server имеет характеристики, отличные от целевого объекта базы данных SQL Server.
Поставщик данных Известный источник данных, характерный для целевого типа, который предоставляет данные типу сборщика.
Тип сборщика Логическая оболочка для пакетов служб SSIS, которая предоставляет фактический механизм сбора данных и передачи его в хранилище данных управления.
Элемент коллекции Экземпляр типа сборщика. Элемент сбора создается с определенным набором входных свойств и частотой сбора.
Набор коллекций Группа элементов сбора. Набор сбора — это единица сбора данных, с которой пользователь может взаимодействовать через пользовательский интерфейс.
Режим сбора Способ, с помощью которого собираются и хранятся данные. В режиме сбора может применяться или не применяться кэширование. Режим с кэшированием обеспечивает непрерывный сбор, а режим без кэширования предназначен для нерегламентированного сбора или сбора моментального снимка.
Хранилище управляющих данных Реляционная база данных, используемая для хранения собранных данных.

На следующем рисунке показываются зависимости и связи между компонентами сборщика данных.

Diagram of data collector functional dependencies.

Как показано на рисунке, поставщик данных расположен вне сборщика данных и по определению имеет явную связь с целью. Поставщик данных относится к определенному целевому объекту (например, службе SQL Server, такой как реляционный механизм) и предоставляет такие данные, как системные представления в SQL Server, Монитор производительности счетчики и поставщики WMI, которые могут использоваться сборщиком данных.

Тип сборщика индивидуален для целевого типа и зависит от логической связи поставщика данных с целевым типом. Тип сборщика определяет, как данные будут собираться из конкретного поставщика данных (с помощью схематизированных параметров) и задает схему хранилища данных. Для хранения собранных данных необходимо наличие схемы поставщика данных и схемы хранилища. Тип сборщика также поставляет сведения о расположении хранилища управляющих данных, которое может располагаться на компьютере, выполняющем сбор данных, или на другом компьютере.

Показанный на рисунке элемент сбора — это экземпляр конкретного типа сборщика, параметризованный входными параметрами, например схемой XML типа сборщика. Все элементы сбора должны работать в одном и том же целевом корневом элементе либо в пустом целевом корневом элементе. Это дает сборщику данных возможность комбинировать типы сборщиков из операционной системы или из конкретного целевого корневого элемента, но не из разных целевых корневых элементов.

Элемент сбора имеет определенную частоту сбора, которая определяет, как часто будут собираться значения моментальных снимков. Хотя это стандартный блок для набора коллекций, элемент коллекции не может существовать самостоятельно.

Наборы сбора определяются и развертываются на экземпляре сервера и могут выполняться независимо друг от друга. Каждый набор сбора может быть применен к цели, которая подходит для целевых типов всех типов сборщика, являющихся частью этого набора сбора. Набор сборов выполняется агент SQL Server заданий или заданий, а данные передаются в хранилище данных управления в предопределенном расписании.

Все данные, собранные разными экземплярами внутри набора сбора, передаются в хранилище управляющих данных в соответствии с одним и тем же расписанием. Это расписание определяется как общее агент SQL Server расписание и может использоваться несколькими наборами коллекций. Набор коллекций включен или отключен в виде одной сущности; Элементы коллекции нельзя включить или отключить по отдельности.

При создании или обновлении набора коллекций можно настроить режим сбора данных и передать его в хранилище данных управления. Тип коллекции определяет тип планирования: кэшированный или не кэшированный. Если коллекция кэшируется, сбор данных и задачи отправки каждого запускаются в отдельном задании. Коллекция выполняется по расписанию, которое начинается при запуске агент SQL Server и выполняется по частоте, указанной в элементе коллекции. Передача выполняется в соответствии с расписанием, заданным пользователем.

Если установлен режим сбора без кэширования, то сбор и передача данных будут выполняться одним заданием, но в два шага. Шаг 1 — коллекция, а шаг 2 — отправка. Для сбора данных в нерегламентированном режиме расписание не требуется.

После включения набора сбора сбор данных может начаться либо в соответствии с расписанием, либо по запросу. При запуске сбора данных агент SQL Server создает процесс для сборщика данных, который, в свою очередь, загружает пакеты служб Integration Services для набора сборок. Элементы сбора, представляющие типы сбора, собирают данные у соответствующих поставщиков данных указанных целей. После завершения цикла сбора эти данные загружаются в хранилище данных управления.