Создание подключения к данным Сетки событий для Azure Data Explorer

В этой статье вы узнаете, как принимать большие двоичные объекты из вашей учетной записи хранения в Azure Data Explorer с помощью подключения к данным Сетки событий. Вы создадите подключение к данным Сетки событий, которое задает подписку Сетка событий Azure. Подписка на сетку событий направляет события из вашей учетной записи хранения в Azure Data Explorer через Центры событий Azure.

Примечание

Максимальный размер принимаемого файла составляет 6 ГБ. Для приема мы советуем файлы размером от 100 МБ до 1 ГБ.

Сведения о том, как создать подключение с помощью пакетов SDK Для Kusto, см. в статье Создание подключения к данным Сетки событий с помощью пакетов SDK.

Общие сведения о передаче данных в Azure Data Explorer из сетки событий см. в разделе Подключение к сетке событий.

Примечание

Чтобы добиться максимальной производительности с помощью подключения к Сетке событий, задайте rawSizeBytes свойство приема с помощью метаданных большого двоичного объекта. Дополнительные сведения см. в разделе Свойства приема.

Предварительные требования

Создание подключения к данным в Сетке событий

В этом разделе описано, как установить подключение между Сеткой событий и таблицей azure Data Explorer.

  1. Перейдите к кластеру azure Data Explorer в портал Azure.

  2. В разделе Данные выберите Базы данных>TestDatabase.

    Снимок экрана: раздел базы данных кластера со списком баз данных, которые он содержит.

  3. В разделе Параметры выберите Подключения к данным, а затем — Добавить сетку событий подключения к> данным(хранилище BLOB-объектов).

    Снимок экрана: страница подключений к данным. Выделен параметр для добавления подключения к данным.

  4. Заполните форму подключения к данным Сетки событий, указав следующие сведения:

    Снимок экрана: панель

    Параметр Рекомендуемое значение Описание поля
    Имя подключения к данным test-grid-connection Имя создаваемого подключения в Azure Data Explorer. Имена подключений к данным могут содержать только буквенно-цифровые, тире и точечные символы и содержать до 40 символов.
    Подписка учетной записи хранения идентификатор подписки; Идентификатор подписки, в которой находится ваша учетная запись хранения.
    Тип события Созданный BLOB-объект или переименованный BLOB-объект Тип события, запускающего загрузку. Переименование BLOB-объектов поддерживается только для хранилища ADLSv2. Чтобы переименовать большой двоичный объект, перейдите к большому двоичному объекту в портал Azure, щелкните его правой кнопкой мыши и выберите команду Переименовать. Поддерживаемые типы: Microsoft.Storage.BlobCreated или Microsoft.Storage.BlobRenamed.
    Учетная запись хранения gridteststorage1 Имя созданной ранее учетной записи хранения.
    Создание ресурсов Automatic (Автоматический) Включение автоматического создания ресурсов означает, что azure Data Explorer создает подписку сетки событий, пространство имен Центров событий и Центры событий. В противном случае необходимо создать эти ресурсы вручную, чтобы обеспечить создание подключения к данным. См. раздел Создание ресурсов вручную для приема Сетки событий.
    1. При необходимости можно отслеживать определенные темы Сетки событий. Настройте фильтры для получения уведомлений следующим образом:

      • Поле Префикс — это буквальный префикс темы. Так как шаблон начинается с, он может охватывать несколько контейнеров, папок или BLOB-объектов. Подстановочные знаки не допускаются.
        • Чтобы определить фильтр для контейнера больших двоичных объектов, поле должно быть установлено следующим образом: /blobServices/default/containers/[container prefix].
        • Чтобы определить фильтр для префикса большого двоичного объекта (или папки в Azure Data Lake 2 поколения), поле должно быть установлено следующим образом: /blobServices/default/containers/[container name]/blobs/[folder/blob prefix].
      • Поле суффикс — это буквальный суффикс большого двоичного объекта. Подстановочные знаки не допускаются.
      • Поле С учетом регистра указывает, учитываются ли фильтры префикса и суффикса.

      Дополнительные сведения о фильтрации событий см. в разделе События хранилища BLOB-объектов.

    2. При необходимости можно указать параметры маршрутизации данных в соответствии со следующими сведениями. Вам не нужно указывать все параметры маршрутизации данных. Принимаются также частично заполненные параметры.

      Параметр Рекомендуемое значение Описание поля
      Разрешить маршрутизацию данных в другие базы данных (подключение данных к нескольким базам данных) Не разрешать Включите этот параметр, если вы хотите переопределить целевую базу данных по умолчанию, связанную с подключением к данным. Дополнительные сведения о маршрутизации в базы данных см. в разделе Маршрутизация событий.
      Имя таблицы TestTable Таблица, созданная в базе данных TestDatabase.
      Формат данных JSON Поддерживаемые форматы: APACHEAVRO, Avro, CSV, JSON, ORC, PARQUET, PSV, RAW, SCSV, SOHSV, TSV, TSVE, TXT и W3CLOG. Поддерживаются форматы сжатия ZIP и GZIP.
      Имя сопоставления TestTable_mapping Сопоставление, созданное в таблице TestDatabase, которое сопоставляет входящие данные с именами столбцов и типами данных TestTable. Если значение не указано, сопоставление данных идентификации , производное от схемы таблицы, создается автоматически.
      Пропуск ошибок формата Пропуск Включите этот параметр, если вы хотите игнорировать ошибки формата для формата данных JSON.

      Примечание

      Имена таблиц и сопоставлений чувствительны к регистру.

    3. При необходимости в разделе Дополнительные параметры можно указать тип управляемого удостоверения , который используется подключением к данным. По умолчанию выбран параметр Назначаемый системой .

      При выборе параметра Назначаемое пользователем необходимо вручную назначить управляемое удостоверение. Если выбрать пользователя, который еще не назначен кластеру, он будет назначен автоматически. Дополнительные сведения см. в статье Настройка управляемых удостоверений для кластера Azure Data Explorer.

      Если выбрать нет, то учетная запись хранения и концентратор событий проходят проверку подлинности с помощью строк подключения. Этот метод не рекомендуется.

      Снимок экрана: раздел дополнительных параметров, показывающий типы управляемых удостоверений, которые можно использовать для подключения к данным.

  5. Выберите Создать.

Использование подключения к данным Сетки событий

В этом разделе показано, как активировать прием из Хранилище BLOB-объектов Azure или Azure Data Lake 2-го поколения в кластер после создания или переименования BLOB-объекта.

Выберите соответствующую вкладку в зависимости от типа пакета SDK хранилища, используемого для отправки BLOB-объектов.

В следующем примере кода используется пакет SDK для Хранилище BLOB-объектов Azure для отправки файла в Хранилище BLOB-объектов Azure. Отправка активирует подключение к данным Сетки событий, которое передает данные в azure Data Explorer.

var azureStorageAccountConnectionString = <storage_account_connection_string>;
var containerName = <container_name>;
var blobName = <blob_name>;
var localFileName = <file_to_upload>;
var uncompressedSizeInBytes = <uncompressed_size_in_bytes>;
var mapping = <mapping_reference>;
// Create a new container if it not already exists.
var azureStorageAccount = new BlobServiceClient(azureStorageAccountConnectionString);
var container = azureStorageAccount.GetBlobContainerClient(containerName);
container.CreateIfNotExists();
// Define blob metadata and uploading options.
IDictionary<String, String> metadata = new Dictionary<string, string>();
metadata.Add("rawSizeBytes", uncompressedSizeInBytes);
metadata.Add("kustoIngestionMappingReference", mapping);
var uploadOptions = new BlobUploadOptions
{
    Metadata = metadata,
};
// Upload the file.
var blob = container.GetBlobClient(blobName);
blob.Upload(localFileName, uploadOptions);

Примечание

Azure Data Explorer не удаляет прием сообщений больших двоичных объектов. Храните большие двоичные объекты в течение трех-пяти дней, используя жизненный цикл хранилища BLOB-объектов Azure для управления удалением больших двоичных объектов.

Примечание

Активация приема после CopyBlob операции не поддерживается для учетных записей хранения, в которых включена функция иерархического пространства имен.

Удаление подключения к данным Сетки событий

Чтобы удалить подключение к Сетке событий из портал Azure, выполните следующие действия.

  1. Перейдите в кластер. В меню слева выберите Базы данных. Затем выберите базу данных, содержащую целевую таблицу.
  2. В меню слева выберите Подключения к данным. Затем установите флажок рядом с соответствующим подключением к данным Сетки событий.
  3. В верхней строке меню выберите Удалить.