Ограничения службы "Когнитивный поиск Azure"

Максимальные ограничения хранилища, рабочих нагрузок, количества индексов и других объектов зависят от того, с какой ценовой категорией вы подготовили службу "Когнитивный поиск Azure": Бесплатный, Базовый, Стандартный или Оптимизировано для хранилища.

  • Бесплатный представляет собой мультитенантную службу, которая предоставляется вместе с подпиской Azure.

  • Базовый предоставляет выделенные вычислительные ресурсы для небольших рабочих нагрузок в рабочей среде, но вам придется делить часть сетевой инфраструктуры с другими арендаторами.

  • Для уровня Стандартный используются выделенные виртуальные машины. Это обеспечивает увеличение емкости хранилища и вычислительной мощности на всех уровнях. В категории "Стандартный" доступно четыре уровня: S1, S2, S3 и S3 HD (S3, высокая плотность). Уровень S3 HD (S3, высокая плотность) разработан для рабочих нагрузок с мультитенантностью и большим количеством небольших индексов (до трех тысяч индексов на каждую службу). Уровень S3 HD не поддерживает функцию индексатора, поэтому прием данных придется выполнять через API, которые отправляют данные из источника в индекс.

  • Оптимизировано для хранилища выполняется на выделенных компьютерах с более высокими объемами хранилища, пропускной способности хранилища и памяти, чем в категории Стандартный. Эта ценовая категория предназначена для больших и медленно меняющихся индексов. В категории "Оптимизировано для хранилища" доступно два уровня: L1 и L2.

Ограничения подписки

Вы можете создать несколько служб и ограничены только количеством служб, разрешенных на каждом уровне. Например, в рамках одной подписки можно создать до 16 служб на уровне "Базовый" и еще 16 служб на уровне S1. Дополнительные сведения см. в статье о выборе номера SKU или уровня для Когнитивного поиска Azure.

Максимальное количество служб можно увеличить по запросу. Если вам требуется больше служб для одной подписки, отправьте запрос на поддержку.

Ресурс Бесплатный1 Basic S1 S2 S3 S3 HD L1 L2
Максимальное число служб 1 16 16 8 6 6 6 6
Горизонтальное уменьшение масштаба: максимальное количество единиц поиска (ЕП)2 Недоступно 3 ЕП 36 ЕП 36 ЕП 36 ЕП 36 ЕП 36 ЕП 36 ЕП

1 Уровень «Бесплатный» основан на инфраструктуре, которая используется совместно с другими клиентами. Так как оборудование не является выделенным, вертикальное масштабирование на уровне «Бесплатный» не поддерживается.

2 Единицы поиска — это оплачиваемые единицы, выделяемые в виде реплик или секций. Оба ресурса необходимы для хранения данных, индексирования и операций запроса. Дополнительные сведения о вычислении единиц поиска см. в статье о масштабировании уровней ресурсов для рабочих нагрузок запросов и индексирования.

Ограничения хранилища

Возможности службы поиска ограничиваются дисковым пространством или аппаратным ограничением максимального количества индексов или документов (в зависимости от того, какое из ограничений достигается первым). Ограничения хранилища приведены в таблице ниже. См. ограничения максимального количества объектов по ресурсам.

Ресурс Бесплатный Базовый1 S1 S2 S3 S3 HD L1 L2
Соглашение об уровне обслуживания (SLA)2 Нет Да Да Да Да Да Да Да
Объем хранилища на секцию 50 MБ 2 ГБ 25 ГБ 100 ГБ 200 ГБ 200 ГБ 1 TБ 2 ТБ
Количество секций для службы Недоступно 1 12 12 12 3 12 12
Размер секции Недоступно 2 ГБ 25 ГБ 100 ГБ 200 ГБ 200 ГБ 1 TБ 2 ТБ
Реплики Недоступно 3 12 12 12 12 12 12

1 На уровне "Базовый" есть одна фиксированная секция. Дополнительные единицы поиска можно использовать для добавления реплик для больших объемов запросов.

2 Соглашения об уровне обслуживания предоставляются для оплачиваемых служб с выделенными ресурсами. Для бесплатных служб и предварительных версий функций соглашения об уровне обслуживания не предоставляются. Для оплачиваемых служб соглашения об уровне обслуживания предоставляются, если для службы обеспечена достаточная избыточность. Для предоставления соглашения об уровне обслуживания, предусматривающего создание запросов (чтение), требуется не менее двух реплик. Для предоставления соглашения об уровне обслуживания, предусматривающего создание запросов и индексацию (чтение и запись), требуется не менее трех реплик. При применении соглашения об уровне обслуживания не учитывается количество секций не учитывается.

Ограничения индексов

Ресурс Бесплатный Базовый 1 S1 S2 S3 S3 HD L1 L2
Максимальное число индексов 3 5 или 15 50 200 200 1000 на секцию или 3000 на службу 10 10
Максимальное количество простых полей на индекс 2 1000 100 1000 1000 1000 1000 1000 1000
Максимальное количество сложных коллекций на индекс 40 40 40 40 40 40 40 40
Максимальное количество элементов во всех сложных коллекциях на документ 3 3000 3000 3000 3000 3000 3000 3000 3000
Максимальная глубина сложных полей 10 10 10 10 10 10 10 10
Максимальное число средств подбора на индекс 1 1 1 1 1 1 1 1
Максимальное число профилей оценки на индекс 100 100 100 100 100 100 100 100
Максимальное число функций на профиль 8 8 8 8 8 8 8 8

1 Службы категории "Базовый", созданные до декабря 2017 г., имеют более низкие ограничения индексов (5 вместо 15). Уровень "Базовый" — единственный SKU с ограничением в минимум 100 полей на индекс.

2 Верхний предел полей включает как поля первого уровня, так и вложенные подполя в сложной коллекции. Например, если индекс содержит 15 полей и содержит две сложные коллекции с пятью подполями, то число полей индекса равно 25. Индексы с очень большой коллекцией полей могут быть медленными. Ограничьте поля и атрибуты только теми, которые вам нужны, и выполните индексирование и тестирование запросов, чтобы обеспечить высокую производительность.

3 Верхний предел существует для элементов, так как при наличии большого количества элементов значительно увеличивается объем хранилища, необходимого для индекса. Элемент сложной коллекции определяется как член этой коллекции. Допустим, например, что у нас есть документ "Гостиница" со сложной коллекцией "Номера", тогда каждый номер в коллекции "Номера" считается элементом. Во время индексирования механизм индексирования может безопасно обрабатывать не более 3000 элементов во всем документе. Это ограничение появилось в api-version=2019-05-06 и применяется только к сложным коллекциям, а не к коллекциям строк или к сложным полям.

Если служба будет подготовлена в более мощном кластере, вы можете найти некоторые варианты в максимальных ограничениях. Ограничения здесь представляют общий знаменатель. Индексы, созданные на основе указанных выше спецификаций, будут переноситься на эквивалентные уровни служб в любом регионе.

Ограничения документов

Однако в службах поиска Basic, S1, S2 и S3 в Когнитивный поиск Azure больше нет ограничений в 24 миллиарда документов на индекс. Для S3 HD ограничение составляет 2 миллиарда документов на индекс. Каждый элемент сложной коллекции считается отдельным документом с точки зрения этих ограничений.

Ограничения размера документа на один вызов API

Максимальный размер документа при вызове API индекса составляет примерно 16 МБ.

Фактически размер документа ограничивает размер текста запроса API индекса. Так как API индекса позволяет одновременно передать пакет из нескольких документов, фактически предельный размер зависит от количества документов в таком пакете. Для пакета с одним документом максимальный размер документа составляет 16 МБ данных JSON.

При оценке размера документов следует учитывать только те поля, которые могут использоваться службой поиска. Не нужно включать в эти вычисления двоичные или графические данные в исходных документах.

Ограничения индексатора

Для поддержания баланса и стабильности службы в целом применяется максимально допустимое время выполнения, но некоторые большие наборы данных требуют на индексирование больше времени, чем предусмотрено. Если задание индексирования не может завершиться в течение максимально допустимого времени ожидания, попробуйте запустить его по расписанию. Планировщик сохраняет сведения о состоянии индексирования. Если запланированное задание индексирования прервано по какой-либо причине, индексатор может продолжить выполнение с того же места при следующем запланированном выполнении.

Ресурс Бесплатный 1 Базовый 2 S1 S2 S3 S3 HD 3 L1 L2
Максимальное число индексаторов 3 5 или 15 50 200 200 Недоступно 10 10
Максимальное количество источников данных 3 5 или 15 50 200 200 Недоступно 10 10
Максимальное число наборов квалификационных навыков 4 3 5 или 15 50 200 200 Недоступно 10 10
Максимальная нагрузка индексирования на вызов 10 000 документов Ограничивается только максимальным числом документов Ограничивается только максимальным числом документов Ограничивается только максимальным числом документов Ограничивается только максимальным числом документов Недоступно Без ограничений Без ограничений
Минимальное расписание 5 мин 5 мин 5 мин 5 мин 5 мин 5 мин 5 мин 5 мин
Максимальное время выполнения 6 1–3 мин 2–24 часа 2–24 часа 2–24 часа 2–24 часа Н/Д 2–24 часа 2–24 часа
Максимальное время выполнения для индексаторов с набором навыков 5 3–10 минут 2 часа 2 часа 2 часа 2 часа Недоступно 2 часа 2 часа
Индексатор BLOB-объектов: максимальный размер BLOB-объектов в МБ 16 16 128 256 256 Недоступно 256 256
Индексатор BLOB-объектов: максимальное число символов в содержимом, извлеченном из BLOB-объекта 32 000 64 000 4 млн 8 миллионов 16 миллионов Н/Д 4 млн 4 млн

1 Максимальное время выполнения индексатора для служб уровня "Бесплатный" составляет 3 минуты для источников больших двоичных объектов или 1 минуту для прочих источников данных. Вызов индексатора выполняется каждые 180 секунд. Для индексирования ИИ, который вызывает Cognitive Services, бесплатные службы ограничены 20 бесплатными транзакциями на индексатор в день, где транзакция определяется как документ, который успешно проходит через конвейер обогащения (совет: можно сбросить индексатор для сброса его количества).

2 Службы категории "Базовый", созданные до декабря 2017 г., имеют более низкие ограничения для индексов (5 вместо 15), источников данных и наборов навыков.

3 Службы уровня S3 HD не поддерживают индексаторы.

4 До 30 навыков на набор квалификационных навыков.

5 Обогащение с помощью ИИ и анализ изображений требуют много вычислительных ресурсов и потребляют непропорциональные объемы доступных вычислительных мощностей. Время выполнения для таких рабочих нагрузок было уменьшено, чтобы оставить больше возможностей для других заданий в очереди.

Максимальное время выполнения индексатора для уровня "Базовый" или выше может варьироваться в диапазоне от 2 до 24 часов в зависимости от системных ресурсов, реализации продукта и других факторов.

Примечание

Как указано в ограничениях для индексов, индексаторы также применяют верхний предел в 3000 элементов по всем сложным коллекциям на документ, начиная с последней общедоступной версии API, которая поддерживает сложные типы (2019-05-06), и более поздних версий. Это означает, что ограничение не применяется к индексаторам, созданным с помощью API более ранних версий. Чтобы сохранить максимальную совместимость, ограничения не будут применяться даже к тем индексаторам, которые были созданы с помощью API более ранних версий, а затем обновлены с применением API версии 2019-05-06 или более поздней. Клиентам следует помнить о неблагоприятном влиянии очень больших сложных коллекций (о чем уже упоминалось ранее), и мы настоятельно рекомендуем создавать новые индексаторы только через API последней общедоступной версии.

Индексаторы могут получать доступ к другим ресурсам Azure через частные конечные точки, управляемые через API общего ресурса приватного канала. В этом разделе описываются связанные с этой возможностью ограничения.

Ресурс Free Basic S1 S2 S3 S3 HD L1 L2
Поддержка индексаторов частных конечных точек Нет Да Да Да Да Нет Да Да
Поддержка частных конечных точек для индексаторов с набором навыков 1 Нет Нет нет Да Да нет Да Да
Максимальное количество частных конечных точек Недоступно 10 или 30 100 400 400 Недоступно 20 20
Максимальное количество различных типов ресурсов 2 Недоступно 4 7 15 15 Недоступно 4 4

1 Обогащение с помощью ИИ и анализ изображений требуют большой объем вычислительных ресурсов и потребляют непропорциональные объемы доступных вычислительных мощностей. По этой причине на более низких уровнях частные подключения отключаются, чтобы избежать ухудшения производительности и стабильности самой службы поиска.

2 Количество различных типов ресурсов вычисляется как число уникальных значений groupId, используемых во всех общих ресурсах приватного канала для данной службы поиска, независимо от состояния ресурса.

Ограничения синонимов

Максимальное число сопоставлений синонимов зависит от уровня службы. Каждое правило может иметь до 20 расширений, которые обозначают эквивалентные понятия. Например, созданные ассоциации "cat" с "kitty", "feline" и "felis" (разговорные и биологические именования кошачьих) будут учитываться как 3 расширения.

Ресурс Free Basic S1 S2 S3 S3-HD L1 L2
Максимальное число сопоставлений синонимов 3 3 5 10 20 20 10 10
Максимальное количество правил на сопоставление 5000 20 000 20 000 20 000 20 000 20 000 20 000 20 000

Ограничения псевдонимов индекса

Максимальное число псевдонимов индекса зависит от уровня. На всех уровнях максимальное число псевдонимов совпадает с максимальным числом индексов.

Ресурс Free Basic S1 S2 S3 S3-HD L1 L2
Максимальное число псевдонимов 3 5 или 15 50 200 200 1000 на секцию или 3000 на службу 10 10

Ограничения по данным (обогащение с помощью ИИ)

Конвейер обогащения ИИ, который выполняет вызовы к ресурсу Azure Cognitive Services для языка для распознавания сущностей, связывания сущностей, извлечения ключевых фраз, анализа тональности, обнаружения языка и обнаружения личных сведений, регулируется ограничениями данных. Максимальный размер записи — 50 000 знаков, как определено в String.Length. Если вам нужно разбить данные перед отправкой в анализатор тональности, можно воспользоваться навыком разделения текста.

Ограничения регулирования

Запросы API регулируются, когда система приближается к пиковой загрузке. Регулирование работает по-разному для разных API. API запросов (поиск, предложения и автозавершение) и API индексирования регулируются динамически в зависимости от нагрузки на службу. API индекса и API операций службы имеют ограничения на частоту статических запросов.

Действуют следующие ограничения по запросам для операций, связанных с индексом.

  • Получение списка индексов (GET /indexes): 3 запроса в секунду на единицу поиска
  • Получение индекса (GET /indexes/myindex): 10 запросов в секунду на единицу поиска.
  • Создание индекса (POST /indexes): 12 запросов в минуту на единицу поиска.
  • Создание или обновление индекса (PUT /indexes/myindex): 6 запросов в секунду на единицу поиска.
  • Удаление индекса (DELETE /indexes/myindex): 12 запросов в минуту на единицу поиска.

Действуют следующие ограничения по запросам для операций, связанных со службой.

  • Статистика службы (GET/servicestats): 4 в секунду на единицу поиска

Ограничения запросов к API

  • Максимум 16 МБ на один запрос 1
  • Максимальная длина URL-адреса — 8 КБ.
  • Максимум 1000 документов на одну операцию загрузки индексов, объединения или удаления.
  • Максимум 32 поля в предложении $orderby.
  • Не более 100 000 символов в предложении поиска
  • Максимальное число предложений в search (выражениях, разделенных AND или OR) — 1024.
  • Максимальный размер поискового запроса — 32 766 байтов (32 КБ минус 2 байта) текста в кодировке UTF-8.
  • Максимальный размер условия поиска составляет 1000 символов для поиска префиксов и поиска регулярных выражений.
  • Поиск с подстановочными знаками и поиск регулярных выражений ограничены не более чем 1000 состояниями при обработке Lucene.

1 В службе "Когнитивный поиск Azure" размер текста запроса не должен превышать 16 МБ. Это накладывает фактическое ограничение на отдельные поля или коллекции, для которых теоретические ограничения не установлены (дополнительные сведения о составе и ограничениях полей см. в списке поддерживаемых типов данных).

Ограничения на размер и композицию запросов существуют, так как несвязанные запросы могут дестабилизировать службу поиска. Как правило, такие запросы создаются программными средствами. Если приложение создает поисковые запросы программным способом, рекомендуется разрабатывать его таким образом, чтобы оно не создавало запросы неограниченного размера.

Ограничения ответов API

  • Максимум 1000 документов на одну страницу результатов поиска.
  • Максимум 100 предложений на один запрос API предложений.

Ограничения ключей API

Ключи API используются для проверки подлинности в службах. Существует два типа ключей. Ключи администратора указываются в заголовке запроса и предоставляют доступ к службе на чтение и запись. Ключи запросов доступны только для чтения, они указываются в URL-адресе и обычно передаются в клиентские приложения.

  • Максимум 2 ключа администратора на одну службу.
  • Максимум 50 ключей запросов на одну службу.