Ограничения служб в службе "Поиск ИИ Azure"

Максимальные ограничения на хранилище, рабочие нагрузки и количество индексов и других объектов зависят от того, создаете ли поиск ИИ Azure на уровне "Бесплатный", "Базовый", "Стандартный" или служба хранилища оптимизированные ценовые категории.

  • Бесплатная — это мультитенантная общая служба, которая поставляется с подпиской Azure.

  • Базовый предоставляет выделенные вычислительные ресурсы для небольших рабочих нагрузок в рабочей среде, но вам придется делить часть сетевой инфраструктуры с другими арендаторами.

  • Для уровня Стандартный используются выделенные виртуальные машины. Это обеспечивает увеличение емкости хранилища и вычислительной мощности на всех уровнях. В категории "Стандартный" доступно четыре уровня: S1, S2, S3 и S3 HD (S3, высокая плотность). S3 High Density (S3 HD) предназначен для многотенантности и большого количества небольших индексов (3000 индексов на службу). S3 HD не предоставляет функцию индексатора и прием данных должен использовать API, которые помещают данные из источника в индекс.

  • Оптимизировано для хранилища выполняется на выделенных компьютерах с более высокими объемами хранилища, пропускной способности хранилища и памяти, чем в категории Стандартный. Эта ценовая категория предназначена для больших и медленно меняющихся индексов. служба хранилища Оптимизировано на двух уровнях: L1 и L2.

Ограничения подписки

Вы можете создать несколько платных служб поиска (базовый и более высокий), до максимального количества служб, разрешенных на каждом уровне. Например, в рамках одной подписки можно создать до 16 служб на уровне "Базовый" и еще 16 служб на уровне S1. Дополнительные сведения о уровнях см. в разделе "Выбор уровня " (или SKU) для поиска ИИ Azure.

Максимальное количество служб можно увеличить по запросу. Если вам требуется больше служб для одной подписки, отправьте запрос на поддержку.

Ресурс Бесплатный 1 Базовая S1 S2 S3 S3 HD L1 L2
Максимальное число служб 1 16 16 8 6 6 6 6
Максимальное количество единиц поиска (SU)2 Н/П 3 ЕП 36 ЕП 36 ЕП 36 ЕП 36 ЕП 36 ЕП 36 ЕП

1 Вы можете использовать бесплатную службу поиска для каждой подписки Azure. Уровень "Бесплатный" основан на инфраструктуре, общей для других клиентов. Так как оборудование не выделено, масштабирование не поддерживается, а хранилище ограничено 50 МБ.

2 Единицы поиска (ЕП) — это оплачиваемые единицы, выделяемые в виде реплик или секций. Вам нужно и то, и другое. Дополнительные сведения о сочетаниях SU см. в статье "Оценка емкости службы поиска" и управление ими.

Лимиты служб

служба ограничения для хранилища, секций и реплика зависят от даты создания службы с более высокими ограничениями для новых служб в поддерживаемых регионах.

Служба поиска имеет максимальный размер хранилища (размер секции, умноженный на количество секций) или жесткое ограничение на максимальное число индексов или индексаторов, в зависимости от того, что происходит в первую очередь.

Соглашения об уровне обслуживания применяются к оплачиваемым службам с двумя или более реплика для рабочих нагрузок запросов или тремя или более реплика для рабочих нагрузок запросов и индексирования. При применении соглашения об уровне обслуживания не учитывается количество секций не учитывается. Дополнительные сведения см. в статье "Надежность" в службе "Поиск по искусственному интеллекту Azure".

Бесплатные службы не имеют фиксированных секций или реплика, и они совместно используют ресурсы с другими подписчиками.

До 3 апреля 2024 г.

Ресурс Free Basic S1 S2 S3 S3 HD L1 L2
Соглашение об уровне обслуживания (SLA) No Да Да Да Да Да Да Да
служба хранилища (размер секции) 50 МБ 2 ГБ 25 ГБ 100 ГБ 200 ГБ 200 ГБ 1 TБ 2 ТБ
Секции Н/П 1 12 12 12 3 12 12
Реплики Н/П 3 12 12 12 12 12 12

После 3 апреля 2024 г.

Для новых служб, созданных после 3 апреля 2024 г.:

  • Базовый уровень может содержать до трех секций и трех реплика, а всего девять единиц поиска (SU).
  • Базовый, S1, S2, S3 имеет больше хранилища на секцию, начиная от 3-7 раз больше, в зависимости от уровня.
  • Новая служба поиска должна находиться в поддерживаемом регионе, чтобы получить дополнительную емкость для базовых и других уровней.

В настоящее время обновление на месте отсутствует. Вы должны создать новую службу поиска, чтобы воспользоваться дополнительным хранилищем.

Ресурс Free Basic S1 S2 S3 S3 HD L1 L2
Соглашение об уровне обслуживания (SLA) No Да Да Да Да Да Да Да
служба хранилища (размер секции) 50 МБ 15 ГБ 160 ГБ 350 ГБ 700 ГБ 200 ГБ 1 TБ 2 ТБ
Секции Н/П 3 12 12 12 3 12 12
Реплики Н/П 3 12 12 12 12 12 12

Поддерживаемые регионы с более высокими ограничениями хранилища

Службы, созданные после 3 апреля 2024 г., должны находиться в одном из следующих регионов, чтобы получить дополнительное хранилище. Просмотрите объявления в разделе "Новые возможности" в службе " Поиск ИИ Azure" для расширения в других регионах.

Страна/регион Регионы, предоставляющие дополнительную емкость на секцию
США Восточная часть США, восточная часть США 2, центрально-северная часть США, центрально-южная часть США, западная часть США, западная часть США 2, западная часть США 3, западная часть США 3, центрально-западная часть США
Соединенное Королевство Южная часть Великобритании, западная часть Великобритании
ОАЭ Север ОАЭ
Швейцария Западная Швейцария
Швеция Центральная Швеция
Польша Центральная Польша
Норвегия Восточная Норвегия
Республика Корея Центральная Корея, Южная Корея
Япония Восточная Япония, Западная Япония
Италия Италия Север
Индия Центральная Индия, Джио Индия Западная
Франция Центральная Франция
Европа Северная Европа
Канада Центральная Канада, Восточная Канада
Базиль Южная Бразилия
Азиатско-Тихоокеанский регион Восточная Азия, Юго-Восточная Азия
Австралия Восточная Австралия, Юго-Восточная Австралия

Ограничения индексов

Ресурс Бесплатно Базовый 1 S1 S2 S3 S3 HD L1 L2
Максимальное число индексов 3 5 или 15 50 200 200 1000 на секцию или 3000 на службу 10 10
Максимальное количество простых полей на индекс 2 1000 100 1000 1000 1000 1000 1000 1000
Максимальное количество измерений на поле вектора 3072 3072 3072 3072 3072 3072 3072 3072
Максимально сложные коллекции на индекс 40 40 40 40 40 40 40 40
Максимальное количество элементов во всех сложных коллекциях на документ 3 3000 3000 3000 3000 3000 3000 3000 3000
Максимальная глубина сложных полей 10 10 10 10 10 10 10 10
Максимальное число средств подбора на индекс 1 1 1 1 1 1 1 1
Максимальное число профилей оценки на индекс 100 100 100 100 100 100 100 100
Максимальное число функций на профиль 8 8 8 8 8 8 8 8
Максимальный размер индекса 4 Неприменимо Н/Д Неприменимо 1.92 ТБ 2,4 ТБ 100 ГБ Неприменимо Неприменимо

1 Службы категории "Базовый", созданные до декабря 2017 г., имеют более низкие ограничения индексов (5 вместо 15). Базовый уровень — это единственный уровень с более низким ограничением в 100 полей на индекс.

2 Верхний предел полей включает как поля первого уровня, так и вложенные подфилды в сложной коллекции. Например, если индекс содержит 15 полей и содержит две сложные коллекции с пятью подфилдами, число полей индекса равно 25. Индексы с очень большой коллекцией полей могут быть медленными. Ограничьте поля и атрибуты только тем, которые вам нужны, и выполните индексирование и тестирование запросов, чтобы обеспечить допустимость производительности.

3 Верхний предел существует для элементов, так как при наличии большого количества из них значительно увеличивается хранилище, необходимое для индекса. Элемент сложной коллекции определяется как член этой коллекции. Допустим, например, что у нас есть документ "Гостиница" со сложной коллекцией "Номера", тогда каждый номер в коллекции "Номера" считается элементом. Во время индексирования подсистема индексирования может безопасно обрабатывать не более 3000 элементов в документе в целом. Это ограничение появилось в api-version=2019-05-06 и применяется только к сложным коллекциям, а не к коллекциям строк или к сложным полям.

4 На большинстве уровней максимальный размер индекса — это все доступное хранилище в службе поиска. Для S2, S3 и S3 HD максимальный размер любого индекса — это число, предоставленное в таблице. Применяется к службам поиска, созданным после 3 апреля 2024 г.

Если служба будет подготовлена в более мощном кластере, можно найти некоторые варианты в максимальных ограничениях. Ограничения здесь представляют общий знаменатель. Индексы, созданные в указанных выше спецификациях, переносятся по эквивалентным уровням служб в любом регионе.

Ограничения документов

Вы можете иметь около 24 миллиардов документов на индекс на службы поиска Basic, S1, S2, S3, L1 и L2. Для S3 HD ограничение составляет 2 миллиарда документов на индекс. Каждый экземпляр сложной коллекции считается отдельным документом с точки зрения этих ограничений.

Ограничения размера документа на один вызов API

Максимальный размер документа при вызове API индекса составляет примерно 16 МБ.

Фактически размер документа ограничивает размер текста запроса API индекса. Так как API индекса позволяет одновременно передать пакет из нескольких документов, фактически предельный размер зависит от количества документов в таком пакете. Для пакета с одним документом максимальный размер документа составляет 16 МБ данных JSON.

При оценке размера документов следует учитывать только те поля, которые могут использоваться службой поиска. Не нужно включать в эти вычисления двоичные или графические данные в исходных документах.

Ограничения размера векторного индекса

При индексировании документов с помощью векторных полей поиск Azure ИИ создает внутренние индексы векторов с помощью предоставленных вами параметров алгоритма. Размер этих векторных индексов ограничен памятью, зарезервированной для векторного поиска уровня службы (или SKU).

Служба применяет квоту размера векторного индекса для каждой секции в службе поиска. Каждая дополнительная секция увеличивает доступную квоту размера векторного индекса. Эта квота является жестким ограничением, чтобы обеспечить работоспособность службы, что означает, что дальнейшие попытки индексирования после превышения предела приводят к сбою. После освобождения доступной квоты можно возобновить индексирование, удалив некоторые векторные документы или масштабируя их в секциях.

В таблице описывается квота размера векторного индекса на секцию на уровне служб. Для контекста он включает в себя:

  • Ограничения хранилища секционирования для каждого уровня, повторяющиеся здесь для контекста.
  • Объем каждой секции (в ГБ), доступной для векторных индексов (созданных при добавлении полей векторов в индекс).
  • Приблизительное количество внедрения (значений с плавающей запятой) на секцию.

Используйте статистику службы GET, чтобы получить квоту размера векторного индекса или просмотреть вкладку "Индексы" или "Использование" в портал Azure.

Ограничения векторов зависят от даты и уровня создания службы. Чтобы проверка возраст службы поиска и узнать больше о векторных индексах, ознакомьтесь с разделом "Размер векторного индекса" и оставаться в пределах ограничений.

Ограничения векторов для служб, созданных после 3 апреля 2024 г. в поддерживаемых регионах

Самые высокие ограничения векторов доступны в службах поиска, созданных после 3 апреля 2024 г. в поддерживаемом регионе.

Уровень квота служба хранилища (ГБ) Квота вектора на секцию (ГБ) Приблизительно. плавает на секцию (при условии, что 15 % накладные расходы)
Базовая 15 5 1100 миллионов
S1 160 35 8200 миллионов
S2 350 100 23500 миллионов
S3 700 200 47 000 миллионов
L1 1,000 12 2800 миллионов
L2 2 000 36 8400 миллионов

Обратите внимание, что ограничения L1 и L2 не изменяются в выпуске 3 апреля.

Ограничения векторов для служб, созданных с 1 июля 2023 г. по 3 апреля 2024 г.

Следующие ограничения применяются к новым службам, созданным с 1 июля по 3 апреля 2024 г., за исключением следующих регионов, которые имеют исходные ограничения до 1 июля 2023 г.

  • Центрально-Западная Германия
  • Индия (запад)
  • Центральный Катар

Все остальные регионы имеют следующие ограничения:

Уровень квота служба хранилища (ГБ) Квота вектора на секцию (ГБ) Приблизительно. плавает на секцию (при условии, что 15 % накладные расходы)
Основное 2 1 235 миллионов
S1 25 3 700 миллионов
S2 100 12 2800 миллионов
S3 200 36 8400 миллионов
L1 1,000 12 2800 миллионов
L2 2 000 36 8400 миллионов

Ограничения вектора для служб, созданных до 1 июля 2023 г.

Уровень квота служба хранилища (ГБ) Квота вектора на секцию (ГБ) Приблизительно. плавает на секцию (при условии, что 15 % накладные расходы)
Основное 2 0,5 115 миллионов
S1 25 1 235 миллионов
S2 100 6 1400 миллионов
S3 200 12 2800 миллионов
L1 1,000 12 2800 миллионов
L2 2 000 36 8400 миллионов

Ограничения индексатора

Для поддержания баланса и стабильности службы в целом применяется максимально допустимое время выполнения, но некоторые большие наборы данных требуют на индексирование больше времени, чем предусмотрено. Если задание индексирования не может завершиться в течение максимального времени, попробуйте запустить его по расписанию. Планировщик сохраняет сведения о состоянии индексирования. Если запланированное задание индексирования прервано по какой-либо причине, индексатор может продолжить выполнение с того же места при следующем запланированном выполнении.

Ресурс Бесплатный 1 Базовый 2 S1 S2 S3 S3 HD 3 L1 L2
Максимальное число индексаторов 3 5 или 15 50 200 200 Н/П 10 10
Максимальное количество источников данных 3 5 или 15 50 200 200 Н/П 10 10
Максимальное число наборов квалификационных навыков 4 3 5 или 15 50 200 200 Н/П 10 10
Максимальная нагрузка индексирования на вызов 10 000 документов Ограничивается только максимальным числом документов Ограничивается только максимальным числом документов Ограничивается только максимальным числом документов Ограничивается только максимальным числом документов Н/П Без ограничений Без ограничений
Минимальное расписание 5 мин 5 мин 5 мин 5 мин 5 мин 5 мин 5 мин 5 мин
Максимальное время выполнения5 1–3 мин 2 или 24 часа 2 или 24 часа 2 или 24 часа 2 или 24 часа Н/П 2 или 24 часа 2 или 24 часа
Максимальное время выполнения для индексаторов с набором навыков 6 3–10 минут 2 часа 2 часа 2 часа 2 часа Н/П 2 часа 2 часа
Индексатор BLOB-объектов: максимальный размер BLOB-объектов в МБ 16 16 128 256 256 Н/П 256 256
Индексатор BLOB-объектов: максимальное число символов в содержимом, извлеченном из BLOB-объекта 32 000 64 000 4 млн 8 млн 16 миллионов Н/П 4 млн 4 млн

1 Максимальное время выполнения индексатора для служб уровня "Бесплатный" составляет 3 минуты для источников больших двоичных объектов или 1 минуту для прочих источников данных. Вызов индексатора каждые 180 секунд. Для индексирования ИИ, вызывающего службы искусственного интеллекта Azure, бесплатные службы ограничены 20 бесплатными транзакциями на индексатор в день, где транзакция определяется как документ, который успешно проходит через конвейер обогащения (совет: можно сбросить индексатор для сброса его количества).

2 Службы категории "Базовый", созданные до декабря 2017 г., имеют более низкие ограничения для индексов (5 вместо 15), источников данных и наборов навыков.

3 службы HD С3 не включают поддержку индексатора.

4 До 30 навыков на набор квалификационных навыков.

5 Относительно максимальной продолжительности 2 или 24 часа для индексаторов: максимальное 2-часовое максимальное, и это то, что вы должны планировать. Ограничение на 24 часа — от старой реализации индексатора. Если у вас есть незапланированные индексаторы, которые выполняются непрерывно в течение 24 часов, это связано с тем, что эти индексаторы не могут быть перенесены в более новую инфраструктуру. Как правило, для заданий индексирования, которые не могут завершиться в течение двух часов, поместите индексатор в 2-часовое расписание. После завершения первого 2-часового интервала индексатор выбирает место, в котором он остался при запуске следующего 2-часового интервала.

6 Навыков выполнения и анализа изображений, в частности, являются вычислительными и потребляют непропорциональное количество доступных вычислительных ресурсов. Время выполнения для таких рабочих нагрузок было уменьшено, чтобы оставить больше возможностей для других заданий в очереди.

Примечание.

Как указано в ограничениях для индексов, индексаторы также применяют верхний предел в 3000 элементов по всем сложным коллекциям на документ, начиная с последней общедоступной версии API, которая поддерживает сложные типы (2019-05-06), и более поздних версий. Это означает, что ограничение не применяется к индексаторам, созданным с помощью API более ранних версий. Чтобы сохранить максимальную совместимость, ограничения не будут применяться даже к тем индексаторам, которые были созданы с помощью API более ранних версий, а затем обновлены с применением API версии 2019-05-06 или более поздней. Клиентам следует помнить о неблагоприятном влиянии очень больших сложных коллекций (о чем уже упоминалось ранее), и мы настоятельно рекомендуем создавать новые индексаторы только через API последней общедоступной версии.

Индексаторы могут получать доступ к другим ресурсам Azure через частные конечные точки, управляемые через API общего ресурса приватного канала. В этом разделе описываются связанные с этой возможностью ограничения.

Ресурс Free Basic S1 S2 S3 S3 HD L1 L2
Поддержка индексаторов частных конечных точек No Да Да Да Да No Да Да
Поддержка частных конечных точек для индексаторов с набором навыков 1 No No No Да Да No Да Да
Максимальное количество частных конечных точек Н/П 10 или 30 100 400 400 Н/П 20 20
Максимальное количество различных типов ресурсов 2 Н/П 4 7 15 15 Н/П 4 4

1 Обогащение с помощью ИИ и анализ изображений требуют большой объем вычислительных ресурсов и потребляют непропорциональные объемы доступных вычислительных мощностей. По этой причине частные подключения отключены на более низких уровнях, чтобы обеспечить производительность и стабильность самой службы поиска.

2 Количество различных типов ресурсов вычисляется как число уникальных значений groupId, используемых во всех общих ресурсах приватного канала для данной службы поиска, независимо от состояния ресурса.

Ограничения синонимов

Максимальное число сопоставлений синонимов зависит от уровня службы. Каждое правило может иметь до 20 расширений, которые обозначают эквивалентные понятия. Например, созданные ассоциации "cat" с "kitty", "feline" и "felis" (разговорные и биологические именования кошачьих) будут учитываться как 3 расширения.

Ресурс Free Basic S1 S2 S3 S3-HD L1 L2
Максимальное число сопоставлений синонимов 3 3 5 10 20 20 10 10
Максимальное количество правил на сопоставление 5000 20000 20000 20000 20000 20000 20000 20000

Ограничения псевдонима индекса

Максимальное число псевдонимов индекса зависит от уровня. На всех уровнях максимальное число псевдонимов в два раза больше допустимого числа индексов.

Ресурс Free Basic S1 S2 S3 S3-HD L1 L2
Максимальный псевдоним 6 10 или 30 100 400 400 2000 на секцию или 6000 на службу 20 20

Ограничения по данным (обогащение с помощью ИИ)

Конвейер обогащения искусственного интеллекта, который вызывает ресурс Языка искусственного интеллекта Azure для распознавания сущностей, связывания сущностей, извлечения ключевых фраз, анализа тональности, обнаружения языка и обнаружения персональных данных зависит от ограничений данных. Максимальный размер записи — 50 000 знаков по оценке String.Length. Если вам нужно разбить данные перед отправкой в анализатор тональности, можно воспользоваться навыком разделения текста.

Ограничения регулирования

Запросы API регулируются, когда система приближается к пиковой загрузке. Регулирование работает по-разному для разных API. API запросов (поиск, предложения и автозавершение) и API индексирования регулируются динамически в зависимости от нагрузки на службу. API индекса и API операций службы имеют ограничения на частоту статических запросов.

Действуют следующие ограничения по запросам для операций, связанных с индексом.

  • Получение списка индексов (GET /indexes): 3 запроса в секунду на единицу поиска
  • Get Index (GET /indexes/myindex): 10 в секунду на единицу поиска
  • Создание индекса (POST /indexes): 12 в минуту на единицу поиска
  • Создание или обновление индекса (PUT /indexes/myindex): 6 в секунду на единицу поиска
  • Delete Index (DELETE /indexes/myindex): 12 в минуту на единицу поиска

Действуют следующие ограничения по запросам для операций, связанных со службой.

  • Статистика службы (GET/servicestats): 4 в секунду на единицу поиска

Ограничения запросов к API

  • Максимум 16 МБ на один запрос 1
  • Максимальная длина URL-адреса 8-КБ
  • Максимум 1000 документов на пакет отправки индексов, слияний или удалений
  • Максимум 32 поля в предложении $orderby.
  • Максимум 100 000 символов в предложении поиска
  • Максимальное число предложений в search (выражения, разделенные AND или OR) — 1024
  • Максимальный размер поискового запроса — 32 766 байтов (32 КБ минус 2 байта) текста в кодировке UTF-8.
  • Максимальный размер поискового термина — 1000 символов для поиска префикса и регулярного поиска
  • Wild карта поиск и поиск регулярных выражений ограничены не более 1000 состояний при обработке Lucene.

1 В службе "Поиск ИИ Azure" текст запроса применяется к верхнему пределу 16 МБ, что накладывает практические ограничения на содержимое отдельных полей или коллекций, которые не ограничены теоретическими ограничениями (дополнительные сведения о составе полей и ограничениях см. в статье "Поддерживаемые типы данных").

Ограничения на размер и композицию запросов существуют, так как несвязанные запросы могут дестабилизировать службу поиска. Как правило, такие запросы создаются программным способом. Если приложение создает поисковые запросы программными средствами, рекомендуется создать его таким образом, чтобы он не создавал запросы необвязанного размера.

Ограничения ответов API

  • Не более 1000 документов, возвращаемых на страницу результатов поиска
  • Максимум 100 предложений на один запрос API предложений.

Ограничения ключей API

Ключи API используются для проверки подлинности в службах. Существует два типа ключей. Ключи администратора указываются в заголовке запроса и предоставляют доступ к службе на чтение и запись. Ключи запросов доступны только для чтения, они указываются в URL-адресе и обычно передаются в клиентские приложения.

  • Максимум 2 ключа администратора на одну службу.
  • Максимум 50 ключей запросов на одну службу.