Планирование затрат на служба ИИ Azure и управление ими

В этой статье объясняется модель выставления счетов и оплачиваемые события поиска ИИ Azure и приведены рекомендации по управлению затратами.

На первом шаге оцените базовые затраты с помощью калькулятора цен Azure. Кроме того, оценочные затраты и сравнения по уровням также можно найти на странице "Выбор ценовой категории " при создании службы.

Azure предоставляет встроенную систему управления затратами, которая сокращает границы служб для обеспечения инклюзивного мониторинга затрат и возможности задавать бюджеты и определять оповещения. Затраты на выполнение службы поиска зависят от емкости и используемых функций. После создания службы поиска оптимизируйте емкость таким образом, чтобы вы заплатили только за необходимые ресурсы.

Описание модели выставления счетов

Поиск azure AI выполняется в инфраструктуре Azure, которая начисляет затраты при развертывании новых ресурсов. Важно понимать, что могут взиматься и другие дополнительные затраты на инфраструктуру.

При создании или использовании ресурсов поиска взимается плата за следующие метры:

  • Вы взимаете почасовую ставку на основе ценовой категории службы поиска, пропорциональной часу.

  • Плата применяется по количеству единиц поиска (SU), выделенных службе. Единицы поиска — это единицы емкости. Total SU — это продукт реплика и секций (R x P = SU), используемых службой.

Выставление счетов основано на емкости (SUS) и затратах на выполнение функций уровня "Премиум", таких как обогащение ИИ, семантический ранджер и частные конечные точки. Счетчики, связанные с функциями уровня "Премиум", перечислены в следующей таблице.

средство измерения. Unit
Извлечение изображений (обогащение ИИ) 1, 2 На 1000 изображений. Дополнительные сведения см. на странице цен.
Навык поиска пользовательских сущностей (обогащение ИИ) 1 На 1000 текстовых записей. Откройте страницу цен
Встроенные навыки (обогащение ИИ) 1 Количество транзакций, выставленных по той же ставке, что и при выполнении задачи путем вызова служб ИИ Azure напрямую. Бесплатно можно обрабатывать до 20 документов на индексатор в день. Для больших или более частых рабочих нагрузок требуется ключ служб ИИ Azure с несколькими ресурсами.
Семантический рангер1 Число запросов "queryType=semantic", выставленных по прогрессивной ставке. Дополнительные сведения см. на странице цен.
Общая приватная ссылка1 Плата за пропускную способность до тех пор, пока общая частная ссылка существует и используется.

1 Применяется только в том случае, если вы используете или включите эту функцию.

2 В конфигурацииimageAction индексатора — это параметр, который активирует извлечение изображений. Если imageAction задано значение none (по умолчанию), плата за извлечение изображений не взимается. Затраты возникают при imageAction установке параметра и включении OCR, анализа изображений или извлечения документов в набор навыков.

Плата за количество полнотекстовых или векторных запросов, ответов запросов или документов не взимается, хотя ограничения службы применяются на каждом уровне.

Трафик данных может также повлечь расходы на сеть. Ознакомьтесь с разделом Сведения о стоимости за пропускную способность.

Некоторые функции уровня "Премиум", такие как хранилище знаний, сеансы отладки и кэш обогащения, зависят от служба хранилища Azure. Метры для служба хранилища Azure применяются в этом случае, а связанные затраты на хранение этих функций включаются в счет служба хранилища Azure.

Ключи , управляемые клиентом, обеспечивают двойное шифрование конфиденциального содержимого. Для этой функции требуется оплачиваемое хранилище ключей Azure.

Наборы навыков могут включать оплачиваемые встроенные навыки, не оплачиваемые встроенные служебные навыки и пользовательские навыки. К неоплачиваемым навыкам служебных программ относятся: условная логика, формирователь, слияние текста, разделение текста. Плата за их использование не взимается. Нет требования к ключу API и нет ограничения на 20 документов.

Пользовательский навык — это предоставляемые вами функции. Стоимость использования пользовательского навыка полностью зависит от того, вызывает ли пользовательский код другие оплачиваемые службы. Нет требования к ключу API и нет 20 ограничений на пользовательские навыки.

Мониторинг затрат

Функции управления затратами встроены в инфраструктуру Azure. Дополнительные сведения об отслеживании затрат, соответствующих средствах и API см. в статье об управлении выставлением счетов и затратами.

Минимизация затрат

Следуйте этим рекомендациям, чтобы свести к минимуму затраты на решение поиска ИИ Azure.

  1. По возможности создайте службу поиска [в регионе с большим объемом хранилища на секцию](поддерживаемые регионы. Если вы используете несколько ресурсов Azure в решении, создайте их в одном регионе или в нескольких регионах, чтобы свести к минимуму или исключить расходы на пропускную способность.

  2. Увеличение масштаба для операций с большим объемом ресурсов, таких как индексирование, а затем перенастраивание вниз для обычных рабочих нагрузок запросов. Если в рабочих нагрузках есть прогнозируемые шаблоны, возможно, вы сможете синхронизировать масштабирование до ожидаемого тома (для автоматизации этого процесса потребуется написать код).

    При оценке стоимости решения поиска следует помнить, что цены и емкость не являются линейными (удвоение емкости более чем в два раза превышает стоимость на одном уровне). Кроме того, в какой-то момент добиться более высокой производительности и скорости при той же цене позволяет переход на более высокий уровень. Дополнительные сведения и пример см. в разделе Обновление до уровня "Стандартный S2".

  3. Рассмотрим веб-приложение Azure для внешнего приложения, чтобы запросы и ответы оставались в пределах границ центра обработки данных.

  4. Если вы используете обогащение ИИ, взимается дополнительная плата за хранилище BLOB-объектов, но совокупные затраты снизились, если включить кэширование обогащения.

Создание бюджетов

Вы можете создать бюджеты, чтобы управлять затратами и создавать оповещения, которые автоматически уведомляют заинтересованные лица о нетипичных и чрезмерных затратах. Оповещения основываются на расходах по сравнению с пороговыми значениями бюджета и затрат. Бюджеты и оповещения создаются для подписок и групп ресурсов Azure, поэтому их рекомендуется использовать в рамках общей стратегии мониторинга затрат.

Бюджеты можно создавать с использованием фильтров для конкретных ресурсов или служб в Azure, если требуется дополнительная детализация результатов мониторинга. Фильтры помогают предотвратить случайное создание новых ресурсов, позволяя избежать дополнительных затрат. Дополнительные сведения о параметрах фильтра при создании бюджета см. в разделе Параметры группы и фильтра.

Экспорт данных о затратах

Можно также экспортировать данные о затратах в учетную запись хранения. Это полезно, если вам или другим пользователям требуется провести дополнительный анализ данных по затратам. Например, специалисты по финансам могут анализировать данные с помощью Excel или Power BI. Можно экспортировать данные о затратах ежедневно, еженедельно или ежемесячно и задать настраиваемый диапазон дат. Экспорт данных по затратам — это рекомендуемый способ извлечения неагрегированных данных о затратах.

Вопросы и ответы

Можно ли временно закрыть службу поиска, чтобы сэкономить на затратах?

Поиск выполняется как непрерывная служба. Выделенные ресурсы работают круглосуточно на протяжении всего времени существования вашей службы. Чтобы полностью остановить выставление счетов, необходимо удалить службу. Удаление службы является необратимой операцией и ведет к удалению связанных с ней данных.

Можно ли изменить тариф выставления счетов (уровень) существующей службы поиска?

Обновление на месте или понижение уровня не поддерживается. Для изменения уровня служб требуется подготовка новой службы на требуемом уровне.

Следующие шаги