Выберите ценовую категорию для Azure Когнитивный поискChoose a pricing tier for Azure Cognitive Search

При создании службы Когнитивный поиск Azure ресурс создается в ценовой категории (или номере SKU), фиксированной на время существования службы.When you create an Azure Cognitive Search service, a resource is created at a pricing tier (or SKU) that's fixed for the lifetime of the service. Уровни включают в себя бесплатное, базовое, стандартное и оптимизированное для хранилища.Tiers include Free, Basic, Standard, and Storage Optimized. Стандартные и оптимизированные для хранилища устройства доступны с несколькими конфигурациями и емкостью.Standard and Storage Optimized are available with several configurations and capacities.

Большинство клиентов начинают с уровня Free, чтобы они могли оценить службу.Most customers start with the Free tier so they can evaluate the service. После ознакомления обычно создается вторая служба на одном из более высоких уровней для разработки и развертывания в рабочей среде.Post-evaluation, it's common to create a second service at one of the higher tiers for development and production deployments.

Доступность функций по уровнямFeature availability by tier

В следующей таблице описаны ограничения на функции, связанные с уровнями.The following table describes tier-related feature constraints.

КомпонентFeature ОграниченияLimitations
индексаторовindexers Индексаторы недоступны на S3 HD.Indexers are not available on S3 HD.
Обогащение данных с помощью средств ИИAI enrichment Работает на уровне Free, но не рекомендуется.Runs on the Free tier but not recommended.
Управляемые пользователем ключи шифрованияCustomer-managed encryption keys Недоступно на уровне Free.Not available on the Free tier.
Доступ к брандмауэру IPIP firewall access Недоступно на уровне Free.Not available on the Free tier.
Интеграция с частной ссылкой AzureIntegration with Azure Private Link Недоступно на уровне Free.Not available on the Free tier.

Большинство функций доступны на каждом уровне, включая бесплатные, но функции, интенсивно использующие ресурсы, могут работать нехорошо, если не предоставить достаточную емкость.Most features are available on every tier, including Free, but resource-intensive features might not work well unless you give it sufficient capacity. Например, обогащение искусственного интеллекта имеет долгосрочные навыки, которые истечения времени ожидания в бесплатной службе, если набор данных не является небольшим.For example, AI enrichment has long-running skills that time out on a Free service unless the dataset is small.

Уровни (SKU)Tiers (SKUs)

Уровни различаются по следующим параметрам:Tiers are differentiated by:

  • Количество индексов и индексаторов, которые можно создатьQuantity of indexes and indexers you can create
  • скорость секционирования и размер секций (физического хранилища).Size and speed of partitions (physical storage)

Выбранный уровень определяет коэффициент оплаты.The tier you select determines the billable rate. На следующем снимке экрана из портал Azure показаны доступные уровни минус цены (которые можно найти на портале и на странице цен.The following screenshot from Azure portal shows the available tiers, minus pricing (which you can find in the portal and on the pricing page. Основные уровни — Free, Basicи Standard .Free, Basic, and Standard are the most common tiers.

Free создает ограниченную службу поиска для небольших проектов, включая краткие руководства и руководства.Free creates a limited search service for smaller projects, including quickstarts and tutorials. На внутреннем уровне реплики и секции являются общими для нескольких подписчиков.Internally, replicas and partitions are shared among multiple subscribers. Вы не можете масштабировать бесплатную службу или выполнять значительные рабочие нагрузки.You cannot scale a free service or run significant workloads.

Основные и стандартные — наиболее часто используемые оплачиваемые уровни со стандартом по умолчанию.Basic and Standard are the most commonly used billable tiers, with Standard being the default. С помощью выделенных ресурсов под контролем вы можете развертывать крупные проекты, оптимизировать производительность и устанавливать емкость.With dedicated resources under your control, you can deploy larger projects, optimize performance, and set the capacity.

Ценовые категории Когнитивный поиск AzurePricing tiers of Azure Cognitive Search

Некоторые уровни оптимизированы для определенных типов работы.Some tiers are optimized for certain types of work. Например, стандартный 3 высокой плотности (S3 HD) — это режим размещения для S3, где базовое оборудование оптимизировано для большого количества небольших индексов и предназначено для многотелефонных сценариев.For example, Standard 3 High Density (S3 HD) is a hosting mode for S3, where the underlying hardware is optimized for a large number of smaller indexes and is intended for multitenancy scenarios. На уровне S3 HD взимается такая же плата за единицу, как и S3, но оборудование оптимизировано для быстрого чтения файлов с большим количеством небольших индексов.S3 HD has the same per-unit charge as S3, but the hardware is optimized for fast file reads on a large number of smaller indexes.

Уровни, оптимизированные для хранилища , обеспечивают более низкую емкость хранилища по меньшей цене за ТБ, чем стандартные уровни.Storage Optimized tiers offer larger storage capacity at a lower price per TB than the Standard tiers. Основной компромисс — это более высокая задержка запросов, которую следует проверить на соответствие конкретным требованиям приложения.The primary tradeoff is higher query latency, which you should validate for your specific application requirements. Дополнительные сведения о вопросах производительности этого уровня см. в статье вопросы производительности и оптимизации.To learn more about the performance considerations of this tier, see Performance and optimization considerations.

Дополнительные сведения о различных уровнях см. на странице с ценами, в разделе ограничения службы в когнитивный Поиск Azure и на странице портала при подготовке службы.You can find out more about the various tiers on the pricing page, in the Service limits in Azure Cognitive Search article, and on the portal page when you're provisioning a service.

Оплачиваемые событияBillable events

Решение, созданное на Когнитивный поиск Azure, может повлечь за собой следующие виды затрат:A solution built on Azure Cognitive Search can incur costs in the following ways:

  • Стоимость самой службы, выполнение круглосуточная с минимальной конфигурацией (один раздел и реплика)Cost of the service itself, running 24x7, at minimum configuration (one partition and replica)

  • Добавление емкости (реплик или секций)Adding capacity (replicas or partitions)

  • Плата за пропускную способность (передача исходящих данных)Bandwidth charges (outbound data transfer)

  • Дополнительные службы, необходимые для конкретных возможностей или функций:Add-on services required for specific capabilities or features:

    • Обогащение искусственного интеллекта (требуется Cognitive Services)AI enrichment (requires Cognitive Services)
    • хранилище знаний (требуется хранилище Azure)knowledge store (requires Azure Storage)
    • Добавочное дополнение (требуется хранилище Azure, применяется к расширению искусственного интеллекта)incremental enrichment (requires Azure Storage, applies to AI enrichment)
    • управляемые клиентом ключи и двойное шифрование (требуется Azure Key Vault)customer-managed keys and double encryption (requires Azure Key Vault)
    • частные конечные точки для модели доступа без Интернета (требуется Частная ссылка Azure)private endpoints for a no-internet access model (requires Azure Private Link)

Стоимость службService costs

В отличие от виртуальных машин или других ресурсов, которые можно "приостановить", чтобы избежать расходов, служба Когнитивный поиск Azure всегда доступна на оборудовании, выделенном для монопольного использования.Unlike virtual machines or other resources that can be "paused" to avoid charges, an Azure Cognitive Search service is always available on hardware dedicated for your exclusive use. Таким образом, создание службы — это оплачиваемое событие, которое запускается при создании службы и завершается при удалении службы.As such, creating a service is a billable event that starts when you create the service, and ends when you delete the service.

Минимальная стоимость — это первая единица поиска (одна реплика x одна секция) на коэффициенте оплаты.The minimum charge is the first search unit (one replica x one partition) at the billable rate. Это минимальное значение фиксируется во время существования службы, так как служба не может работать ни на что меньше этой конфигурации.This minimum is fixed for the lifetime of the service because the service can't run on anything less than this configuration. Помимо минимума можно добавлять реплики и секции независимо друг от друга.Beyond the minimum, you can add replicas and partitions independently of each other. Добавочное увеличение емкости с помощью реплик и секций увеличит счет на основе следующей формулы: (количество реплик x секции x), где плата зависит от выбранной ценовой категории.Incremental increases in capacity through replicas and partitions will increase your bill based on the following formula: (replicas x partitions x rate), where the rate you're charged depends on the pricing tier you select.

При оценке стоимости решения поиска учитывайте, что цены и емкость не являются линейными.When you're estimating the cost of a search solution, keep in mind that pricing and capacity aren't linear. (Удвоение емкости больше, чем удвоение стоимости.) Пример того, как работает формула, см. в разделе как выделить реплики и секции.(Doubling capacity more than doubles the cost.) For an example of how of the formula works, see How to allocate replicas and partitions.

Плата за пропускную способностьBandwidth charges

Использование индексаторов может повлиять на выставление счетов в зависимости от расположения служб.Using indexers might affect billing, depending on the location of your services. При создании службы Когнитивный поиск Azure в том же регионе, в котором находятся данные, плата за исходящие данные может быть полностью устранена.You can eliminate data egress charges entirely if you create the Azure Cognitive Search service in the same region as your data. Ниже приведены некоторые сведения на странице цены на пропускную способность.Here's some information from the bandwidth pricing page:

  • Корпорация Майкрософт не взимается за любые входящие данные в любой службе в Azure или на исходящие данные из Azure Когнитивный поиск.Microsoft doesn't charge for any inbound data to any service on Azure, or for any outbound data from Azure Cognitive Search.
  • В многосервисных решениях плата за данные, передаваемые по сети, не взимается, если все службы находятся в одном регионе.In multiservice solutions, there's no charge for data crossing the wire when all services are in the same region.

Если службы находятся в разных регионах, плата взимается за исходящие данные.Charges do apply for outbound data if services are in different regions. Эти расходы не являются частью счета Azure Когнитивный поиск.These charges aren't actually part of your Azure Cognitive Search bill. Они упомянуты здесь, потому что если вы используете данные или более обогащенные индексаторы для извлечения данных из разных регионов, вы увидите, что затраты отражены в общем счете.They're mentioned here because if you're using data or AI-enriched indexers to pull data from different regions, you'll see costs reflected in your overall bill.

Обогащение искусственного интеллекта с помощью Cognitive ServicesAI enrichment with Cognitive Services

Для обогащения искусственного интеллектанеобходимо запланировать подключение оплачиваемого Cognitive Services ресурса Azureв том же регионе, что и когнитивный Поиск Azure, на ценовой категории S0 для обработки с оплатой по мере использования.For AI enrichment, you should plan to attach a billable Azure Cognitive Services resource, in the same region as Azure Cognitive Search, at the S0 pricing tier for pay-as-you-go processing. Нет фиксированных затрат, связанных с присоединением Cognitive Services.There's no fixed cost associated with attaching Cognitive Services. Вы платите только за необходимую обработку.You pay only for the processing you need.

ОперацияOperation Принцип выставления счетовBilling impact
Взлом документов, извлечение текстаDocument cracking, text extraction БесплатныйFree
Взлом документов, Извлечение изображенийDocument cracking, image extraction Счета выставляются в соответствии с количеством образов, извлеченных из документов.Billed according to the number of images extracted from your documents. В конфигурации индексатора имажеактион — это параметр, который запускает извлечение изображений.In an indexer configuration, imageAction is the parameter that triggers image extraction. Если для имажеактион задано значение "нет" (по умолчанию), вы не будете получать оплату за извлечение изображений.If imageAction is set to "none" (the default), you won't be charged for image extraction. Скорость извлечения образа описана на странице сведений о ценах на когнитивный Поиск Azure.The rate for image extraction is documented on the pricing details page for Azure Cognitive Search.
Встроенные когнитивные навыкиBuilt-in cognitive skills Счет выставляется по той же ставке, что и при выполнении задачи с помощью Cognitive Services напрямую.Billed at the same rate as if you had performed the task by using Cognitive Services directly.
Пользовательские навыкиCustom skills Пользовательский навык — это предоставляемые вами функции.A custom skill is functionality you provide. Затраты на использование пользовательского навыка полностью зависят от того, вызывает ли пользовательский код другие службы с оплатой.The cost of using a custom skill depends entirely on whether custom code is calling other metered services.

Функция добавочного обогащения (Предварительная версия) позволяет создавать кэш, который обеспечивает более эффективное выполнение индексатора при выполнении только тех навыков, которые необходимы при изменении набора навыков в будущем, экономя время и деньги.The incremental enrichment (preview) feature allows you to provide a cache that enables the indexer to be more efficient at running only the cognitive skills that are necessary if you modify your skillset in the future, saving you time and money.

Формула выставления счетов (R x P = SU)Billing formula (R x P = SU)

Наиболее важной концепцией выставления счетов, которую следует знать для Azure Когнитивный поиск Operations, является единица поиска (SU).The most important billing concept to understand for Azure Cognitive Search operations is the search unit (SU). Поскольку Когнитивный поиск Azure зависит как от реплик, так и секций для индексирования и запросов, она не имеет смысла выставлять счет только для одного или другого.Because Azure Cognitive Search depends on both replicas and partitions for indexing and queries, it doesn't make sense to bill by just one or the other. Вместо этого выставление счетов основано на всех частях.Instead, billing is based on a composite of both.

SU — это произведение реплик и секций , используемых службой: (R x P = SU).SU is the product of the replicas and partitions used by a service: (R x P = SU).

Каждая служба имеет как минимум одну единицу поиска (одна реплика, умноженная на одну секцию).Every service starts with one SU (one replica multiplied by one partition) as the minimum. Максимальное значение для любой службы — 36.The maximum for any service is 36 SUs. Это максимальное значение можно получить несколькими способами: 6 секций x 6 реплик или 3 секции x 12 реплик, например.This maximum can be reached in multiple ways: 6 partitions x 6 replicas, or 3 partitions x 12 replicas, for example. Обычно используется меньше общей емкости (например, 3-реплика, 3-секционная служба выставляется как 9 SUs).It's common to use less than total capacity (for example, a 3-replica, 3-partition service billed as 9 SUs). Допустимые сочетания см. на диаграмме с комбинациями разделов и реплик .See the Partition and replica combinations chart for valid combinations.

Ставка выставления счетов Почасовая цена на SU.The billing rate is hourly per SU. Каждый уровень имеет более высокую скорость.Each tier has a progressively higher rate. Более высокие уровни поставляются с большими и спидиер разделами, и это влияет на общую почасовую ставку для этого уровня.Higher tiers come with larger and speedier partitions, and this contributes to an overall higher hourly rate for that tier. Вы можете просмотреть ставки для каждого уровня на странице сведения о ценах .You can view the rates for each tier on the pricing details page.

Большинство клиентов используют часть полной емкости в сети, удерживая остальные ресурсы в резерве.Most customers bring just a portion of total capacity online, holding the rest in reserve. Для выставления счетов количество секций и реплик, которые вы переводите в оперативный режим, вычисляется формулой SU, определяет, что вы оплачиваете почасовой основе.For billing, the number of partitions and replicas that you bring online, calculated by the SU formula, determines what you pay on an hourly basis.

Управление затратамиHow to manage costs

Следующие рекомендации помогут снизить затраты или более эффективно управлять затратами:The following suggestions can help you lower costs or manage costs more effectively:

  • Создайте все ресурсы в одном и том же регионе или как можно меньшее количество регионов, чтобы свести к сведению или исключить плату за пропускную способность.Create all resources in the same region, or in as few regions as possible, to minimize or eliminate bandwidth charges.

  • Объедините все службы в одну группу ресурсов, например Azure Когнитивный поиск, Cognitive Services и другие службы Azure, используемые в решении.Consolidate all services into one resource group, such as Azure Cognitive Search, Cognitive Services, and any other Azure services used in your solution. В портал Azure найдите группу ресурсов и используйте команды управления затратами для анализа фактических и прогнозируемых расходов.In the Azure portal, find the resource group and use the Cost Management commands for insight into actual and projected spending.

  • Рассмотрим веб-приложение Azure для внешнего приложения, чтобы запросы и ответы оставались в пределах границ центра обработки данных.Consider Azure Web App for your front-end application so that requests and responses stay within the data center boundary.

  • Увеличение масштаба для ресурсоемких операций, таких как индексирование, а затем изменение их вниз для обычных рабочих нагрузок запросов.Scale up for resource-intensive operations like indexing, and then readjust downwards for regular query workloads. Начните с минимальной конфигурации Когнитивный поиск Azure (одной SU, состоящей из одной секции и одной реплики), а затем Отслеживайте действия пользователей, чтобы определить закономерности использования, которые свидетельствуют о необходимости увеличения емкости.Start with the minimum configuration for Azure Cognitive Search (one SU composed of one partition and one replica), and then monitor user activity to identify usage patterns that would indicate a need for more capacity. Если имеется прогнозируемый шаблон, вы можете синхронизировать масштабирование с действием (для автоматизации этого потребуется написать код).If there is a predictable pattern, you might be able to synchronize scale with activity (you would need to write code to automate this).

Кроме того, см. руководство по выставлению счетов и управлению затратами для встроенных средств и функций, связанных с затратами.Additionally, visit Billing and cost management for built-in tools and features related to spending.

Не удается завершить работу службы поиска на временной основе.Shutting down a search service on a temporary basis is not possible. Выделенные ресурсы всегда работают, выделяются для монопольного использования в течение срока службы.Dedicated resources are always operational, allocated for your exclusive use for the lifetime of your service. Удаление службы является постоянной, а также удаляет связанные с ней данные.Deleting a service is permanent and also deletes its associated data.

В терминах самой службы единственным способом снижения счета является сокращение количества реплик и секций до уровня, который по-прежнему обеспечивает приемлемое соответствие производительности и соглашений об уровне обслуживания, или создание службы на более низком уровне (часовые тарифы S1 ниже S2 или S3).In terms of the service itself, the only way to lower your bill is to reduce replicas and partitions to a level that still provides acceptable performance and SLA compliance, or create a service at a lower tier (S1 hourly rates are lower than S2 or S3 rates). Предполагая, что вы подготавливаете службу в нижней части проекций нагрузки, если вы масштабируемостьи службу, вы можете создать вторую более крупную службу, перестроить индексы во второй службе, а затем удалить первую из них.Assuming you provision your service at the lower end of your load projections, if you outgrow the service, you can create a second larger-tiered service, rebuild your indexes on the second service, and then delete the first one.

Оценка требований к емкостиHow to evaluate capacity requirements

В Когнитивный поиск Azure емкость структурирована как реплики и Секции.In Azure Cognitive Search, capacity is structured as replicas and partitions.

  • Реплики — это экземпляры службы поиска.Replicas are instances of the search service. Каждая реплика содержит одну копию индекса с балансировкой нагрузки.Each replica hosts one load-balanced copy of an index. Например, служба с шестью репликами имеет шесть копий каждого индекса, загруженного в службу.For example, a service with six replicas has six copies of every index loaded in the service.

  • Секции хранят индексы и автоматически разбивают данные, поддерживающие поиск.Partitions store indexes and automatically split searchable data. Два раздела делят индекс на две части, три секции разбивают их на третьи и т. д.Two partitions split your index in half, three partitions split it into thirds, and so on. С точки зрения емкости размер секции является основной отличительной особенностью уровней.In terms of capacity, partition size is the primary differentiating feature among tiers.

Примечание

Все уровни Standard и оптимизированные для хранилища поддерживают гибкие сочетания реплик и секций , что позволяет оптимизировать систему для ускорения или хранения , изменяя баланс.All Standard and Storage Optimized tiers support flexible combinations of replicas and partitions so you can optimize your system for speed or storage by changing the balance. Уровень "базовый" предлагает до трех реплик для обеспечения высокой доступности, но имеет только один раздел.The Basic tier offers up to three replicas for high availability but has only one partition. Бесплатные уровни не предоставляют выделенные ресурсы: вычислительные ресурсы совместно используются несколькими подписчиками.Free tiers don't provide dedicated resources: computing resources are shared by multiple subscribers.

Оценка емкостиEvaluating capacity

Емкость и стоимость работы службы.Capacity and the costs of running the service go hand in hand. Уровни накладывают ограничения на два уровня: хранилище и ресурсы.Tiers impose limits on two levels: storage and resources. Следует подумать о обоих случаях, так как достигнуто максимально допустимое ограничение.You should think about both because whichever limit you reach first is the effective limit.

Бизнес-требования обычно определяют необходимое количество индексов.Business requirements typically dictate the number of indexes you'll need. Например, может потребоваться глобальный индекс для большого репозитория документов.For example, you might need a global index for a large repository of documents. Или может потребоваться несколько индексов на основе региона, приложения или бизнес-нишу.Or you might need multiple indexes based on region, application, or business niche.

Чтобы определить размер индекса, необходимо создать его.To determine the size of an index, you have to build one. Его размер будет основан на импортированных данных и конфигурации индекса, например о включении предложений, фильтрации и сортировки.Its size will be based on imported data and index configuration such as whether you enable suggesters, filtering, and sorting.

Для полнотекстового поиска Первичная структура данных является инвертированной структурой индекса, которая имеет различные характеристики, чем исходные данные.For full text search, the primary data structure is an inverted index structure, which has different characteristics than source data. Для инвертированного индекса размер и сложность определяются по содержимому, а не к объему данных, которые вы передаете в него.For an inverted index, size and complexity are determined by content, not necessarily by the amount of data that you feed into it. Большой источник данных с высокой избыточностью может привести к тому, что индекс будет меньше, чем меньший набор данных, содержащий сильно изменяемое содержимое.A large data source with high redundancy could result in a smaller index than a smaller dataset that contains highly variable content. Поэтому редко бывает возможно определить размер индекса на основе размера исходного набора данных.So it's rarely possible to infer index size based on the size of the original dataset.

Примечание

Несмотря на то, что оценка будущих потребностей для индексов и хранилища может показаться предоставляяй, она стоит делать.Even though estimating future needs for indexes and storage can feel like guesswork, it's worth doing. Если емкость уровня оказывается слишком низкой, необходимо создать новую службу на более высоком уровне, а затем перезагрузить индексы.If a tier's capacity turns out to be too low, you'll need to provision a new service at a higher tier and then reload your indexes. Обновление службы на месте с одного SKU на другой не выполняется.There's no in-place upgrade of a service from one SKU to another.

Оценка на уровне FreeEstimate with the Free tier

Один из способов оценки емкости — начать с бесплатного уровня.One approach for estimating capacity is to start with the Free tier. Помните, что бесплатная служба предлагает до трех индексов, 50 МБ хранилища и 2 минуты времени индексирования.Remember that the Free service offers up to three indexes, 50 MB of storage, and 2 minutes of indexing time. Оценка предполагаемого размера индекса с этими ограничениями может быть непростой, но это шаги:It can be challenging to estimate a projected index size with these constraints, but these are the steps:

Выполнив приблизительную оценку, вы можете вдвое воздействовать на бюджет для двух индексов (разработки и рабочей среды), а затем выбрать свой уровень соответствующим образом.With a rough estimate in hand, you might double that amount to budget for two indexes (development and production) and then choose your tier accordingly.

Оценка с помощью оплачиваемого уровняEstimate with a billable tier

Выделенные ресурсы могут поддерживать большую выборку и время обработки для более реалистичных оценок объема индексов, размера и запросов во время разработки.Dedicated resources can accommodate larger sampling and processing times for more realistic estimates of index quantity, size, and query volumes during development. Некоторые клиенты переходят вправо с помощью оплачиваемого уровня, а затем повторно вычисляют проект разработки.Some customers jump right in with a billable tier and then re-evaluate as the development project matures.

  1. Просмотрите ограничения службы на каждом уровне , чтобы определить, могут ли более низкие уровни поддерживать необходимое количество индексов.Review service limits at each tier to determine whether lower tiers can support the number of indexes you need. Для уровней Basic, S1 и S2 ограничения индекса равны 15, 50 и 200 соответственно.Across the Basic, S1, and S2 tiers, index limits are 15, 50, and 200, respectively. Уровень, оптимизированный для хранилища, имеет ограничение в 10 индексов, поскольку оно предназначено для поддержки небольшого количества очень больших индексов.The Storage Optimized tier has a limit of 10 indexes because it's designed to support a low number of very large indexes.

  2. Создайте службу на платном уровне:Create a service at a billable tier:

    • Если вы не уверены в прогнозируемой нагрузке, начните с Low, Basic или S1.Start low, at Basic or S1, if you're not sure about the projected load.
    • Если вы знаете, что планируется крупномасштабное индексирование и загрузка запросов, начните с уровня S2 или даже S3.Start high, at S2 or even S3, if you know you're going to have large-scale indexing and query loads.
    • Начните с оптимизированного хранилища на уровне L1 или L2, если вы индексируете большой объем данных, а загрузка запросов относительно низкая, как в случае внутреннего бизнес-приложения.Start with Storage Optimized, at L1 or L2, if you're indexing a large amount of data and query load is relatively low, as with an internal business application.
  3. Создайте начальный индекс, чтобы определить, как исходные данные преобразуются в индекс.Build an initial index to determine how source data translates to an index. Это единственный способ оценки размера индекса.This is the only way to estimate index size.

  4. Отслеживайте хранилище, ограничения служб, объем запросов и задержку в портале.Monitor storage, service limits, query volume, and latency in the portal. На портале отображаются запросы в секунду, регулируемые запросы и задержки поиска.The portal shows you queries per second, throttled queries, and search latency. Все эти значения помогут решить, выбран ли подходящий уровень.All of these values can help you decide if you selected the right tier.

Порядковый номер и размер индекса не менее важны для вашего анализа.Index number and size are equally important to your analysis. Это связано с тем, что максимальное количество ограничений достигается за счет полного использования хранилища (секций) или максимальных ограничений на ресурсы (индексы, индексаторы и т. д.), в зависимости от того, что происходит первым.This is because maximum limits are reached through full utilization of storage (partitions) or by maximum limits on resources (indexes, indexers, and so forth), whichever comes first. Портал помогает отслеживать и то, и другое, показывая текущее использование и максимальные ограничения на странице "Обзор".The portal helps you keep track of both, showing current usage and maximum limits side by side on the Overview page.

Примечание

Требования к хранилищу могут быть сведены, если документы содержат лишние данные.Storage requirements can be inflated if documents contain extraneous data. В идеале документы содержат только те данные, которые необходимы для поиска.Ideally, documents contain only the data that you need for the search experience. Двоичные данные недоступны для поиска и должны храниться отдельно (возможно, в таблице Azure или хранилище BLOB-объектов).Binary data isn't searchable and should be stored separately (maybe in an Azure table or blob storage). Поле должно быть добавлено в индекс для хранения URL-ссылки на внешние данные.A field should then be added in the index to hold a URL reference to the external data. Максимальный размер отдельного документа составляет 16 МБ (или меньше, если вы выполняете небольшую загрузку нескольких документов в одном запросе).The maximum size of an individual document is 16 MB (or less if you're bulk uploading multiple documents in one request). Дополнительные сведения см. в статье ограничения службы в когнитивный Поиск Azure.For more information, see Service limits in Azure Cognitive Search.

Рекомендации по объему запросовQuery volume considerations

Количество запросов в секунду (QPS) является важной метрикой во время настройки производительности, но обычно это относится только к уровню, если предполагается, что вы планируете высокий объем запросов.Queries per second (QPS) is an important metric during performance tuning, but it's generally only a tier consideration if you expect high query volume at the outset.

Уровни Standard могут обеспечивать баланс между репликами и секциями.The Standard tiers can provide a balance of replicas and partitions. Вы можете увеличить количество запросов, добавив реплики для балансировки нагрузки или добавив секции для параллельной обработки.You can increase query turnaround by adding replicas for load balancing or add partitions for parallel processing. Затем можно настроить производительность после подготовки службы.You can then tune for performance after the service is provisioned.

Если вы предполагали, что самые высокие объемы запросов будут задерживаться с самого начала, следует рассмотреть более высокие уровни уровня Standard, которые поддерживаются более мощным оборудованием.If you expect high sustained query volumes from the outset, you should consider higher Standard tiers, backed by more powerful hardware. После этого можно перевести секции и реплики в автономный режим или даже переключиться на службу более низкого уровня, если эти тома запросов не выполняются.You can then take partitions and replicas offline, or even switch to a lower-tier service, if those query volumes don't occur. Дополнительные сведения о том, как вычислить пропускную способность запросов, см. в статье производительность и оптимизация когнитивный Поиск Azure.For more information on how to calculate query throughput, see Azure Cognitive Search performance and optimization.

Уровни, оптимизированные для хранилища, полезны для рабочих нагрузок с большими данными и поддерживают более общее Доступное хранилище индексов, когда требования к задержке запросов менее важны.The Storage Optimized tiers are useful for large data workloads, supporting more overall available index storage for when query latency requirements are less important. Вы по-прежнему должны использовать дополнительные реплики для балансировки нагрузки и дополнительные секции для параллельной обработки.You should still use additional replicas for load balancing and additional partitions for parallel processing. Затем можно настроить производительность после подготовки службы.You can then tune for performance after the service is provisioned.

Соглашения об уровне обслуживанияService-level agreements

Бесплатные функции уровня и предварительной версии не обеспечивают соглашения об уровне обслуживания (SLA).The Free tier and preview features don't provide service-level agreements (SLAs). Для всех оплачиваемых уровней соглашения об уровне обслуживания вступают в силу, если для службы обеспечена достаточная избыточность.For all billable tiers, SLAs take effect when you provision sufficient redundancy for your service. Для запроса соглашения об уровне обслуживания (Read) необходимо иметь две или более реплики.You need to have two or more replicas for query (read) SLAs. Необходимо иметь три или более реплики для запросов SLA и индексирования (для чтения и записи).You need to have three or more replicas for query and indexing (read-write) SLAs. Количество секций не влияет на соглашения об уровне обслуживания.The number of partitions doesn't affect SLAs.

Советы по оценке уровняTips for tier evaluation

  • Разрешить метрикам создавать запросы и собирать данные по шаблонам использования (запросы в рабочее время, индексирование в часы наименьшей нагрузки).Allow metrics to build around queries, and collect data around usage patterns (queries during business hours, indexing during off-peak hours). Используйте эти данные для информирования решений о подготовке службы.Use this data to inform service provisioning decisions. Хотя это непрактично для почасовой или ежедневной ритмичности, можно динамически корректировать секции и ресурсы, чтобы учесть запланированные изменения в томах запросов.Though it's not practical at an hourly or daily cadence, you can dynamically adjust partitions and resources to accommodate planned changes in query volumes. Вы также можете обеспечить незапланированные, но устойчивые изменения, если уровни достаточно долго, чтобы гарантировать выполнение действий.You can also accommodate unplanned but sustained changes if levels hold long enough to warrant taking action.

  • Помните, что единственным недостатком при подготовке является то, что вам может потребоваться разорвать службу, если фактические требования больше ваших прогнозов.Remember that the only downside of under provisioning is that you might have to tear down a service if actual requirements are greater than your predictions. Чтобы избежать прерывания работы служб, создайте новую службу на более высоком уровне и запустите ее параллельно, пока все приложения и запросы не будут нацелены на новую конечную точку.To avoid service disruption, you would create a new service at a higher tier and run it side by side until all apps and requests target the new endpoint.

Дальнейшие действияNext steps

Начните с уровня Free и создайте начальный индекс с помощью подмножества данных, чтобы понять его характеристики.Start with a Free tier and build an initial index by using a subset of your data to understand its characteristics. Структура данных в Когнитивный поиск Azure — это обратная структура индекса.The data structure in Azure Cognitive Search is an inverted index structure. Размер и сложность инвертированного индекса определяются содержимым.The size and complexity of an inverted index is determined by content. Помните, что высокоизбыточное содержимое имеет тенденцию приводить к созданию индекса меньшего объема, чем более неоднородное содержимое.Remember that highly redundant content tends to result in a smaller index than highly irregular content. Поэтому характеристики содержимого, а не размер набора данных, определяют требования к хранению индекса.So content characteristics rather than the size of the dataset determine index storage requirements.

После первоначальной оценки размера индекса подготавливается к оплате на одном из уровней, описанных в этой статье: базовый, стандартный или оптимизированный для хранилища.After you have an initial estimate of your index size, provision a billable service on one of the tiers discussed in this article: Basic, Standard, or Storage Optimized. Ослабляете любые искусственные ограничения на размер данных и перестройте индекс , чтобы включить в него все данные, которые необходимо найти.Relax any artificial constraints on data sizing and rebuild your index to include all the data that you want to be searchable.

Выделите секции и реплики по мере необходимости, чтобы получить требуемую производительность и масштабирование.Allocate partitions and replicas as needed to get the performance and scale you require.

Если производительность и емкость являются достаточными, то все готово.If performance and capacity are fine, you're done. В противном случае повторно создайте службу поиска на другом уровне, более точно соответствующем вашим потребностям.Otherwise, re-create a search service at a different tier that more closely aligns with your needs.

Примечание

Если у вас есть вопросы, опубликуйте StackOverflow их по адресу StackOverflow или обратитесь в службу поддержки Azure.If you have questions, post to StackOverflow or contact Azure support.