Часто задаваемые вопросы об API компьютерного зрения

Совет

Если вы не найдете ответ на свой вопрос в этом списке, попробуйте обратиться к сообществу разработчиков для API компьютерного зрения на сайте StackOverflow или связаться со службой поддержки UserVoice.

Как увеличить количество транзакций в секунду, разрешенных службой?

Для уровня "бесплатный" (S0) разрешено только 20 транзакций в минуту. Повысьте уровень до S1, чтобы выполнялось до 30 транзакций в секунду. Если вы видите код ошибки 429 и сообщение об ошибке "Слишком большое количество запросов", отправьте запрос в службу поддержки Azure, чтобы повысить свое количество транзакций в секунду до 50 или больше, представив краткое экономическое обоснование. Цены на Компьютерное зрение.

В службе происходит ошибка, так как файл изображения слишком большой. Как решить эту проблему?

Максимальный размер файла для большинства функций службы "Компьютерное зрение" составляет 4 МБ, однако пакеты SDK клиентской библиотеки поддерживают работу с файлами размером до 6 МБ. Для службы оптического распознавания символов (OCR), которая обрабатывает многостраничные документы, максимальный размер файла составляет 50 МБ. Дополнительные сведения см. в разделе Ограничения по входным данным анализа изображений и Ограничения по входным данным OCR.

Как обрабатывать многостраничные документы с помощью оптического распознавания текста в одном вызове?

Оптическое распознавание символов, в частности операция чтения, поддерживает многостраничные документы в качестве входных данных для API. При вызове API с 10-страничным документом будет взиматься плата за 10 страниц, при этом каждая страница считается оплачиваемой. Обратите внимание, что для уровня "бесплатный" (S0) поддерживается обработка одновременно не более двух страниц.

Можно ли отправлять в службе "Компьютерное зрение" несколько изображений в одном вызове API?

Эта функция в настоящее время недоступна.

Сколько языков поддерживается для анализа изображений и оптического распознавания символов?

Список языков, поддерживаемых для анализа изображений и оптического распознавания символов, см. на странице Поддержка языков.

Можно ли обучить API компьютерного зрения использованию настраиваемых тегов? Например, мне нужно передавать изображения различных пород кошек, чтобы обучить ИИ, а затем получать значение породы по запросу ИИ.

Эта функция сейчас недоступна. Пользовательское визуальное распознавание можно использовать для обучения модели в целях обнаружения пользовательских визуальных элементов.

Можно ли развернуть функцию OCR (чтение) локально?

Да, облачный API для OCR (чтение) также доступен в качестве контейнера Docker для локального развертывания. Узнайте, как развертывать контейнеры OCR.

Можно ли использовать API компьютерного зрения для чтения номерных знаков?

API компьютерного зрения поддерживает оптическое распознавание текста на основе глубокого обучения в сочетании с последней версией функции чтения. Мы постоянно улучшаем наши службы для использования во всех сценариях.