Новые возможности Azure AI Vision

Статья
03/11/2024

Узнайте, что нового в Azure AI Vision. Проверьте эту страницу, чтобы оставаться в курсе новых функций, улучшений, исправлений и обновлений документации.

Февраль 2024 г.

Многомодальные внедрения общедоступной версии: новая многоязычная модель

API многомодальных внедрения обновлен и теперь общедоступен. Новый 2024-02-01 API включает новую модель, которая поддерживает поиск текста на 102 языках. Исходная модель только на английском языке по-прежнему доступна, но ее нельзя объединить с новой моделью в том же индексе поиска. Если векторизованный текст и изображения с помощью модели только на английском языке, эти векторы несовместимы с многоязычным текстом и векторами изображений.

См. страницу поддержки языка для списка поддерживаемых языков.

2024 января

Новый пакет SDK для анализа изображений 1.0.0-beta.1 (критические изменения)

Пакет SDK для анализа изображений был перезаписан в версии 1.0.0-beta.1, чтобы лучше соответствовать другим пакетам SDK Azure. Все API изменились. Дополнительные сведения об использовании нового пакета SDK см. в обновленных кратких руководствах, примерах и руководствах по использованию нового пакета SDK.

Основные изменения:

Пакет SDK теперь вызывает общедоступную Компьютерное зрение REST API (2023-10-01), Компьютерное зрение а не предварительную версию REST API (2023-04-01-preview).
Добавлена поддержка JavaScript.
C++ больше не поддерживается.
Анализ изображений с пользовательской моделью и сегментирование изображений (фоновое удаление) больше не поддерживается в пакете SDK, так как Компьютерное зрение REST API (2023-10-01) пока не поддерживает их. Чтобы использовать любую функцию, вызовите REST API Компьютерное зрение (2023-04-04-01-preview) напрямую (используя Analyze операции соответственноSegment).

Ноябрь 2023 г.

Анализ изображения 4.0 GA

REST API анализа образа 4.0 теперь находится в общедоступной доступности. Чтобы приступить к работе, следуйте краткому руководству по анализу образа 4.0.

Другие функции анализа изображений, такие как настройка модели, удаление фона и многомодальные внедрения, остаются в общедоступной предварительной версии.

Пакет SDK для распознавания активности лиц на стороне клиента

Пакет SDK Для Распознавания лиц поддерживает обнаружение активности на мобильных или пограничных устройствах пользователей. Он доступен в Java/Kotlin для Android и Swift/Objective-C для iOS.

Наша служба обнаружения активности соответствует требованиям iBeta Level 1 и 2 ISO/IEC 30107-3.

Сентябрь 2023

Отмена устаревших версий API Компьютерное зрение

Компьютерное зрение API версии 1.0, 2.0, 3.0 и 3.1 будут прекращены 13 сентября 2026 г. Разработчики не смогут вызывать API к этим API после этой даты. Мы рекомендуем всем затронутым клиентам перенести свои рабочие нагрузки в общедоступный API Компьютерное зрение 3.2, выполнив это краткое руководство по началу работы. Клиенты также должны рассмотреть возможность миграции на API анализа изображений 4.0 (предварительная версия), который обладает нашими новейшими и наибольшими возможностями анализа изображений.

Ознакомьтесь с нашими вопросами и ответами.

Май 2023 г.

Анализ изображений 4.0 (общедоступная предварительная версия)

API распознавания продуктов позволяют анализировать фотографии полков в розничном магазине. Вы можете обнаружить наличие и отсутствие продуктов и получить их ограничивающие координаты коробки. Используйте его в сочетании с настройкой модели для обучения модели для идентификации конкретных продуктов. Вы также можете сравнить результаты распознавания продуктов с документом планограммы магазина. Распознавание продуктов.

Апрель 2023 г.

Маркеры ограниченного доступа для лиц

Независимые поставщики программного обеспечения (ISV) могут управлять использованием API распознавания лиц своих клиентов, выдавая маркеры доступа, предоставляющие доступ к функциям распознавания лиц, которые обычно включены. Это позволяет клиентам использовать API распознавания лиц без необходимости пройти формальный процесс утверждения. Используйте маркеры ограниченного доступа.

Март 2023 г.

Общедоступная предварительная версия пакета SDK для анализа изображений визуального распознавания ИИ Azure 4.0

Модель основы Флоренции теперь интегрирована в Azure AI Vision. Улучшенные службы визуального распознавания позволяют разработчикам создавать готовые к рынкам приложения Azure AI Vision в различных отраслях. Теперь клиенты могут легко оцифровывать, анализировать и подключать данные к взаимодействию на естественном языке, разблокировать мощные аналитические сведения от своего изображения и видеоконтента для поддержки специальных возможностей, приобретения через SEO, защиты пользователей от вредного содержимого, повышения безопасности и улучшения времени реагирования на инциденты. Дополнительные сведения см. в разделе "Объявление о модели основы Для Флоренции Майкрософт".

Пакет SDK для анализа изображений 4.0 (общедоступная предварительная версия)

Анализ изображений 4.0 теперь доступен через пакеты SDK клиентской библиотеки в C#, C++и Python. Это обновление также включает в себя изображение, на основе Флоренции, подпись и плотное подпись на производительности четности человека.

Анализ изображений версии 4.0 Субтитры и плотное субтитры (общедоступная предварительная версия):

"Заголовок" заменяет "Описание" в версии 4.0 в качестве улучшенного изображения подпись функции расширенных возможностей с подробными сведениями и семантическим пониманием. Плотные субтитры предоставляют более подробную информацию, создавая одно предложение описания до 10 областей изображения в дополнение к описанию всего изображения. Плотные подписи также возвращают ограничивающие координаты прямоугольники описанных областей изображения. Существует также новый параметр с гендерной нейтральностью, позволяющий клиентам выбирать, следует ли включить вероятностное определение пола для замещающего текста и просмотра приложений ИИ. Автоматически доставляет расширенные подпись, доступный замещающий текст, оптимизацию SEO и интеллектуальную курирование фотографий для поддержки цифрового содержимого. Изображения подпись.

Сводка видео и указатель кадров (общедоступная предварительная версия):

Поиск и взаимодействие с видеоконтентом точно так же интуитивно, как вы думаете и пишете. Найдите соответствующее содержимое без необходимости в дополнительных метаданных. Доступно только в Visual Studio.

Настройка модели анализа изображений 4.0 (общедоступная предварительная версия)

Теперь вы можете создавать и обучать собственные пользовательские модели классификации изображений и моделей обнаружения объектов с помощью Visual Studio или REST API версии 4.0.

Интерфейсы API многомодальных внедрения (общедоступная предварительная версия)

Api-интерфейсы многомодальных внедрения, часть API анализа изображений 4.0, позволяют векторизации изображений и текстовых запросов. Они позволяют преобразовать изображения и текст в координаты в многомерном векторном пространстве. Теперь вы можете выполнять поиск по естественному языку и находить соответствующие изображения с помощью векторного поиска сходства.

ИНТЕРФЕЙСы API удаления фона (общедоступная предварительная версия)

В рамках API анализа изображений 4.0 API фонового удаления позволяет удалить фон изображения. Эта операция может выводить изображение обнаруженного объекта переднего плана с прозрачным фоном или изображением альфа-матового цвета серого цвета, показывающее непрозрачность обнаруженного объекта переднего плана.

Предварительная версия azure AI Vision 3.0 и 3.1

Предварительная версия API Azure AI Vision 3.0 и 3.1 планируется выйти из эксплуатации 30 сентября 2023 года. Клиенты не смогут совершать вызовы к этим API-интерфейсам после этой даты. Клиентам рекомендуется перенести рабочие нагрузки в общедоступный API версии 3.2. При миграции с предварительных версий на API версии 3.2 следует учитывать следующие изменения:

Вызовы API анализа изображений и чтения принимают необязательный параметр версии модели, который можно использовать для указания используемой модели ИИ. По умолчанию они используют последнюю модель.
Вызовы API анализа изображений и чтения также возвращают поле model-version в успешных ответах API. В этом поле сообщается, какая модель использовалась.
API Azure AI Vision 3.2 использует другой формат отчетов об ошибках. Сведения о корректировке кода обработки ошибок см. в справочной документации по API.

Октябрь 2022

Анализ изображений визуального распознавания ИИ Azure 4.0 (общедоступная предварительная версия)

Анализ изображений 4.0 выпущен в общедоступной предварительной версии. Новый API включает в себя подпись изображения, теги изображений, обнаружение объектов, интеллектуальные культуры, обнаружение людей и функции OCR чтения, доступные через одну операцию анализа изображений. OCR оптимизирован для общих образов, отличных от документов, в расширенном синхронном API производительности, что упрощает внедрение возможностей OCR в рабочие процессы.

2022 сентября

Azure AI Vision 3.0/3.1 Read previews deprecation

Предварительная версия API чтения Azure AI Vision 3.0 и 3.1 планируется выйти из эксплуатации 31 января 2023 года. Клиентам рекомендуется ознакомиться с руководствами и краткими руководствами, чтобы приступить к работе с общедоступной версией API чтения. Последние версии общедоступной версии предоставляют следующие преимущества:

Последняя общедоступная модель OCR 2022
Значительное расширение охвата языка OCR, включая поддержку рукописного текста
Улучшено качество OCR

Июнь 2022 г.

Запуск Vision Studio

Vision Studio — это средство пользовательского интерфейса, которое позволяет изучать, создавать и интегрировать функции из Azure AI Vision в приложения.

Vision Studio предоставляет платформу для пробного ознакомления с некоторыми функциями службы и позволяет наглядно увидеть, какие данные они возвращают. С помощью Studio можно приступить к работе без написания кода, а затем использовать доступные клиентские библиотеки и REST API в приложении.

Ответственное применение ИИ для распознавания лиц

Примечание о прозрачности лица

Примечание о прозрачности предоставляет рекомендации, помогающие нашим клиентам повысить точность и справедливость своих систем, включив значимый человеческий обзор для обнаружения и устранения случаев неправильной идентификации или других сбоев, обеспечивая поддержку людям, которые считают, что их результаты неверны, и выявление и устранение колебаний точности из-за вариаций в операционных условиях.

Прекращение использования конфиденциальных атрибутов

Мы отставали от возможностей анализа лица, которые предположительно выводили эмоциональные состояния и атрибуты личности, такие как пол, возраст, улыбка, волосы лица, волосы и макияж.
Возможности обнаружения лиц (включая обнаружение размытия, экспозиции, очки, головные очки, ориентиры, шум, окклюзион, ограничивающий лицевой ящик) останутся общедоступными и не требуют приложения.

Пакет Fairlearn и панель мониторинга справедливости от Майкрософт

Пакет Fairlearn с открытым кодом и панель мониторинга справедливости от Майкрософт призваны помочь клиентам измерить справедливость алгоритмов проверки лиц от Майкрософт на их собственных данных. Это позволяет выявлять и устранять потенциальные проблемы со справедливостью, которые могут повлиять на разные демографические группы, до того, как они развернут свою технологию.

Политика ограниченного доступа

В рамках выравнивания лица с обновленным стандартом ответственного искусственного интеллекта новая политика ограниченного доступа была реализована для API распознавания лиц и Azure AI Vision. У существующих клиентов есть один год, чтобы подать заявку и получить одобрение на продолжение доступа к службам распознавания лиц на основе предоставленных ими вариантов использования. Дополнительные сведения об ограниченном доступе для распознавания лиц здесь и azure AI Vision см. здесь.

Нерекомендуемая версия Azure AI Vision 3.2-preview

Предварительные версии API 3.2 планируется вывести из эксплуатации в декабре 2022 года. Клиентам рекомендуется использовать общедоступную версию API. Учитывайте указанные ниже изменения по сравнению с версиями 3.2-preview.

Вызовы API анализа изображений и чтения теперь принимают необязательный параметр model-version, который можно использовать для указания используемой модели ИИ. По умолчанию они используют последнюю модель.
Вызовы API анализа изображений и чтения также возвращают поле model-version в успешных ответах API. В этом поле сообщается, какая модель использовалась.
API анализа изображений теперь используют другой формат отчетов об ошибках. Сведения о корректировке кода обработки ошибок см. в справочной документации по API.

Май 2022 г.

Общедоступная версия модели API распознавания текста (чтение)

Последняя модель API OCR (чтение) Azure AI Vision с 164 поддерживаемыми языками теперь общедоступна как облачная служба и контейнер.

Распознавание текста (OCR) теперь поддерживает печатный текст на 164 языках, включая русский, арабский, хинди и другие языки на основе кириллицы, письменности деванагари и арабской письменности.
Поддержка OCR для рукописного текста теперь охватывает девять языков: английский, испанский, итальянский, китайский (упрощенное письмо), корейский, немецкий, португальский, французский и японский.
Улучшена поддержка распознавания отдельных символов, рукописных дат, сумм, имен и других элементов, часто встречающихся в счетах и накладных.
Улучшена обработка цифровых PDF-документов.
Максимальный размер входного файла увеличен в 10 раз — до 500 МБ.
Улучшена производительность и уменьшена задержка.
Решение доступно в виде облачной службы и контейнера Docker.

Сведения об использовании общедоступной модели см. в руководстве по OCR.

Начало работы с API чтения

2022 февраля

Общедоступная предварительная версия API OCR (чтение) поддерживает 164 языка

API OCR (чтение) azure AI Vision расширяет поддерживаемые языки до 164 с последней предварительной версией:

Поддержка OCR для печати текста расширяется до 42 новых языков, включая арабский, хинди и другие языки с помощью арабских и деванагарий.
Поддержка рукописного ввода для оптического распознавания символов (OCR) расширяется за счет японского и корейского языков в дополнение к английскому, китайскому (упрощенное письмо), французскому, немецкому, итальянскому, португальскому и испанскому.
Среди улучшений была оптимизирована поддержка извлечения рукописных дат, сумм, имен и полей с одним символом.
Общие улучшения производительности и качества искусственного интеллекта

Ознакомьтесь с руководством по OCR, чтобы узнать, как использовать новые функции предварительной версии.

Начало работы с API чтения

Новый атрибут Quality в Detection_01 и Detection_03

Чтобы помочь системным построителям и их клиентам записывать высококачественные изображения, необходимые для высококачественных выходных данных из API распознавания лиц, мы представляем новый атрибут quality QualityForRecognition , чтобы решить, является ли изображение достаточным качеством для попытки распознавания лиц. Значение атрибута — неформальная оценка: низкое, среднее или высокое качество. Новый атрибут доступен только при использовании моделей обнаружения detection_01 или detection_03, а также моделей распознавания recognition_03 или recognition_04 в любой комбинации. Для регистрации пользователей рекомендуется использовать только изображения "высокого" качества, а для сценариев идентификации достаточно "среднего". Дополнительные сведения о новом атрибуте качества см. в разделе Обнаружение и атрибуты лиц, а инструкции по применению — в кратком руководстве.

Сентябрь 2021 года

Общедоступная предварительная версия API OCR (чтение) поддерживает 122 языка

API OCR (чтение) azure AI Vision расширяет поддерживаемые языки до 122 с помощью последней предварительной версии:

OCR поддерживает печатный текст на 49 новых языках, включая русский, болгарский и другие языки на основе кириллицы и латиницы.
OCR поддерживает рукописный текст на 6 новых языках, включая английский, китайский упрощенный, французский, немецкий, итальянский, португальский и испанский.
Усовершенствования обработки цифровых документов PDF и текста машиночитаемой зоны (MRZ) в удостоверениях личности.
Общие улучшения производительности и качества искусственного интеллекта

Ознакомьтесь с руководством по OCR, чтобы узнать, как использовать новые функции предварительной версии.

Начало работы с API чтения

Август 2021 г.

Расширение языка тегирования изображений

Последняя версия (3.2) для средства тегирования изображений теперь поддерживает теги на 50 языках. Дополнительные сведения см. на странице Поддержка языков.

Июль 2021

Оптимизированные атрибуты HeadPose и ориентиры для Detection_03

Модель Detection_03 была обновлена и теперь поддерживает ориентиры лица.
Ориентиры в Detection_03 гораздо точнее, особенно в ориентирах глаз, которые имеют решающее значение для отслеживания взгляда.

2021 мая

Обновление контейнера пространственного анализа

Выпущена новая версия контейнера для пространственного анализа с новым набором возможностей. Этот контейнер Docker позволяет анализировать потоковую передачу видео в реальном времени для распознавания пространственных связей между людьми и их перемещения в физических средах.

Теперь операции пространственного анализа можно настраивать для определения направления, в котором смотрит человек.
- Для операций personcrossingline и personcrossingpolygon можно включить классификатор ориентации, настроив параметр enable_orientation. По умолчанию он имеет значение OFF.
Операции пространственного анализа теперь также предлагают конфигурацию для определения скорости человека во время ходьбы или бега.
- Скорость можно определить для операций personcrossingline и personcrossingpolygon, включив классификатор enable_speed, который по умолчанию отключен. Выходные данные отражаются в параметрах speed, avgSpeed и minSpeed.

Апрель 2021 г.

Azure AI Vision версии 3.2 GA

API визуального распознавания Azure версии 3.2 теперь общедоступен со следующими обновлениями:

Улучшенная модель для назначения тегов изображениям: анализирует визуальное содержимое и создает соответствующие теги на основе объектов, действий и содержимого, присутствующих на изображении. Эта модель доступна через API назначения тегов изображениям. Дополнительные сведения см. в руководстве и обзоре по Анализу изображений.
Обновленная модель модерации контента: обнаруживает наличие содержимого для взрослых и предоставляет флаги для фильтрации изображений с содержимым для взрослых, содержимым непристойного характера или сценами насилия. Эта модель доступна через API анализа. Дополнительные сведения см. в руководстве и обзоре по Анализу изображений.
OCR (чтение) доступен для 73 языков, включая упрощенный и традиционный китайский, японский, корейский и латинский языки.
OCR (чтение) также доступен в виде контейнера без дистрибутива для локального развертывания.

Ознакомьтесь с общедоступной версией Azure AI Vision версии 3.2

Структура данных PersonDirectory (предварительная версия)

Для выполнения операций распознавания лиц, таких как обнаружение и поиск похожих лиц, клиентам API Распознавания лиц необходимо создать список объектов Person. Новый PersonDirectory представляет собой структуру данных, содержащую уникальные идентификаторы, необязательные строки имен и необязательные строки метаданных пользователя для каждого идентификатора Person, добавленного в каталог. В настоящее время API службы Распознавания лиц предлагает структуру LargePersonGroup, которая имеет аналогичную функциональность, но ограничена 1 миллионом идентификаторов. Структура PersonDirectory может масштабироваться до 75 миллионов идентификаторов.
Еще одно важное отличие между PersonDirectory и предыдущими структурами данных заключается в том, что вам больше не нужно будет выполнять какие-либо вызовы Train после добавления лиц в объект Person — процесс обновления происходит автоматически. Дополнительные сведения см. в разделе "Использование структуры PersonDirectory".

Март 2021 г.

Обновление общедоступной предварительной версии azure AI Vision 3.2

Обновлена общедоступная предварительная версия API визуального распознавания Azure версии 3.2. В предварительной версии есть все функции Визуального распознавания ИИ Azure, а также обновленные API чтения и анализа.

См. общедоступную предварительную версию 3.2 в Azure AI Vision версии 3

2021 февраля

В API чтения версии 3.2 (общедоступная предварительная версия) включена функция OCR для 73 языков

Общедоступная предварительная версия API чтения визуального распознавания ИИ Azure версии 3.2, доступная как облачная служба и контейнер Docker, включает следующие обновления:

OCR для 73 языков, включая упрощенный и традиционный китайский, японский, корейский и латинский языки;
естественный порядок чтения для выходных данных строки текста (только для латинских языков);
классификация стилей рукописного ввода для строк текста и оценка достоверности (только для латинских языков);
извлечение текста только для выбранных страниц многостраничного документа;
доступность в качестве контейнера без дистрибутива для локального развертывания.

Чтобы узнать больше, см. руководство по API чтения.

Получить общедоступную предварительную версию API чтения версии 3.2

Новая модель обнаружения API распознавания лиц

Новая модель обнаружения 03 — это наиболее точная модель обнаружения, доступная в настоящее время. Если вы являетесь новым клиентом, рекомендуем использовать именно эту модель. Обнаружение 03 улучшает как уровень полноты, так и точность для мелких лиц, найденных в изображениях (64 x 64 пикселей). Другие улучшения включают общее снижение ложноположительных срабатываний и улучшенное обнаружение в поворотных ориентациях лиц. Объединение обнаружения 03 с новой моделью распознавания 04 также обеспечивает улучшенную точность распознавания. Дополнительные сведения см. в разделе Указание модели обнаружения лиц.

Новые обнаруживаемые атрибуты лиц

Атрибут faceMask доступен с последней моделью обнаружения 03, а также добавленным атрибутом "noseAndMouthCovered", который определяет, носится ли маска лица как предназначенная, охватывая нос и рот. Чтобы использовать новую функцию обнаружения маски, пользователям необходимо указать модель обнаружения в запросе API: назначить версию модели с параметром detectionModel, для которого задано значение detection_03. Дополнительные сведения см. в разделе Указание модели обнаружения лиц.

Новая модель API распознавания лиц

Новая модель распознавания 04 — это самая точная модель распознавания, доступная в настоящее время. Если вы являетесь новым клиентом, рекомендуем использовать именно эту модель для проверки и идентификации. Она повышает точность модели распознавания 03, включая улучшенное распознавание зарегистрированных пользователей с масками на лице (хирургические маски, маски N95, тканевые маски). Рекомендуется регистрировать изображения пользователей, одетых в обложки лиц, так как это приведет к снижению качества распознавания. Теперь клиенты могут создавать надежные и удобные возможности работы для пользователей, позволяющие распознавать наличие маски с помощью последней модели обнаружения 03, а также распознавать лица, используя новую модель распознавания 04. Дополнительные сведения см. в разделе Указание модели распознавания лиц.

2021 января

Обновление контейнера пространственного анализа

Теперь можно настроить операции пространственного анализа для определения того, надето ли на лице человека что-либо, например защитная маска.
- Для операций personcount, personcrossingline и personcrossingpolygon можно включить классификатор масок, настроив параметр ENABLE_FACE_MASK_CLASSIFIER.
- Для каждого человека, обнаруженного в видеопотоке, будут возвращаться атрибуты face_mask и face_noMask как метаданные с оценкой достоверности.
Расширена операция personcrossingpolygon для вычисления время задержки человека в определенной зоне. В конфигурации зоны для операции можно задать параметру type значение zonedwelltime, и новое событие типа personZoneDwellTimeEvent будет содержать поле durationMs с числом миллисекунд, в течение которых пользователь был в определенной зоне.
Критическое изменение: событие personZoneEvent было переименовано в personZoneEnterExitEvent. Это событие вызывается операцией personcrossingpolygon, когда человек пересекает определенную зону или выходит из нее, и предоставляет сведения о направлении и сведения о пересеченной пронумерованной стороной зоны.
URL-адрес можно указать как частный параметр (замаскированный) во всех операциях. Обфускация является необязательной. Она будет работать, только если KEY и IV предоставляются в виде переменных среды.
Калибровка по умолчанию включена для всех операций. Чтобы отключить ее, укажите do_calibration: false.
Включена поддержка автоматической рекалибровки (по умолчанию отключена) с помощью параметра enable_recalibration. Дополнительные сведения см. в статье Операции пространственного анализа.
В DETECTOR_NODE_CONFIG добавлены параметры калибровки камеры. Дополнительные сведения см. в статье Операции пространственного анализа.

Уменьшение задержки

Команда Face опубликовала новую статью, где подробно описываются возможные причины задержки при использовании службы и возможные способы уменьшения ее уровня. См. статью Уменьшение задержки при использовании службы распознавания лиц.

Декабрь 2020 г.

Настройка хранилища ИД лиц на стороне клиента

Несмотря на то, что служба распознавания лиц не сохраняет изображения клиентов, извлеченные характерные черты лиц будут храниться на сервере. ИД лица — это идентификатор характерной черты лица, который будет использоваться в методах Face — Identify, Face — Verify и Face — Find Similar. Срок хранения характерных черт лиц истекает через 24 часа после исходного запроса на обнаружение, после чего они будут удалены. Теперь клиенты могут определить период времени, в течение которого такие ИД лиц будут находиться в кэше. Максимальное значение по-прежнему равно 24 часам, но теперь можно установить минимальное значение в 60 секунд. Новые диапазоны времени для ИД лиц, которые помещаются в кэш, допускают значения от 60 секунд до 24 часов. Дополнительные сведения можно найти в справочнике по API Face — Detect (параметр faceIdTimeToLive).

Ноябрь 2020 г.

Пример приложения регистрации лиц

Команда опубликовала пример приложения регистрации лиц, чтобы продемонстрировать рекомендации по определению обоснованно запрашиваемого согласия и созданию систем высокоточного распознавания лиц благодаря высококачественной регистрации. Пример с открытым исходным кодом можно найти в руководстве Создание приложения регистрации и в GitHub, который разработчики могут использовать при развертывании или настройке.

2020 октября

API визуального распознавания Azure версии 3.1

API визуального распознавания Azure в общедоступной доступности обновлен до версии 3.1.

Сентябрь 2020 г.

Контейнер для пространственного анализа (предварительная версия)

Контейнер для пространственного анализа предоставляется в предварительной версии. Функция пространственного анализа Azure AI Vision позволяет анализировать потоковое видео в режиме реального времени, чтобы понять пространственные связи между людьми и их перемещением через физические среды. Пространственный анализ — это контейнер Docker, который можно использовать в локальной среде.

В API чтения версии 3.1 (общедоступная предварительная версия) включена функция OCR для японского языка

Общедоступная предварительная версия API чтения визуального распознавания ИИ Azure версии 3.1 добавляет следующие возможности:

OCR для японского языка
Для каждой строки текста выберите стиль написания (рукописный или печатный текст) и оценку достоверности (только для латинских языков).
В многостраничных документах извлекать текст можно только для выбранных страниц или диапазона страниц.
Эта предварительная версия API чтения поддерживает английский, голландский, испанский, итальянский, упрощенный китайский, немецкий, португальский, французский и японский языки.

Чтобы узнать больше, см. руководство по API чтения.

Узнайте больше об API чтения версии 3.1 (общедоступная предварительная версия 2)

Август 2020 г.

Управляемое клиентом шифрование неактивных данных

Служба распознавания лиц автоматически шифрует данные перед их сохранением в облаке. Такое шифрование защищает данные и помогает соблюдать корпоративные обязательства по обеспечению безопасности и соответствия требованиям. По умолчанию в подписке используются ключи шифрования, управляемые корпорацией Майкрософт. Подпиской также можно управлять с помощью собственных ключей, которые называются управляемыми клиентом ключами (CMK). Дополнительные сведения см. в статье Ключи, управляемые клиентом.

Июль 2020

В API чтения версии 3.1 (общедоступная предварительная версия) включена функция OCR для китайского языка (упрощенная версия) языка

Общедоступная предварительная версия API распознавания визуального распознавания Azure версии 3.1 добавляет поддержку упрощенного китайского языка.

Эта предварительная версия API чтения поддерживает английский, голландский, французский, немецкий, итальянский, португальский, упрощенный китайский и испанский языки.

Чтобы узнать больше, см. руководство по API чтения.

Узнайте больше об API чтения версии 3.1 (общедоступная предварительная версия 1)

Май 2020 г.

API визуального распознавания Azure версии 3.0 ввел общедоступную доступность с обновлениями API чтения:

поддержкой английского, голландского, французского, немецкого, итальянского, португальского и испанского языков.
Повышенная точность
Оценка достоверности каждого извлеченного слова.
Новый формат вывода.

Чтобы узнать больше, см. Общие сведения об OCR.

Апрель 2020 г.

Новая модель API распознавания лиц

Новая модель распознавания 03 — это самая точная модель, доступная в настоящее время. Если вы являетесь новым клиентом, рекомендуем использовать именно эту модель. Распознавание 03 обеспечивает улучшенную точность для сравнения сходства и сравнения сопоставления с пользователем. Дополнительные сведения см. в статье Указание модели распознавания лиц.

Март 2020 г.

TLS 1.2 теперь применяется для всех HTTP-запросов к этой службе. Дополнительные сведения см. в статье "Безопасность служб искусственного интеллекта Azure".

Январь 2020 г.

Общедоступная предварительная версия API чтения 3.0

Теперь вы можете использовать API чтения (версия 3.0), чтобы извлекать печатный или рукописный текст из изображений. По сравнению с предыдущими версия 3.0 предоставляет:

Повышенная точность
Новый формат вывода.
Оценка достоверности каждого извлеченного слова.
Поддержка испанского и английского языков с языковым параметром.

Выполните указания Краткого руководства по извлечению текста, чтобы начать использовать API 3.0.

2019 июня

Новая модель обнаружения API распознавания лиц

Новая модель обнаружения 02 обеспечивает более высокую точность для изображений с небольшими лицами, лицами при виде сбоку, частично перекрытыми и размытыми лицами. Для использования этой модели в методах Face — Detect, FaceList — Add Face, LargeFaceList — Add Face, PersonGroup Person — Add Face и LargePersonGroup Person — Add Face нужно указать имя новой модели обнаружения лиц detection_02 в параметре detectionModel. Дополнительные сведения см. в статье Указание модели обнаружения.

Апрель 2019 г.

Повышенная точность атрибутов

Повышен уровень общей точности атрибутов age и headPose. Атрибут headPose также обновлен и поддерживает значение pitch. Эти атрибуты можно указать в параметре returnFaceAttributes для параметра Face — DetectreturnFaceAttributes.

Повышенная скорость обработки

Увеличена скорость выполнения операций для методов Face — Detect, FaceList — Add Face, LargeFaceList — Add Face, PersonGroup Person — Add Face и LargePersonGroup Person — Add Face.

март 2019 г.

Новая модель API распознавания лиц

Модель распознавания 02 имеет более высокую точность. Используйте ее с помощью методов Face - Detect, FaceList — Create, LargeFaceList — Create, PersonGroup — Create и LargePersonGroup — Create. Для этого укажите имя новой модели распознавания лиц recognition_02 в параметре recognitionModel. Дополнительные сведения см. в статье Указание модели распознавания.

январь 2019 г.

Функция Face Snapshot

Эта функция позволяет службе поддерживать перенос данных между подписками: Snapshot.

Внимание

По состоянию на 30 июня 2023 г. API моментального снимка лиц отключено.

2018 октября

Сообщения API

Четкое описание для status, createdDateTime, lastActionDateTime и lastSuccessfulTrainingDateTime см. в PersonGroup — Get Training Status (PersonGroup — получение состояния обучения), LargePersonGroup — Get Training Status (LargePersonGroup — получение состояния обучения) и LargeFaceList — Get Training Status (LargeFaceList — получение состояния обучения).

Май-2018

Повышенная точность атрибутов

Значительно улучшено поведение атрибута gender, а также улучшены атрибуты age, glasses, facialHair, hair и makeup. Вы можете использовать их в параметре returnFaceAttributes метода Face — Detect.

Увеличен предельный размер файла

Предельный размер файла изображения увеличен с 4 МБ до 6 МБ для методов Face — Detect, FaceList — Add Face, LargeFaceList — Add Face, PersonGroup Person — Add Face и LargePersonGroup Person — Add Face.

март 2018 г.

Новая структура данных

LargeFaceList и LargePersonGroup. Дополнительные сведения о масштабировании для обработки дополнительных зарегистрированных пользователей.
Для параметра maxNumOfCandidatesReturned в методе Face — Identify расширен диапазон с [1, 5] до [1, 100], а значение по умолчанию — 10.

май 2017 г.

Новые обнаруживаемые атрибуты лиц

Добавлены атрибуты hair, makeup, accessory, occlusion, blur, exposure и noise в параметре returnFaceAttributes метода Face — Identify.
Для PersonGroup в методе Face — Identify поддерживаются до 10 000 пользователей.
Добавлено разбиение на страницы в методе PersonGroup Person — List с использованием необязательных параметров start и top.
Добавлена поддержка параллелизма при добавлении и удалении лиц для разных FaceLists и разных людей в PersonGroup.

март 2017 г.

Новый обнаруживаемый атрибут лиц

Добавлен атрибут emotion в параметре returnFaceAttributes метода Face — Detect.

Устраненные проблемы

Не удавалось повторно обнаружить лицо с наложенным прямоугольником, который возвращается методом Face — Detect в качестве targetFace в FaceList — Add Face и PersonGroup Person — Add Face.
Размер обнаруживаемого лица находится строго в диапазоне от 36×36 до 4096×4096 пикселей.

Ноябрь 2016 г.

Новый уровень подписки

Добавлена подписка категории "Стандартный" для Хранилища изображений лиц, которая позволяет сохранять между сеансами дополнительные изображения лиц и использовать их в PersonGroup Person — Add Face или FaceList — Add Face для идентификации людей или поиска похожих. За хранение изображений взимается плата: 0,5 долл. США за 1000 изображений лиц. Плата распределяется пропорционально за каждый день. Для подписки категории "Бесплатный" сохраняется ограничение на общее количество людей — до 1000 человек.

Октябрь 2016 г.

Сообщения API

Изменено сообщение об ошибке, возникающее при передаче сведений о нескольких лицах в метод targetFace. Вместо "There are more than one face in the image" теперь возвращается строка "There is more than one face in the image" в методах FaceList — Add Face и PersonGroup Person - Add Face.

июль 2016 г.

Новые возможности

Добавлена поддержка аутентификации путем сравнения идентификатора лица с идентификатором объекта Person в методе Face — Verify.
Добавлен необязательный параметр mode, который позволяет выбрать один из двух режимов работы (matchPerson или matchFace) в методе Face — Find Similar. По умолчанию используется значение matchPerson.
Добавлен необязательный параметр confidenceThreshold, с помощью которого пользователь может задать порог привязки лица к объекту Person в методе Face — Identify.
Добавлены необязательные параметры start и top в методе PersonGroup — List, с помощью которых пользователь может указать начальную точку и общее число отображаемых групп PersonGroup.

Отличия версии 1.0 от версии 0

Корневая конечная точка службы изменена с https://westus.api.cognitive.microsoft.com/face/v0/ на https://westus.api.cognitive.microsoft.com/face/v1.0/. Внесены изменения в методы Face — Detect, Face — Identify, Face — Find Similar и Face — Group.
Минимальный размер обнаруживаемого лица изменен на 36×36 пикселей. Теперь лица размером менее 36×36 не обнаруживаются.
Данные PersonGroup и Person в интерфейсе распознавания лиц версии 0 объявлены нерекомендуемыми. Эти данные недоступны в службе распознавания лиц версии 1.0.
Конечная точка API распознавания лиц версии 0 объявлена нерекомендуемой с 30 июня 2016 г.

Обновления служб ИИ Azure

Объявления об обновлении Azure для служб ИИ Azure