Обнаружение лиц, атрибуты и входные данные

Внимание

Доступ к службе "Распознавание лиц" ограничен на основе соответствия требованиям и критериев использования для реализации поддержки наших принципов ответственного ИИ. Служба "Распознавание лиц" доступна только для клиентов и партнеров, управляемых корпорацией Майкрософт. Используйте форму приема Распознавания лиц, чтобы подать заявку на доступ. Дополнительные сведения см. на странице с ограниченным доступом для лиц.

Важно!

Прогноз атрибутов лица осуществляется с помощью статистических алгоритмов. Они не всегда точны. Будьте внимательны, когда принимаете решения, основываясь на данных атрибутах. Пожалуйста, воздержаться от использования этих атрибутов для защиты от спуфингов. Вместо этого рекомендуется использовать обнаружение Распознавания лиц в реальном времени. Дополнительные сведения см. в руководстве по обнаружению активности лиц.

В этой статье объясняются основные понятия, связанные с определением лиц и данными их атрибутов. Определение лиц — это процесс, который позволяет найти лица людей на изображении и при необходимости с их помощью получить различные сведения.

Чтобы определить лицо на изображении, используется API Face — Detect. Чтобы приступить к работе с REST API или клиентским пакетом SDK, следуйте инструкциям из краткого руководства. Кроме того, более подробные инструкции см. в разделе Вызов API распознавания.

Границы лица

Каждое распознанное лицо соответствует полю faceRectangle в ответе. Этот набор пиксельных координат левой и верхней сторон, а также ширины и высоты распознанного лица. С помощью этих координат можно получить сведения о расположении лица и его размере. В ответе API лица расположены в списке по размеру — от наибольшего к наименьшему.

Быстро и легко опробуйте возможности распознавания лиц с помощью Vision Studio.

Идентификатор лица

Идентификатор лица — это строка уникального идентификатора для каждого распознанного лица на изображении. Идентификатор лица требует утверждения ограниченного доступа, к которому можно применить, заполнив форму приема. Дополнительные сведения см. на странице с ограниченным доступом для лиц. Идентификатор лица можно запросить в вызове API Face — Detect.

Ориентиры лица

Ориентиры лица — это ряд легко распознаваемых точек на лице, например зрачки глаз или кончик носа. По умолчанию используются 27 предопределенных точек ориентиров. На следующем рисунке изображены все 27 точек:

A face diagram with all 27 landmarks labeled

Координаты точек получают в пикселях.

Модель Detection_03 в настоящее время имеет наиболее точное определение ориентира. Ориентиры глаз и зрачков, которые она возвращает, достаточно точны, чтобы позволить отслеживание взгляда на лице.

Атрибуты

Внимание

Корпорация Майкрософт отставила возможности распознавания лиц, которые можно использовать для вывода эмоциональных состояний и атрибутов личности, которые, если неправильно используются, могут подвергать людей стереотипной дискриминации, дискриминации или несправедливого отказа в обслуживании. К ним относятся возможности, которые предсказывают эмоции, гендер, возраст, улыбку, волосы на лице, прическу и макияж. Дополнительные сведения об этом решении см. здесь.

Атрибуты — это набор черт лица, которые при необходимости могут быть обнаружены API-интерфейсом Face — Detect. Можно распознать следующие атрибуты:

  • Аксессуары. Указывает, имеет ли данное лицо аксессуары. Этот атрибут предоставляет данные о возможных аксессуарах, включая головные уборы, очки и маски, с оценкой достоверности от нуля до единицы для каждого аксессуара.

  • Размытие. Размытость лица на изображении. Этот атрибут предоставляет значение от нуля до единицы и определяет уровень размытия: низкий, средний или высокий.

  • Экспозиция. Экспозиция лица на изображении. Этот атрибут возвращает значение от нуля до одного и дает неформальную оценку по следующим критериям: underExposure, goodExposure или overExposure.

  • Очки. Определение наличия очков на указанном лице. Возможные значения: NoGlasses, ReadingGlasses, Sunglasses, и Swimming Goggles.

  • Поворот головы. Положение лица в трехмерном пространстве. Этот атрибут описывается углами крена, рыскания и тангажа в градусах, которые определяются в соответствии с правилом правой руки. Порядок трех углов — крен-рыскание-тангаж, а диапазон значений каждого угла — от -180 градусов до 180 градусов. Трехмерная ориентация лица оценивается по порядку углами крена, рыскания и тангажа. Для сопоставления углов см. следующую диаграмму:

    A head with the pitch, roll, and yaw axes labeled

    Дополнительные сведения об использовании этих значений см. в руководстве по настройке головного руководства.

  • Маска. Указывает, носит ли лицо маску. Этот атрибут возвращает сведения о возможном типе маски, а также логическое значение, которое определяет, закрывает ли маска нос и рот.

  • Шум. Визуальный шум, обнаруженный на изображении лица. Этот атрибут предоставляет значение от нуля до единицы и определяет уровень размытия: низкий, средний или высокий.

  • Помехи. Указывает, есть ли объекты, блокирующие части лица. Этот атрибут возвращает такие логические значения, как eyeOccluded, foreheadOccluded, and mouthOccluded.

  • QualityForRecognition. Общее качество изображения в плане того, имеет ли изображение, используемое в обнаружении, достаточно высокое качество для целей распознавания лиц. Значение атрибута — неформальная оценка: низкое, среднее или высокое качество. Для регистрации пользователя рекомендуется использовать только изображения "высокого" качества, а для сценариев идентификации достаточно "среднего".

    Примечание.

    Доступность каждого атрибута зависит от указанной модели обнаружения. Атрибут QualityForRecognition также зависит от модели распознавания, так как в настоящее время он доступен только при использовании сочетания модели обнаружения detection_01 или detection_03 и модели распознавания recognition_03 или recognition_04.

Требования к входным данным

Воспользуйтесь следующими советами, чтобы убедиться, что ваши входные изображения дают наиболее точные результаты распознавания:

  • Поддерживаемые форматы входных изображений: JPEG, PNG, GIF (первый кадр), BMP.
  • Размер изображения не должен превышать 6 МБ.
  • Минимальный размер лица, которое может быть распознано, составляет 36 x 36 пикселей в изображении с размером не более 1920 x 1080 пикселей. На изображениях с размером более 1920 x 1080 пикселей распознаваемые лица имеют пропорционально больший размер. Уменьшение размера лица может привести к тому, что некоторые лица не будут обнаружены, даже если они больше минимального размера лица.
  • Максимальный размер распознаваемого лица составляет 4096 х 4096 пикселей.
  • Лица, не входящие в диапазон размера от 36 x 36 до 4096 x 4096 пикселей, не будут распознаны.

Входные данные со сведениями об ориентации:

Некоторые входные изображения с форматом JPEG могут содержать сведения о ориентации в метаданных файла изображений Exchangeable (EXIF). Если ориентация EXIF доступна, изображения автоматически поворачиваются на правильную ориентацию перед отправкой для обнаружения лиц. Прямоугольник лица, ориентиры и позы головы для каждого обнаруженного лица оцениваются на основе повернутого изображения.

Чтобы правильно отобразить прямоугольную рамку вокруг лица и ориентиры, необходимо убедиться в том, что изображение повернуто правильно. Большинство средств визуализации изображений автоматически поворачивают изображение в соответствии с его ориентацией EXIF по умолчанию. Для других средств может потребоваться применить поворот с помощью собственного кода. В следующих примерах показана прямоугольная рамка вокруг лица на повернутом изображении (слева) и в неповернутом изображении (справа).

Two face images with and without rotation

Входные видео

Если вы хотите определить лица из видео, можно повысить производительность, изменив определенные параметры видеокамеры:

  • Сглаживание. Многие видеокамеры обладают эффектом сглаживания. Эту функцию следует отключить, если это возможно, так как она создает размытие между кадрами и понижает четкость изображения.

  • Скорость затвора. Более высокая скорость затвора сокращает движение между кадрами и повышает четкость изображения. Мы рекомендуем установить для скорости затвора частоту 1/60 секунды или выше.

  • Угол затвора. В некоторых камерах вместо скорости затвора указан угол затвора. По возможности используйте нижний угол затвора. Это приводит к более четкому видеокадру.

    Примечание.

    Камера с нижним углом затвора получает меньше освещения в каждом кадре, поэтому при такой съемке изображение будет темнее. Для оптимального использования необходимо определить подходящий уровень.

Следующие шаги

Теперь, когда вы уже знакомы с основными понятиями о функции определения лиц, узнайте, как написать сценарий, который поможет вам распознать лица на определенном изображении.