Маркировка изображений и текстовых документов

После создания проекта администратора проекта Машинное обучение Azure проекта маркировки изображений или проекта Машинное обучение Azure текстовых меток можно использовать средство маркировки для быстрого подготовки данных для проекта Машинное обучение. В этой статье рассматриваются следующие вопросы:

  • Доступ к проектам маркировки
  • Средства добавления меток
  • Сведения об использовании средств для конкретных задач маркировки

Необходимые компоненты

Вход в Студию

  1. Войдите в Студию машинного обучения Azure.

  2. Выберите подписку и рабочую область, содержащую проект маркировки. У администратора проекта есть эти сведения.

  3. Вы можете заметить несколько разделов слева в зависимости от уровня доступа. Если это сделать, выберите метки данных в левой части, чтобы найти проект.

Понимание задачи маркировки

В таблице проекта маркировки данных выберите ссылку "Данные метки" для проекта.

Вы увидите инструкции, относящиеся к проекту. Они объясняют тип участвующих данных, способ принятия решений и другую соответствующую информацию. Прочитайте сведения и выберите "Задачи " в верхней части страницы. Вы также можете выбрать начальную метку в нижней части страницы.

Выбор метки

Во всех задачах маркировки данных вы выбираете соответствующий тег или теги из набора, указанного администратором проекта. Для выбора первых девяти тегов можно использовать клавиши номера клавиатуры.

Полуавтоматическое машинное обучение

Алгоритмы машинного обучения могут быть активированы во время маркировки данных. Если в проекте включены эти алгоритмы, вы можете увидеть следующее:

  • изображения;

    • После маркировки некоторого объема данных вы можете заметить , что задачи, кластеризованные в верхней части экрана, рядом с именем проекта. Изображения группируются вместе, чтобы представить похожие изображения на одной странице. Если вы заметили это, перейдите к одному из нескольких представлений изображений, чтобы воспользоваться преимуществами группировки.

    • Позже вы можете заметить, что задачи предварительно помечены рядом с именем проекта. Элементы отображаются с предлагаемой меткой, созданной моделью классификации машинного обучения. Ни одна из моделей машинного обучения не обеспечивает 100%-ю точность. Хотя мы используем только данные, для которых модель имеет уверенность, эти значения данных по-прежнему могут иметь неправильные предустановки. Когда вы заметите метки, исправьте все неправильные метки перед отправкой страницы.

    • Для моделей идентификации объектов можно заметить ограничивающие прямоугольники и метки, которые уже присутствуют. Исправьте все ошибки перед отправкой страницы.

    • Для моделей сегментации можно заметить многоугольники и метки, которые уже присутствуют. Исправьте все ошибки перед отправкой страницы.

  • Текст

    • В конечном итоге вы увидите, что задачи предварительно помечены рядом с именем проекта. Элементы отображаются с предлагаемой меткой, которую создает модель классификации машинного обучения. Ни одна из моделей машинного обучения не обеспечивает 100%-ю точность. Хотя мы используем только данные, для которых модель уверена, эти значения данных по-прежнему могут быть неправильно помечены. При появлении этих меток перед отправкой страницы исправьте те из них, которые назначены неправильно.

В начале проекта маркировки модель машинного обучения может иметь достаточно точности для предварительного обозначения небольшого подмножества изображения. После маркировки этих изображений проект маркировки вернется к ручной маркировке, чтобы собрать дополнительные данные для следующего раунда обучения модели. Со временем модель станет более уверенной в более высокой пропорции изображений. Позже в проекте его уверенность приводит к более предварительным задачам.

Если нет дополнительных предварительно заданных задач, вы перестаете подтвердить или исправлять метки, а затем вернитесь к тегам вручную.

Задачи образов

В задачах классификации образов вы можете отображать несколько образов одновременно. Используйте значки над областью изображения, чтобы выбрать макет.

Чтобы выбрать сразу все отображаемые изображения, нажмите Select all (Выбрать все). Круглая кнопка выбора в правом верхнем углу изображения позволяет выбрать конкретное изображение. Чтобы присвоить тег, нужно выбрать по меньшей мере одно изображение. При выборе нескольких изображений любой тег, который вы выбрали, применяется ко всем выбранным изображениям.

Здесь мы выбрали двухуровневый макет и применили тег "Млекопитающие" к изображениям медведя и коски. Изображение акулы уже отмечено как "Картилагинская рыба", и игуана еще не имеет тега.

Multiple image layouts and selection

Важно!

Переключение макетов только при наличии новой страницы неназначенных данных. Переключение макетов очищает выполняющиеся операции добавления тегов на страницу.

После тега всех изображений на странице Azure включает кнопку "Отправить ". Нажмите Отправить, чтобы сохранить работу.

После отправки тегов для отображаемых данных Azure обновит страницу, предоставив новый набор изображений из рабочей очереди.

Задачи медицинской визуализации

Важно!

Возможность помечать изображения в формате DICOM или изображения похожих типов не предназначена для использования в контексте медицинских устройств, клинической поддержки, диагностических средств или других технологий, предназначенных для диагностики, лечения, облегчения симптомов или предотвращения заболеваний или других состояний, и ни одна из лицензий или прав не предоставляется корпорацией Майкрософт для использования этой возможности в таких целях. Эта возможность не предназначена для реализации или развертывания в качестве замены профессиональных медицинских консультаций или врачебного мнения, диагностики, лечения или клинической оценки, проводимых специалистами в сфере здравоохранения, и не должна использоваться таким образом. Клиент несет полную ответственность за использование меток для изображений в формате DICOM или изображений похожих типов.

Проекты изображений поддерживают формат DICOM для файлов рентгеновских снимков.

X-ray DICOM image to be labeled.

Хотя вы наклеит медицинские изображения с теми же инструментами, что и любые другие изображения, вы можете использовать другое средство для образов DICOM. Выберите средство Окно и уровень, чтобы изменить насыщенность изображения. Это средство доступно только для изображений в формате DICOM.

Window and level tool for DICOM images.

Присвоение изображениям тегов для многоклассовой классификации

Назначьте один тег всему изображению для типа проекта "Классификация изображений с несколькими классами". Чтобы просмотреть направления в любое время, перейдите на страницу "Инструкции " и выберите "Просмотреть подробные инструкции".

Если вы заметите ошибку после присвоения тега изображению, ее можно исправить. Выберите "X" на метку, отображаемую под изображением, чтобы очистить тег. Вы также можете выбрать изображение и выбрать другой класс. Только что выбранное значение заменяет ранее примененный тег.

Присвоение изображениям тегов для классификации с несколькими метками

Если проект имеет тип "Классификация изображений с несколькими метками", к изображению применяется один или несколько тегов. Чтобы просмотреть направления для конкретного проекта, выберите "Инструкции" и перейдите в раздел "Просмотр подробных инструкций".

Выберите изображение, которое нужно наметить, и выберите тег. Этот тег применяется ко всем выбранным изображениям, после чего выбор изображений отменяется. Чтобы применить новые теги, необходимо повторно выбрать изображения. В следующей анимации демонстрируется процесс присвоения тегов с несколькими метками.

  1. Функция Выбрать все используется для применения тега Ocean (Океан)
  2. Выбрано одно изображение с тегом Closeup (Крупный план).
  3. Выбраны три изображения с тегом Wide angle (Широкий угол).

Animation shows multilabel flow

Чтобы исправить ошибку, выберите "X", чтобы очистить отдельный тег, или выберите изображения, а затем выберите тег, чтобы очистить тег со всех выбранных изображений. Вот как выглядит этот сценарий. При выборе "Земля" удаляется тег из двух выбранных изображений.

A screenshot shows multiple deselections

Azure включает только кнопку "Отправить" после применения хотя бы одного тега к каждому изображению. Нажмите Отправить, чтобы сохранить работу.

Расстановка тегов и ограничивающих прямоугольников для обнаружения объектов

Если проект имеет тип "Идентификация объектов (ограничивающие прямоугольники), укажите один или несколько ограничивающих прямоугольник в изображении и примените тег к каждому прямоугольнику. Изображения могут иметь несколько ограничивающих прямоугольников, каждый из которых имеет один тег. Используйте подробные инструкции по просмотру, чтобы определить, использует ли проект несколько ограничивающих прямоугольников.

  1. Выберите тег для ограничивающего поля, который вы планируете создать.
  2. Выберите прямоугольник или Rectangular box toolвыберите "R".
  3. Выберите и диагонали перетащите по целевому объекту, чтобы создать грубое ограничивающее поле. Перетащите края или углы, чтобы настроить ограничивающий прямоугольник.

Bounding box creation

Чтобы удалить ограничивающий прямоугольник, выберите значок с изображением креста (X), который отображается рядом с ограничивающим прямоугольником после его создания.

Вы не можете изменить тег для уже существующего ограничивающего прямоугольника. Чтобы исправить ошибку назначения тегов, необходимо удалить ограничивающий прямоугольник и создать новый с правильным тегом.

По умолчанию вы можете изменять существующие ограничивающие прямоугольники. Средство блокировки и разблокировки регионовLock/unlock regions tool или "L" переключает это поведение. Если регионы заблокированы, вы можете изменить форму и/или расположение только для нового ограничивающего прямоугольника.

Используйте средство This is the regions manipulation tool icon - four arrows pointing outward from the center, up, right, down, and left.обработки регионов или "M", чтобы настроить существующее ограничивающее поле. Перетаскивайте края или углы, чтобы скорректировать форму. Выберите в интерьере, если вы хотите перетащить весь ограничивающий прямоугольник. Если вы не можете изменить регион, вы, вероятно, переключили средство блокировки и разблокировки регионов .

Используйте средство Template-box toolполя на основе шаблона или T, чтобы создать несколько ограничивающих прямоугольник одного размера. Если на изображении нет ограничивающих прямоугольник, и вы активируете поля на основе шаблонов, средство создает 50-50 пикселей. Если вы создаете ограничивающий прямоугольник, а затем активируете поля на основе шаблонов, размер всех новых ограничивающих полей соответствует размеру созданного последнего поля. После размещения можно изменить размер полей на основе шаблона. Изменение размера прямоугольника, созданного по шаблону, влияет только на этот конкретный прямоугольник.

Чтобы удалить все ограничивающие прямоугольники в текущем изображении, выберите средство Delete regions tool"Удалить все регионы".

После создания ограничивающих прямоугольников для изображения выберите Отправить, чтобы сохранить работу.

Присвоение изображениям тегов и указание прямоугольников для сегментации изображений

Если проект имеет тип "Сегментация экземпляров (Многоугольник),укажите один или несколько многоугольников на изображении и примените тег к каждому многоугольнику. Изображения могут иметь несколько ограничивающих прямоугольников, каждый из которых имеет один тег. Используйте подробные инструкции по просмотру, чтобы определить, использует ли проект несколько ограничивающих многоугольников.

  1. Выберите тег для прямоугольника, который вы хотите создать.

  2. Выберите инструмент Draw polygon region toolобласти рисования многоугольника или выберите "P".

  3. Щелкните каждую точку многоугольника. После завершения фигуры дважды щелкните, чтобы завершить.

    Create polygons for Cat and Dog

Чтобы удалить многоугольник, щелкните значок с изображением креста (X), который отображается рядом с многоугольником после его создания.

Чтобы изменить тег многоугольника, выберите инструмент "Переместить регион ", выберите многоугольник и выберите правильный тег.

Вы можете изменить существующие многоугольники. Инструмент Edit polygons with the lock/unlock regions tool"Блокировка и разблокировка регионов" или "L", переключает это поведение. Если регионы заблокированы, вы можете изменить форму и/или расположение только для нового многоугольника.

Используйте средство This is the add or remove polygon points tool icon."Добавить или удалить точки многоугольника" или "U", чтобы настроить существующий многоугольник. Щелкните многоугольник, чтобы добавить или удалить точку. Если вы не можете изменить регион, вы, вероятно, переключили средство блокировки и разблокировки регионов .

Чтобы удалить все многоугольники в текущем изображении, выберите средство Delete all regions tool"Удалить все регионы".

После создания многоугольников для изображения выберите Отправить, чтобы сохранить работу.

Теги изображений и маски рисования для семантической сегментации

Если проект имеет тип "Семантическая сегментация (предварительная версия),используйте кисть кисть маску над областью, которую вы хотите пометить.

  1. Выберите тег для области, нарисуемой.

  2. Выберите средство Screenshot of the Paintbrush tool.кисти.

  3. Выберите средствоScreenshot of the Size tool. размера, чтобы выбрать размер кисти.

  4. Закрашивать область, которую вы хотите пометить. Цвет, соответствующий тегу, будет применен к области, нарисоной.

    Screenshot of paint area for cat and dog faces for semantic segmentation.

Чтобы удалить части области, выберите средство "Ластик ".

Чтобы изменить тег области, выберите новый тег и перекрасите область.

Вы также можете использовать средство Polygon для указания региона.

После создания областей для изображения нажмите кнопку "Отправить ", чтобы сохранить работу, или не будет сохранена работа. Если вы использовали инструмент Polygon, все многоугольники будут преобразованы в маску при отправке.

Текст метки

При теге текста используйте панель инструментов для:

  • увеличение или уменьшение размера текста;
  • Изменение шрифта
  • пропуск создания заметок для определенного элемента и переход к следующему элементу.

Если вы заметили, что вы сделали ошибку после назначения тега, его можно исправить. Выберите значок X на метке, которая отображается под текстом, чтобы очистить тег.

Существует три типа текстовых проектов.

Тип проекта Описание
Многоклассовая классификация Присвойте один тег всей текстовой записи. Для каждого текстового элемента можно выбрать только один тег. Выберите тег и нажмите кнопку "Отправить ", чтобы перейти к следующей записи.
Классификация с несколькими метками Присвойте один или несколько тегов каждой текстовой записи. Можно выбрать несколько тегов для каждого текстового элемента. Выберите все теги, которые применяются, и нажмите кнопку "Отправить ", чтобы перейти к следующей записи.
Распознавание именованных сущностей Помечайте тегами различные слова или фразы в каждой текстовой записи. См. инструкции в следующем разделе.

Чтобы просмотреть направления для конкретного проекта, выберите "Инструкции" и перейдите в раздел "Просмотр подробных инструкций".

Тег слов и фраз

Если проект настроен для распознавания именованных сущностей, вы помечаете тегами различные слова или фразы в каждом текстовом элементе. Для маркировки текста сделайте следующее.

  1. Выберите метку или введите номер, соответствующий соответствующей метки.
  2. Дважды щелкните слово или выберите несколько слов с помощью мыши.

Screenshot: Named entity recognition.

Чтобы изменить метку, можно выполнить следующие действия.

  • Удалите метку и запустите ее.
  • Измените значение для некоторых или всех определенных меток в текущем элементе:
    • Выберите саму метку, которая выбирает все экземпляры этой метки.
    • Снова выберите экземпляры этой метки, чтобы отменить выбор всех экземпляров, которые вы хотите сохранить.
    • Наконец, выберите новую метку, чтобы изменить все выбранные метки.

После тега всех элементов в записи нажмите кнопку "Отправить ", чтобы перейти к следующей записи.

Завершение

После отправки страницы данных с тегами Azure назначит вам новый набор данных без меток из рабочей очереди. Если нет дополнительных доступных данных без меток, новое сообщение говорится так, а также ссылка на домашнюю страницу портала.

После завершения маркировки выберите изображение внутри круга в правом верхнем углу студии, а затем выберите выход. Если вы не выходите, время ожидания в Azure и назначение данных другому метчику.

Следующие шаги