Форматирование данных для распознавания именованных сущностей (NER)
Фигуры набора данных NER:
- Файл сведений ключа: файл сведений о ключе содержит список сущностей, которые служат ключевыми сведениями для обучающих данных.
- Обучающие данные: данные обучения состоят из файла (.txt, TSV), содержащего столбцы, разделенные символом TAB. Один из столбцов — это столбец предложения, а другие представляют метки для маркеров в столбце предложения.
Совместная работа с нами на GitHub
Источник этого содержимого можно найти на GitHub, где также можно создавать и просматривать проблемы и запросы на вытягивание. Дополнительные сведения см. в нашем руководстве для участников.
Обратная связь
https://aka.ms/ContentUserFeedback.
Ожидается в ближайшее время: в течение 2024 года мы постепенно откажемся от GitHub Issues как механизма обратной связи для контента и заменим его новой системой обратной связи. Дополнительные сведения см. в разделеОтправить и просмотреть отзыв по