Термины и определения, используемые в распознавании устной речи

В этой статье содержатся сведения о некоторых определениях и терминах, которые могут вам встретиться при использовании распознавания устной речи.

Сущность

Сущности — это слова в речевых фрагментах, описывающие сведения, которые используются для выполнения или обнаружения намерений. Если сущность является сложной и вы хотите, чтобы ваша модель определяла ее отдельные части, модель можно разбить на вложенные сущности. Например, модель можно использовать для прогнозирования адреса, а также таких вложенных сущностей, как улица, город, регион и почтовый индекс.

F-мера

Показатель F1 зависит от точности и полноты. Она необходима при поиске баланса между точностью и полнотой.

Блокировка с намерением

Намерение представляет задачу или действие, которое хочет выполнить пользователь. Это цель, выраженная во введенных пользователем данных, например бронирование авиабилета или оплата счета.

Сущность списка

Сущность списка представляет собой фиксированный замкнутый набор связанных слов вместе с их синонимами. Сущности списков — это точные совпадения, в отличие сущностей машинного обучения.

Сущность прогнозируется, если слово в сущности списка входит в список. Например, если есть сущность списка с "размер" и в списке есть слова "малый", "средний", "большой", то сущность размера будет прогнозироваться для всех речевых фрагментов, где используются слова "малый", "средний" и "большой" независимо от контекста.

Моделирование

Модель — это объект, обученный для выполнения определенной задачи, в нашем случае — понимания разговорной речи. Для обучения модели используются данные с метками, чтобы их затем можно было использовать для понимания речевых фрагментов.

  • Оценка модели — это процесс, который выполняется сразу после обучения для определения уровня производительности модели.
  • Развертывание — это процесс назначения модели развертыванию, чтобы сделать ее доступной для использования с помощью API прогнозирования.

Переобучение

Переобучение происходит, когда модель зацикливается на конкретных примерах и не способна к эффективному обобщению.

Точность

Измеряет, насколько точна модель. Представляет собой соотношение между правильно определенными положительными (истинноположительными) результатами и всеми определенными положительными результатами. Метрика точности показывает, сколько из спрогнозированных классов правильно помечено метками.

Project

Проект — это рабочая область для создания настраиваемых моделей машинного обучения на основе данных. Получить доступ к вашему проекту можете только вы, а также другие пользователи, у которых есть доступ к используемому ресурсу Azure.

Отозвать

Измеряет способность модели прогнозировать фактические положительные классы. Это отношение между спрогнозированными истинноположительными результатами и фактически помеченными значениями. Метрика полноты показывает, сколько из прогнозируемых классов определено верно.

Регулярное выражение

Сущность регулярного выражения представляет регулярное выражение. Сущности регулярного выражения — это точные совпадения.

схема

Схема определяется как сочетание намерений в проекте. Проектирование схемы является неотъемлемой частью успеха проекта. При создании схемы необходимо подумать о том, какие намерения и сущности следует добавить в проект

Обучающие данные

Обучающие данные — это набор информации, необходимой для обучения модели.

Речевой фрагмент

Речевой фрагмент — это входные данные пользователя, которые представляют собой короткий текст фразы в диалоге. Это фраза на естественном языке, например "забронировать два билета в Москву на следующий вторник". Примеры речевых фрагментов добавляются для обучения модели, и модель во время выполнения делает прогнозы на основе новых фрагментов.

Следующие шаги