Пакетное тестирование с помощью набора примеров высказываний

Статья
01/19/2024

Важно!

Служба LUIS будет прекращена 1 октября 2025 г., и с 1 апреля 2023 г. вы не сможете создавать новые ресурсы LUIS. Мы рекомендуем перенести приложения LUIS на распознавание устной речи , чтобы воспользоваться непрерывной поддержкой продуктов и многоязычными возможностями.

При пакетном тестировании проверяется активная обученная версия для измерения правильности прогнозирования. Пакетный тест позволяет оценить правильность каждого намерения и сущности в активной версии. Изучив результаты пакетного тестирования, вы сможете принять меры для повышения правильности. Например, можно добавить в намерение новые примеры речевых фрагментов, если приложение часто ошибается с определением намерений, или пометить сущности в речевом фрагменте.

Группировка данных для пакетного тестирования

Очень важно применять для пакетного тестирования высказывания, еще не знакомые службе LUIS. Если у вас есть готовый набор речевых фрагментов, разделите его на три части: добавленные в намерение; полученные от опубликованной конечной точки; предназначенные для пакетного тестирования LUIS после обучения.

Пакетный JSON-файл должен включать в себя речевые фрагменты с сущностями машинного обучения верхнего уровня, для которых отмечены начальная и конечная позиции. Речевые фрагменты не должны принадлежать к примерам, которые уже есть в приложении. Это должны быть речевые фрагменты, которые необходимо положительно прогнозировать для намерений и сущностей.

Вы можете разделить тестовые элементы по намерению и (или) сущности или расположить все эти элементы (до 1000 речевых фрагментов) в одном файле.

Распространенные ошибки при импорте пакета

Если при отправке пакетного файла в LUIS произошли ошибки, проверьте, не вызваны ли они одной из следующих распространенных причин:

Более 1000 речевых фрагментов в пакетном файле.
Объект JSON, содержащий высказывание, не имеет свойства entities. Свойство может быть пустым массивом.
Слова, которые были помечены в нескольких сущностях.
Метки сущностей с пробелом в начале или в конце.

Исправление ошибок, выявленных при пакетном тестировании

Если при пакетном тестировании будут обнаружены ошибки, вы можете добавить в намерение больше высказываний и (или) сопоставить дополнительные высказывания с сущностью, чтобы служба LUIS лучше различала намерения. Если вы уже добавили все нужные высказывания и присвоили все метки, но в прогнозировании при пакетном тестировании по-прежнему возникают ошибки, попробуйте добавить список фраз с характерным для предметной области словарем, который поможет LUIS обучаться быстрее.

Портал LUIS
REST API

Пакетное тестирование с помощью портала LUIS

Импорт и обучение приложения-примера

Импортируйте приложение для заказа пиццы, например 1 pepperoni pizza on thin crust.

Загрузите и сохраните JSON-файл приложения.
Войдите на портал LUIS и выберите Подписка и Ресурс для разработки, чтобы просмотреть приложения, назначенные этому ресурсу для разработки.
Щелкните стрелку рядом с полем Новое приложение и выберите Импорт JSON, чтобы импортировать JSON в новое приложение. Присвойте приложению имя Pizza app.
Выберите Обучение в правом верхнем углу области навигации, чтобы обучить приложение.

Роли в пакетном тестировании

Внимание!

Роли сущности не поддерживаются при пакетном тестировании.

Файл для пакетного тестирования

Пример JSON включает в себя один речевой фрагмент с помеченной сущностью, чтобы проиллюстрировать, как выглядит тестовый файл. В собственных тестах у вас должно быть много речевых фрагментов с правильными намерениями и помеченными сущностями машинного обучения.

Создайте файл pizza-with-machine-learned-entity-test.json в текстовом редакторе или скачайте его.

В пакетный файл в формате JSON добавьте речевой фрагмент с намерением, которое должно быть спрогнозировано в тесте.

[
    {
        "text": "I want to pick up 1 cheese pizza",
        "intent": "ModifyOrder",
        "entities": [
            {
                "entity": "Order",
                "startPos": 18,
                "endPos": 31
            },
            {
                "entity": "ToppingList",
                "startPos": 20,
                "endPos": 25
            }
        ]
    }
]

Запуск пакетного теста

Нажмите кнопку Test (Тестировать) в верхней панели навигации.
На правой панели щелкните ссылку Batch testing panel (Панель пакетного тестирования).
Выберите Импорт. Откроется диалоговое окно, в котором нужно нажать Выбрать файл. Затем найдите JSON-файл с правильным форматом JSON, содержащий не более 1000 речевых фрагментов для тестирования.

Ошибки импорта выводятся в красной строке уведомлений в верхней части браузера. Если при импорте возникают ошибки, набор данных не создается. Дополнительные сведения см. в разделе об общих ошибках.
Выберите расположение для файла pizza-with-machine-learned-entity-test.json.
Назовите набор данных pizza test и выберите Готово.
Нажмите кнопку Запустить.

Когда пакетное тестирование завершится, вы увидите такие столбцы:

Столбец	Описание
Состояние	Состояние теста. Элемент интерфейса Просмотреть результаты отображается только после завершения теста.
Имя	Имя, которое вы присвоили тесту.
Размер	Количество тестов в этом файле для пакетного тестирования.
Последний запуск	Дата последнего выполнения этого файла для пакетного тестирования.
Последний результат	Количество успешных прогнозов в тесте.

Чтобы просмотреть подробные результаты теста, выберите Просмотреть результаты.
Совет
- При выборе пункта Загрузить будет загружен тот же файл, который вы отправили.
- Если пакетное тестирование завершилось сбоем, это означает, что по крайней мере одно намерение с речевым фрагментом не совпало с прогнозом.

Просмотр намерений в результатах пакетного тестирования

Чтобы просмотреть результаты пакетного тестирования, щелкните See results (Просмотреть результаты). Результаты теста графически показывают, как тестовые речевые фрагменты спрогнозированы для активной версии.

Пакетная диаграмма отображает четыре квадранта результатов. В правой части диаграммы находится фильтр. Фильтр содержит намерения и сущности. При выборе раздела диаграммы или точки внутри диаграммы соответствующие высказывания отображаются под диаграммой.

При наведении курсора на диаграмму с помощью колеса мыши можно увеличить или уменьшить отображение. Это полезно в тех случаях, когда на диаграмме собрано много плотно сгруппированных точек.

Диаграмма состоит из четырех квадрантов, два из которых выделены красным цветом.

В списке фильтров выберите намерение ModifyOrder. Речевой фрагмент спрогнозирован как истинно положительный результат. Это означает, что речевой фрагмент совпал с его положительным прогнозом, указанным в пакетном файле.

Зеленые флажки в списке фильтров также указывают на успешное выполнение теста для каждого намерения. Все остальные намерения перечислены с положительным результатом 1/1, потому что речевой фрагмент был протестирован для каждого намерения и является отрицательным для любых намерений, не перечисленных в пакетном тесте.
Выберите намерение Confirmation. Это намерение не указано в пакетном тестировании, поэтому является отрицательным для речевого фрагмента, который указан в пакетном тесте.

Отрицательный тест выполнен успешно, как отмечено зеленым текстом в фильтре и на сетке.

Проверка результатов пакетного тестирования для сущностей

Сущность ModifyOrder, как машинная сущность с подсущностями, показывает, соответствует ли ожиданиям сущность верхнего уровня и как прогнозируются подсущности.

Выберите сущность ModifyOrder в списке фильтров, а затем выберите круг на сетке.
Прогнозирование сущности отображается под диаграммой. При этом отображаются сплошные линии для прогнозов, которые соответствуют ожиданиям, и пунктирные линии — для тех, которые не соответствуют.

Фильтрация результатов на диаграмме

Чтобы отфильтровать диаграмму по определенному намерению или сущности, выберите намерение или сущность на панели фильтрации справа. Точки данных и их распределение на диаграмме обновляются в зависимости от выбора.

Визуализированный результат пакетного тестирования

Примеры результатов на диаграммах

С диаграммами на портале LUIS можно выполнять описанные ниже действия.

Просмотр данных высказывания для одной точки

На диаграмме наведите указатель мыши на точку данных, чтобы увидеть оценку достоверности ее прогнозирования. Выберите точку данных для извлечения ее соответствующего высказывания из списка высказываний в нижней части страницы.

Выбранное высказывание

Просмотр данных раздела

В диаграмме из четырех частей выберите имя раздела, например False Positive (Ложноположительный результат), в правой верхней части диаграммы. Под диаграммой в списке отображаются все высказывания в указанном разделе.

Высказывания, выбранные по разделу

На предыдущем рисунке высказывание switch on помечено с намерением TurnAllOn, но получило прогнозирование намерения None. Это указывает на то, что для выполнения ожидаемого прогнозирования намерению TurnAllOn необходимы дополнительные высказывания.

Два красных раздела на диаграмме указывают на высказывания, которые не соответствуют ожидаемому прогнозированию. Это значит, что LUIS требуется дополнительное обучение.

Два зеленых раздела на диаграмме означают соответствие ожидаемому прогнозированию.

Пакетное тестирование с использованием REST API

Вы можете выполнять пакетное тестирование, используя портал LUIS и REST API. Конечные точки для REST API перечислены ниже. Сведения о пакетном тестировании с использованием портала LUIS см. в руководстве по наборам данных для пакетных тестов. Используйте полные URL-адреса, приведенные ниже, подставив вместо заполнителей свои ключ и конечную точку прогнозирования LUIS.

Обязательно добавьте ключ LUIS в Ocp-Apim-Subscription-Key в заголовке и присвойте параметру Content-Type значение application/json.

Запуск пакетного теста

Запустите пакетный тест, используя ИД версии приложения или слот публикации. Отправьте запрос POST в одном из указанных ниже форматов конечной точки. Добавьте в текст запроса свой пакетный файл.

Слот публикации

<YOUR-PREDICTION-ENDPOINT>/luis/v3.0-preview/apps/<YOUR-APP-ID>/slots/<YOUR-SLOT-NAME>/evaluations

ИД версии приложения

<YOUR-PREDICTION-ENDPOINT>/luis/v3.0-preview/apps/<YOUR-APP-ID>/versions/<YOUR-APP-VERSION-ID>/evaluations

Эти конечные точки возвращают ИД операции, который можно использовать для проверки состояния и получения результатов.

Получение состояния текущего пакетного тестирования

Используйте ИД операции из пакетного теста, который вы начали, чтобы получить его состояние из следующих форматов конечной точки:

Слот публикации

<YOUR-PREDICTION-ENDPOINT>/luis/v3.0-preview/apps/<YOUR-APP-ID>/slots/<YOUR-SLOT-ID>/evaluations/<YOUR-OPERATION-ID>/status

ИД версии приложения

<YOUR-PREDICTION-ENDPOINT>/luis/v3.0-preview/apps/<YOUR-APP-ID>/versions/<YOUR-APP-VERSION-ID>/evaluations/<YOUR-OPERATION-ID>/status

Получение результатов пакетного тестирования

Используйте ИД операции из пакетного теста, который вы начали, чтобы получить его результаты из следующих форматов конечной точки:

Слот публикации

<YOUR-PREDICTION-ENDPOINT>/luis/v3.0-preview/apps/<YOUR-APP-ID>/slots/<YOUR-SLOT-ID>/evaluations/<YOUR-OPERATION-ID>/result

ИД версии приложения

<YOUR-PREDICTION-ENDPOINT>/luis/v3.0-preview/apps/<YOUR-APP-ID>/versions/<YOUR-APP-VERSION-ID>/evaluations/<YOUR-OPERATION-ID>/result

Пакетный файл речевых фрагментов

Отправьте пакетный файл с речевыми фрагментами, который также называют набором данных, для пакетного тестирования. Этот набор данных представляет собой файл в формате JSON, содержащий не более 1000 речевых фрагментов с метками. В одном приложении можно протестировать до 10 наборов данных. Если вам нужно больше, сначала удалите один из наборов данных, а затем добавьте новый. Все пользовательские сущности в модели отображаются в фильтре сущностей пакетного тестирования, даже если в данных пакетного файла нет соответствующих сущностей.

Пакетный файл содержит высказывания. Каждый речевой фрагмент должен сопровождаться ожидаемым прогнозом намерения, а также всеми сущностями машинного обучения, которые должны быть в нем обнаружены согласно ожиданиям.

Шаблон синтаксиса пакета для намерений с сущностями

Чтобы запустить файл пакета, используйте следующий шаблон.

{
    "LabeledTestSetUtterances": [
        {
            "text": "play a song",
            "intent": "play_music",
            "entities": [
                {
                    "entity": "song_parent",
                    "startPos": 0,
                    "endPos": 15,
                    "children": [
                        {
                            "entity": "pre_song",
                            "startPos": 0,
                            "endPos": 3
                        },
                        {
                            "entity": "song_info",
                            "startPos": 5,
                            "endPos": 15
                        }
                    ]
                }
            ]
        }
    ]
}

Чтобы уведомить о начале и конце сущности, в файле пакета используются свойства startPos и endPos. Их значения отсчитываются, начиная с нуля, и не должны начинаться или заканчиваться пробелом. В этом и состоит основное отличие от журналов запросов, для которых используются свойства startIndex и endIndex.

Если вы не хотите тестировать сущности, включите свойство entities и задайте в качестве значения пустой массив [].

Результаты пакетного теста, возвращаемые REST API

API возвращает несколько объектов:

сведения о моделях намерений и сущностей, таких как точность, полнота и F-мера;
сведения о моделях сущностей, таких как точность, полнота и F-мера, для каждой сущности:
- с помощью флага verbose можно получить больше сведений о сущности, например entityTextFScore и entityTypeFScore;
предоставленные речевые фрагменты с именами спрогнозированных и помеченных намерений;
списки ложноположительных и ложных отрицательных сущностей.

Дальнейшие шаги

Если тестирование показывает, что приложение LUIS не распознает правильные намерения и сущности, вы можете повысить производительность приложения LUIS, пометив дополнительные высказывания или добавив компоненты.

Label suggested utterances with LUIS (Добавление меток к предлагаемым фразам в LUIS)
Use features to improve your LUIS app's performance (Использование функций для повышения производительности приложения LUIS)

Пакетное тестирование с помощью набора примеров высказываний

Группировка данных для пакетного тестирования

Распространенные ошибки при импорте пакета

Исправление ошибок, выявленных при пакетном тестировании

Пакетное тестирование с помощью портала LUIS

Импорт и обучение приложения-примера

Роли в пакетном тестировании

Файл для пакетного тестирования

Запуск пакетного теста

Просмотр намерений в результатах пакетного тестирования

Проверка результатов пакетного тестирования для сущностей

Фильтрация результатов на диаграмме

Примеры результатов на диаграммах

Просмотр данных высказывания для одной точки

Просмотр данных раздела

Дальнейшие шаги

Дополнительные ресурсы