Оценка Vowpal Wabbit версии 7-10

Оценка данных с использованием системы машинного обучения Vowpal Wabbit из интерфейса командной строки

Категория: анализ текста

Примечание

Применимо к: машинное обучение Studio (классическая модель)

Это содержимое относится только к Studio (классическая модель). Аналогичные модули перетаскивания были добавлены в конструктор Машинное обучение Azure. Дополнительные сведения см. в статье сравнение двух версий.

Обзор модуля

В этой статье описывается использование модуля Vowpal Wabbit версии 7-10 в машинное обучение Azure Studio (классическая модель) для формирования оценок набора входных данных с использованием существующей модели Vowpal Wabbit.

Этот модуль использует версию 7-10 платформы Vowpal Wabbit. Используйте этот модуль для оценки данных с помощью обученной модели, сохраненной в формате 7-10.

При наличии существующих моделей, созданных с помощью более ранней версии, используйте следующие модули:

Для получения последней версии Vowpal Wabbit используйте:

Настройка оценки Vowpal Wabbit версии 7-10

  1. Добавьте в эксперимент модуль Score Vowpal Wabbit версии 7-10 .

  2. Добавьте обученную модель Vowpal Wabbit и подключите ее к левому порту ввода. Вы можете использовать обученную модель, созданную в том же эксперименте, или нахождение сохраненной модели в группе обученные модели в левой области навигации Studio (классическая модель).

    Ограничения

    Модель должна быть доступна в Машинное обучение Azure Studio (классической); Вы не можете напрямую загрузить модель из службы хранилища Azure.

    Поддерживаются только модели Vowpal Wabbit 7-10; невозможно подключить сохраненные модели, которые были обучены с помощью других алгоритмов, и нельзя использовать модели, обученные в более ранних и более поздних версиях.

  3. В текстовом поле аргументы VW введите набор допустимых аргументов командной строки в исполняемый файл Vowpal Wabbit.
    Сведения о том, какие аргументы Wabbit Vowpal поддерживаются и не поддерживаются в Машинное обучение Azure, см. в разделе Технические примечания .

  4. Щелкните указать тип данных и выберите один из поддерживаемых типов данных из списка.

    Для оценки требуется один столбец данных, совместимых с VW.

    Если у вас уже есть файл, созданный в форматах SVMLight или VW, его можно загрузить в рабочую область машинного обучения Azure в качестве нового набора данных в одном из следующих форматов: универсальный CSV без заголовка, TSV без заголовка.

    Параметр VW требует наличия метки, но она не используется в вычислениях, за исключением сравнения.

  5. Добавьте модуль Импорт данных и подключите его к правому порту ввода Score Vowpal Wabbit версии 7-10. Настройте данные импорта для доступа к входным данным.

    Входные данные для оценки должны быть заранее подготовлены в одном из поддерживаемых форматов и сохранены в хранилище BLOB-объектов Azure.

  6. Выберите параметр включить дополнительный столбец, содержащий метки, если нужно выводить метки вместе с показателями.

    Как правило, при обработке текстовых данных Vowpal Wabbit не требует меток и возвращает только оценки для каждой строки данных.

  7. Выберите параметр использовать кэшированные результаты, если требуется повторно использовать результаты предыдущего запуска, предполагая, что выполняются следующие условия.

    • Существует допустимый кэш из предыдущего запуска.

    • Параметры входных данных и параметров модуля не были изменены с момента предыдущего запуска.

    В противном случае процесс импорта повторяется каждый раз при запуске эксперимента.

  8. Запустите эксперимент.

Результаты

После завершения обучения:

Выходные данные показывают оценку прогноза, нормализованную от 0 до 1.

Примеры

Примеры того, как Vowpal Wabbit можно использовать в машинном обучении, см. в Коллекция решений ии Azure:

  • Пример Wabbit Vowpal

    В этом эксперименте демонстрируется подготовка данных, обучение и эксплуатация модели VW.

В следующем видео представлено пошаговое руководство по процессу обучения и оценки для Vowpal Wabbit:

https://azure.microsoft.com/documentation/videos/text-analytics-and-vowpal-wabbit-in-azure-ml-studio/

Технические примечания

В этом разделе содержатся сведения о реализации, советы и ответы на часто задаваемые вопросы.

Параметры

Vowpal Wabbit имеет множество параметров командной строки для выбора и настройки алгоритмов. Полное обсуждение этих вариантов невозможно. рекомендуется просмотреть вики-страницу Vowpal Wabbit.

Следующие параметры не поддерживаются в Машинное обучение Azure Studio (классическая модель).

  • Параметры ввода-вывода, указанные в https://github.com/JohnLangford/vowpal_wabbit/wiki/Command-line-arguments

    Эти свойства уже настроены автоматически модулем.

  • Кроме того, любой параметр, который создает несколько выходов или принимает несколько входов, запрещен. К ним относятся --cbt , --lda и --wap .

  • Поддерживаются только защищенные алгоритмы обучения. Это позволяет запретить следующие варианты: –active , --rank и --search т. д.

Допускаются все аргументы, отличные от описанных выше.

Ожидаемые входные данные

Имя Type Описание
Обученная модель Интерфейс ILearner Обученный ученик
Набор данных Таблица данных Оцениваемый набор данных

Параметры модуля

Имя Диапазон Тип По умолчанию Описание
Аргументы VW Любой Строка нет Введите аргументы Vowpal Wabbit.

Следующие аргументы не поддерживаются:

- -i
- -p или
- -t
Включить дополнительный столбец, содержащий метки Истина/ложь Логическое false Укажите, должен ли ZIP-файл включать метки с прогнозами
Укажите тип данных VW

SVMLight
DataType VW Указывает, каким является формат файла: SVMLight или Vowpal Wabbit

Выходные данные

Имя Type Описание
Набор данных результатов Таблица данных Набор данных с результатами прогноза

Исключения

Исключение Описание
Ошибка 0001 Исключение возникает, если не удалось найти один или несколько столбцов указанного набора данных.
Ошибка 0003 Исключение возникает, если один или несколько входных аргументов имеют значение NULL или пусты.
Ошибка 0004 Исключение возникает, если параметр меньше или равен определенному значению.
Ошибка 0017 Исключение возникает, если один или несколько указанных столбцов относятся к типу, который не поддерживается в текущем модуле.

Список ошибок, относящихся к модулям студии (классическая версия), см. в разделе машинное обучение коды ошибок.

Список исключений API см. в разделе Машинное обучение REST API коды ошибок.

См. также раздел

Анализ текста
Хэширование компонентов
Распознавание именованных сущностей
Vowpal Wabbit, оценка модели 7-4
Обучение модели Vowpal Wabbit 7-4
Обучение модели Vowpal Wabbit 7-10
Список модулей в алфавитном порядке