Компонент для преобразования в CSV

В этой статье описывается компонент в конструкторе Машинного обучения Azure.

Этот компонент используется для преобразования набора данных в CSV-файл, который можно скачивать и экспортировать, а также предоставлять к нему общий доступ для компонентов скриптов R или Python.

Дополнительные сведения о формате CSV

Формат CSV, который означает "значения с разделителями-запятыми", — это формат файлов, используемый многими внешними инструментами машинного обучения. CSV — это распространенный формат обмена данными при работе с такими языками с открытым кодом, как R или Python.

Даже если большая часть работы выполняется в Машинном обучении Azure, иногда может оказаться удобным преобразовать набор данных в CSV-файл для использования во внешних инструментах. Пример:

  • Скачайте CSV-файл, чтобы открыть его в Excel, или импортируйте его в реляционную базу данных.
  • Сохраните CSV-файл в облачном хранилище и подключитесь к нему из Power BI, чтобы создать визуализации.
  • Используйте формат CSV для подготовки данных для использования в R и Python.

При преобразовании набора данных в CSV он сохраняется в рабочей области Машинного обучения Azure. Вы можете использовать служебную программу хранилища Azure для непосредственного открытия и использования файла. Можно также получить доступ к CSV-файлу в конструкторе. Для этого выберите компонент Преобразование в CSV, а затем щелкните значок гистограммы на вкладке Выходные данные на правой панели, чтобы просмотреть выходные данные. Вы можете скачать CSV-файл из папки Результаты в локальный каталог.

Настройка компонента для преобразования в CSV

  1. Добавьте компонент для преобразования в CSV в конвейер. Этот компонент можно найти в группе Преобразование данных в конструкторе.

  2. Подключите его к любому компоненту, который выводит набор данных.

  3. Отправьте конвейер.

Результаты

Выберите вкладку Выходные данные на правой панели в Преобразование в CSV и выберите один из этих значков под областью Выходные данные порта.

  • Регистрация набора данных. Щелкните значок и сохраните CSV-файл обратно в рабочую область Машинного обучения Azure в виде отдельного набора данных. Вы можете найти набор данных в виде компонента в дереве компонентов в разделе Мои наборы данных.

  • Просмотрите выходные данные. Щелкните значок глаза и следуйте инструкциям по просмотру папки Results_dataset и скачайте файл data.csv.

Дальнейшие действия

Ознакомьтесь с набором доступных компонентов для Машинного обучения Azure.