Экспорт Базу данных SQL Azure

В этой статье описывается, как использовать параметр Экспорт в базу данных SQL Azure в модуле экспорт данных в машинное обучение Azure Studio (классическая модель). Этот параметр полезен, если вы хотите экспортировать данные из эксперимента машинного обучения в базу данных SQL Azure или хранилище данных SQL Azure.

Примечание

Применимо к: машинное обучение Studio (классическая модель)

Это содержимое относится только к Studio (классическая модель). Аналогичные модули перетаскивания были добавлены в конструктор Машинное обучение Azure. Дополнительные сведения см. в статье сравнение двух версий.

Экспорт в базу данных SQL полезен во многих сценариях машинного обучения. Например, может потребоваться хранить промежуточные результаты, сохранять оценки или сохранять таблицы сконструированных функций. Несмотря на то, что хранение данных в базе данных SQL Azure или хранилище данных SQL Azure может оказаться более дорогим, чем использование таблиц или больших двоичных объектов в Azure, плата за транзакции в базах данных SQL не взимается. Более того, хранилище базы данных идеально подходит для быстрого создания меньших объемов часто используемых данных, обмена данными между экспериментами, а также для создания отчетов по результатам, прогнозам и метрикам.

С другой стороны, могут существовать ограничения на объем данных, которые можно хранить в базе данных, в зависимости от типа подписки. Следует также рассмотреть возможность использования базы данных и учетной записи, которая находится в том же регионе, что и Рабочая область машинного обучения.

Чтобы экспортировать данные, укажите имя экземпляра и имя базы данных, где хранятся данные, и запустите модуль, используя учетную запись с разрешениями на запись. Необходимо также указать имя таблицы и связать столбцы из эксперимента со столбцами в таблице.

Экспорт данных в базу данных SQL Azure

  1. Добавьте модуль Export Data (экспорт данных ) в эксперимент в студии (классическая модель). Этот модуль можно найти в категории входные и выходные данные .

  2. Подключите Экспорт данных к модулю, который создает данные, которые необходимо экспортировать.

  3. В качестве назначения данных выберите база данных SQL Azure. Этот параметр также поддерживает хранилище данных SQL Azure.

  4. Укажите имя сервера и базы данных в базе данных SQL Azure или хранилище данных SQL Azure.

    Имя сервера базы данных: введите имя сервера, созданное Azure. Как правило, оно представлено в виде <generated_identifier>.database.windows.net.

    Имя базы данных: введите имя существующей базы данных на сервере, который вы только что указали. Модулю экспорта данных не удается создать базу данных.

    Имя учетной записи пользователя сервера: введите имя пользователя для учетной записи, имеющей разрешения на доступ к базе данных.

    Пароль учетной записи пользователя сервера: укажите пароль для указанной учетной записи пользователя.

  5. Укажите столбцы для экспорта и, если необходимо переименовать столбцы.

    Список сохраняемых столбцов с разделителями-запятыми: введите имена столбцов из эксперимента, который требуется записать в базу данных.

    Имя таблицы данных: введите имя таблицы для хранения данных.

    Если таблица не существует, то для базы данных SQL Azure создается новая таблица.

    Для хранилища данных SQL Azure таблица должна уже существовать и иметь правильную схему, поэтому обязательно создайте ее заранее.

    Список столбцов DataTable с разделителями-запятыми: введите имена столбцов, которые должны отображаться в целевой таблице.

    Для базы данных SQL Azure можно изменить имена столбцов, но необходимо сохранить столбцы в том же порядке, в котором были указаны столбцы для экспорта, в списке столбцов с разделителями-запятыми, которые будут сохранены.

    Имена столбцов в хранилище данных SQL Azure должны совпадать с именами, которые уже находятся в схеме целевой таблицы.

  6. Число строк, записываемых на операцию SQL Azure: этот параметр указывает, сколько строк должно быть записано в целевую таблицу в каждом пакете.

    По умолчанию установлено значение 50, то есть размер пакета по умолчанию для базы данных SQL Azure. Однако при наличии большого количества строк для записи следует увеличить это значение.

    Для хранилища данных SQL Azure рекомендуется присвоить этому параметру значение 1. Если вы используете больший размер пакета, размер строки команды, отправляемой в хранилище данных SQL Azure, может превысить допустимую длину строки, что приведет к ошибке.

  7. Использовать кэшированные результаты: Выберите этот параметр, чтобы не записывать новые результаты при каждом запуске эксперимента. Если другие изменения параметров модуля отсутствуют, эксперимент записывает данные только при первом запуске модуля. Однако новая запись всегда выполняется, если какие-либо параметры были изменены в данных экспорта , что привело бы к изменению результатов.

  8. Запустите эксперимент.

Примеры

Примеры использования модуля Export Data см. в Коллекция решений ии Azure:

Технические примечания

В этом разделе содержатся сведения о реализации, советы и ответы на часто задаваемые вопросы.

Часто задаваемые вопросы

Использование базы данных в другом географическом регионе

Если база данных SQL Azure или хранилище данных SQL находятся в разных регионах из учетной записи машинного обучения, запись может выполняться медленнее.

Кроме того, вы платите за входящий и исходящий данные подписки, если узел вычислений находится в регионе, отличном от региона учетной записи хранения.

Почему некоторые символы в выходных данных отображаются неправильно

Машинное обучение Azure поддерживает кодировку UTF-8. Если в строковых столбцах в базе данных используется другая кодировка, символы могут быть сохранены неправильно.

Кроме того, Машинное обучение Azure не может выводить такие типы данных, как money .

Параметры модуля

Имя Диапазон Тип По умолчанию Описание
Источник данных Список Источник данных или приемник хранилище BLOB-объектов Azure Источником данных может быть HTTP, FTP, Anonymous HTTPS или FTPS, файл в хранилище BLOB-объектов Azure, Таблица Azure, база данных SQL Azure или хранилище данных SQL Azure, таблица Hive или конечная точка OData.
Имя сервера базы данных any Строка нет
Имя базы данных any Строка нет
Имя учетной записи пользователя сервера any Строка нет
Пароль учетной записи пользователя сервера нет
Список сохраняемых столбцов с разделителями-запятыми нет
Имя таблицы данных any Строка нет
Список столбцов таблицы данных с разделителями-запятыми Строка Строка нет Строка
Количество строк, записываемых за одну операцию SQL Azure Строка Целое число 50 Строка
Использование кэшированных результатов True или false Логическое Ложь. Модуль выполняется только в том случае, если не существует допустимого кэша. в противном случае используйте кэшированные данные из предыдущих выполнений.

Исключения

Исключение Описание
Ошибка 0027 Исключение возникает, если два объекта должны быть одинакового размера, но это не так.
Ошибка 0003 Исключение возникает, если один или несколько входных аргументов имеют значение NULL или пусты.
Ошибка 0029 Исключение возникает при передаче недопустимого универсального кода ресурса.
Ошибка 0030 Исключение возникает, когда не удается скачать файл.
Ошибка 0002 Исключение возникает, если один или несколько параметров не удалось проанализировать или преобразовать из заданного типа в необходимый для целевого метода тип.
Ошибка 0009 Исключение возникает, если имя учетной записи хранилища Azure или имя контейнера указаны неверно.
Ошибка 0048 Исключение возникает, когда не удается открыть файл.
Ошибка 0015 Исключение возникает, если произошел сбой подключения к базе данных.
Ошибка 0046 Исключение возникает, если не удается создать каталог по указанному пути.
Ошибка 0049 Исключение возникает, когда не удается проанализировать файл.

Список ошибок, относящихся к модулям студии (классическая версия), см. в разделе машинное обучение коды ошибок.

Список исключений API см. в разделе Машинное обучение REST API коды ошибок.

См. также раздел

Импорт данных
Экспорт данных
Экспорт в хранилище BLOB-объектов Azure
Экспорт в запрос Hive
Экспорт в таблицу Azure