Экспорт Базу данных SQL Azure
В этой статье описывается, как использовать параметр Экспорт в базу данных SQL Azure в модуле экспорт данных в машинное обучение Azure Studio (классическая модель). Этот параметр полезен, если вы хотите экспортировать данные из эксперимента машинного обучения в базу данных SQL Azure или хранилище данных SQL Azure.
Примечание
Применимо к: машинное обучение Studio (классическая модель)
Это содержимое относится только к Studio (классическая модель). Аналогичные модули перетаскивания были добавлены в конструктор Машинное обучение Azure. Дополнительные сведения см. в статье сравнение двух версий.
Экспорт в базу данных SQL полезен во многих сценариях машинного обучения. Например, может потребоваться хранить промежуточные результаты, сохранять оценки или сохранять таблицы сконструированных функций. Несмотря на то, что хранение данных в базе данных SQL Azure или хранилище данных SQL Azure может оказаться более дорогим, чем использование таблиц или больших двоичных объектов в Azure, плата за транзакции в базах данных SQL не взимается. Более того, хранилище базы данных идеально подходит для быстрого создания меньших объемов часто используемых данных, обмена данными между экспериментами, а также для создания отчетов по результатам, прогнозам и метрикам.
С другой стороны, могут существовать ограничения на объем данных, которые можно хранить в базе данных, в зависимости от типа подписки. Следует также рассмотреть возможность использования базы данных и учетной записи, которая находится в том же регионе, что и Рабочая область машинного обучения.
Чтобы экспортировать данные, укажите имя экземпляра и имя базы данных, где хранятся данные, и запустите модуль, используя учетную запись с разрешениями на запись. Необходимо также указать имя таблицы и связать столбцы из эксперимента со столбцами в таблице.
Экспорт данных в базу данных SQL Azure
Добавьте модуль Export Data (экспорт данных ) в эксперимент в студии (классическая модель). Этот модуль можно найти в категории входные и выходные данные .
Подключите Экспорт данных к модулю, который создает данные, которые необходимо экспортировать.
В качестве назначения данных выберите база данных SQL Azure. Этот параметр также поддерживает хранилище данных SQL Azure.
Укажите имя сервера и базы данных в базе данных SQL Azure или хранилище данных SQL Azure.
Имя сервера базы данных: введите имя сервера, созданное Azure. Как правило, оно представлено в виде
<generated_identifier>.database.windows.net
.Имя базы данных: введите имя существующей базы данных на сервере, который вы только что указали. Модулю экспорта данных не удается создать базу данных.
Имя учетной записи пользователя сервера: введите имя пользователя для учетной записи, имеющей разрешения на доступ к базе данных.
Пароль учетной записи пользователя сервера: укажите пароль для указанной учетной записи пользователя.
Укажите столбцы для экспорта и, если необходимо переименовать столбцы.
Список сохраняемых столбцов с разделителями-запятыми: введите имена столбцов из эксперимента, который требуется записать в базу данных.
Имя таблицы данных: введите имя таблицы для хранения данных.
Если таблица не существует, то для базы данных SQL Azure создается новая таблица.
Для хранилища данных SQL Azure таблица должна уже существовать и иметь правильную схему, поэтому обязательно создайте ее заранее.
Список столбцов DataTable с разделителями-запятыми: введите имена столбцов, которые должны отображаться в целевой таблице.
Для базы данных SQL Azure можно изменить имена столбцов, но необходимо сохранить столбцы в том же порядке, в котором были указаны столбцы для экспорта, в списке столбцов с разделителями-запятыми, которые будут сохранены.
Имена столбцов в хранилище данных SQL Azure должны совпадать с именами, которые уже находятся в схеме целевой таблицы.
Число строк, записываемых на операцию SQL Azure: этот параметр указывает, сколько строк должно быть записано в целевую таблицу в каждом пакете.
По умолчанию установлено значение 50, то есть размер пакета по умолчанию для базы данных SQL Azure. Однако при наличии большого количества строк для записи следует увеличить это значение.
Для хранилища данных SQL Azure рекомендуется присвоить этому параметру значение 1. Если вы используете больший размер пакета, размер строки команды, отправляемой в хранилище данных SQL Azure, может превысить допустимую длину строки, что приведет к ошибке.
Использовать кэшированные результаты: Выберите этот параметр, чтобы не записывать новые результаты при каждом запуске эксперимента. Если другие изменения параметров модуля отсутствуют, эксперимент записывает данные только при первом запуске модуля. Однако новая запись всегда выполняется, если какие-либо параметры были изменены в данных экспорта , что привело бы к изменению результатов.
Запустите эксперимент.
Примеры
Примеры использования модуля Export Data см. в Коллекция решений ии Azure:
Прогноз розничной торговли, шаг 1 из 6 — Предварительная обработка данных. шаблон прогнозирования розничной торговли иллюстрирует задачу машинного обучения на основе данных, хранящихся в Azure sqldb. В нем демонстрируются полезные методики, такие как использование базы данных SQL Azure для передачи наборов данных между экспериментами в разных учетных записях, сохранение и объединение прогнозов, а также создание базы данных SQL Azure только для машинного обучения.
Создание и развертывание модели машинного обучения с помощью SQL Server на виртуальной машине Azure. в этой статье рассматривается использование базы данных SQL Server, размещенной на виртуальной машине Azure, в качестве источника для хранения обучающих данных и прогнозов. В нем также показано, как можно использовать реляционную базу данных для проектирования признаков и выбора компонентов.
Использование машинного обучения Azure с хранилищем данных SQL Azure. демонстрируется использование данных из хранилища данных SQL Azure для создания модели кластеризации.
Использование машинное обучение Azure с хранилищем данных SQL. демонстрирует создание модели регрессии для прогнозирования цен с использованием данных в хранилище данных SQL Azure.
Технические примечания
В этом разделе содержатся сведения о реализации, советы и ответы на часто задаваемые вопросы.
Часто задаваемые вопросы
Использование базы данных в другом географическом регионе
Если база данных SQL Azure или хранилище данных SQL находятся в разных регионах из учетной записи машинного обучения, запись может выполняться медленнее.
Кроме того, вы платите за входящий и исходящий данные подписки, если узел вычислений находится в регионе, отличном от региона учетной записи хранения.
Почему некоторые символы в выходных данных отображаются неправильно
Машинное обучение Azure поддерживает кодировку UTF-8. Если в строковых столбцах в базе данных используется другая кодировка, символы могут быть сохранены неправильно.
Кроме того, Машинное обучение Azure не может выводить такие типы данных, как money
.
Параметры модуля
Имя | Диапазон | Тип | По умолчанию | Описание |
---|---|---|---|---|
Источник данных | Список | Источник данных или приемник | хранилище BLOB-объектов Azure | Источником данных может быть HTTP, FTP, Anonymous HTTPS или FTPS, файл в хранилище BLOB-объектов Azure, Таблица Azure, база данных SQL Azure или хранилище данных SQL Azure, таблица Hive или конечная точка OData. |
Имя сервера базы данных | any | Строка | нет | |
Имя базы данных | any | Строка | нет | |
Имя учетной записи пользователя сервера | any | Строка | нет | |
Пароль учетной записи пользователя сервера | нет | |||
Список сохраняемых столбцов с разделителями-запятыми | нет | |||
Имя таблицы данных | any | Строка | нет | |
Список столбцов таблицы данных с разделителями-запятыми | Строка | Строка | нет | Строка |
Количество строк, записываемых за одну операцию SQL Azure | Строка | Целое число | 50 | Строка |
Использование кэшированных результатов | True или false | Логическое | Ложь. | Модуль выполняется только в том случае, если не существует допустимого кэша. в противном случае используйте кэшированные данные из предыдущих выполнений. |
Исключения
Исключение | Описание |
---|---|
Ошибка 0027 | Исключение возникает, если два объекта должны быть одинакового размера, но это не так. |
Ошибка 0003 | Исключение возникает, если один или несколько входных аргументов имеют значение NULL или пусты. |
Ошибка 0029 | Исключение возникает при передаче недопустимого универсального кода ресурса. |
Ошибка 0030 | Исключение возникает, когда не удается скачать файл. |
Ошибка 0002 | Исключение возникает, если один или несколько параметров не удалось проанализировать или преобразовать из заданного типа в необходимый для целевого метода тип. |
Ошибка 0009 | Исключение возникает, если имя учетной записи хранилища Azure или имя контейнера указаны неверно. |
Ошибка 0048 | Исключение возникает, когда не удается открыть файл. |
Ошибка 0015 | Исключение возникает, если произошел сбой подключения к базе данных. |
Ошибка 0046 | Исключение возникает, если не удается создать каталог по указанному пути. |
Ошибка 0049 | Исключение возникает, когда не удается проанализировать файл. |
Список ошибок, относящихся к модулям студии (классическая версия), см. в разделе машинное обучение коды ошибок.
Список исключений API см. в разделе Машинное обучение REST API коды ошибок.
См. также раздел
Импорт данных
Экспорт данных
Экспорт в хранилище BLOB-объектов Azure
Экспорт в запрос Hive
Экспорт в таблицу Azure