Экспорт или удаление данных рабочей области Службы машинного обучения

В Машинном обучении Azure можно экспортировать или удалить данные рабочей области с помощью графического интерфейса портала или пакета SDK для Python. Возможные варианты описаны в этой статье.

Примечание

См. сведения о просмотре и удалении персональных данных в руководстве по созданию запросов субъектов данных Azure в соответствии с GDPR. Дополнительные сведения о GDPR см. в разделе, посвященном GDPR, в Центре управления безопасностью Майкрософт и на портале Service Trust Portal.

Примечание

В этой статье приведены пошаговые инструкции по удалению персональных данных с устройства или из службы. Эти сведения можно использовать для соблюдения обязательств согласно Общему регламенту по защите данных (GDPR). Общие сведения о GDPR см. в разделе, посвященном GDPR, в Центре управления безопасностью Майкрософт и на портале Service Trust Portal.

Управление данными рабочей области

Данные в продукте, хранящееся в Машинном обучении Azure, доступны для экспорта и удаления. Вы можете экспортировать и удалить данные с помощью Студия машинного обучения Azure, CLI и пакета SDK. Кроме того, вы можете получить доступ к данным телеметрии на портале конфиденциальности Azure.

В Машинном обучении Azure личные данные — это пользовательские данные в документах журналов заданий.

Рабочая область Azure использует группу ресурсов для хранения связанных ресурсов для решения Azure. При создании рабочей области у вас есть возможность использовать существующую группу ресурсов или создать новую. Дополнительные сведения о группах ресурсов Azure см. на этой странице .

Удаление высокоуровневого ресурса в портале

При создании рабочей области Azure формирует несколько ресурсов в группе ресурсов:

  • Сама рабочая область
  • Учетная запись хранения
  • Реестр контейнеров
  • Экземпляр Application Insights
  • Хранилище ключей

Чтобы удалить эти ресурсы, выберите их из списка и нажмите кнопку Удалить:

Важно!

Если ресурс настроен для обратимого удаления, данные не будут удалены, если вы не выберете необратимое удаление ресурса. Дополнительные сведения см. в следующих статьях:

Снимок экрана: портал с выделенным значком удаления.

Откроется диалоговое окно подтверждения, в котором можно подтвердить выбранные варианты.

Документы журнала заданий могут содержать персональные данные пользователя. Эти документы хранятся в учетной записи хранения в хранилище BLOB-объектов во /azureml вложенных папках. Вы можете скачать и удалить данные с портала.

Снимок экрана: каталог Машинного обучения Azure в учетной записи хранения на портале.

Экспорт и удаление ресурсов машинного обучения с помощью Студии машинного обучения Azure

Студия машинного обучения Azure предоставляет единое представление ресурсов машинного обучения, например записных книжек, ресурсов данных, моделей и заданий. Студия машинного обучения Azure подчеркивает сохранение записей ваших данных и экспериментов. Вы можете удалить вычислительные ресурсы ( конвейеры и вычислительные ресурсы) прямо в браузере. Для этих ресурсов перейдите к нужному ресурсу и нажмите кнопку Удалить.

Вы можете отменить регистрацию ресурсов данных и архивировать задания, но эти операции не удаляют данные. Чтобы полностью удалить данные, ресурсы данных и данные заданий требуют удаления на уровне хранилища. Удаление уровня хранилища происходит на портале, как описано выше. Студия машинного обучения Azure может обрабатывать отдельные операции удаления. При удалении задания удаляются данные этого задания.

Студия машинного обучения Azure может обрабатывать скачивание артефактов обучения из экспериментальных заданий. Выберите соответствующее задание. Выберите Выходные данные и журналы и перейдите к конкретным артефактам, которые вы хотите скачать. Выберите ... и Скачать или выберите Скачать все.

Чтобы скачать зарегистрированную модель, перейдите в раздел Модель и нажмите кнопку Скачать.

Снимок экрана: страница модели студии с выделенным параметром скачивания.

Экспорт и удаление ресурсов с помощью пакета SDK для Python

Вы можете скачать выходные данные определенного задания, используя:

# Retrieved from Azure Machine Learning web UI
run_id = 'aaaaaaaa-bbbb-cccc-dddd-0123456789AB'
experiment = ws.experiments['my-experiment']
run = next(run for run in ex.get_runs() if run.id == run_id)
metrics_output_port = run.get_pipeline_output('metrics_output')
model_output_port = run.get_pipeline_output('model_output')

metrics_output_port.download('.', show_progress=True)
model_output_port.download('.', show_progress=True)

С помощью пакета SDK для Python можно удалить следующие ресурсы машинного обучения:

Тип Вызов функции Примечания
Workspace delete Используйте delete-dependent-resources для каскадного удаления
Model delete
ComputeTarget delete
WebService delete

Дальнейшие действия

Дополнительные сведения об управлении рабочей областью.