Создание рабочей области Synapse

Из этого учебника вы узнаете, как создать рабочую область Synapse, выделенный пул SQL и бессерверный пул Apache Spark.

Предварительные требования

Чтобы выполнить все действия, описанные в этом учебнике, потребуется доступ к группе ресурсов, которой назначена роль Владелец. Создайте рабочую область Synapse в этой группе ресурсов.

Создание рабочей области Synapse на портале Azure

Начало процесса

  1. Откройте портал Azure, в строке поиска введите Synapse, но не нажимайте ВВОД.
  2. В поисковых результатах в разделе Службы выберите Azure Synapse Analytics.
  3. Выберите Добавить и создайте рабочую область.

Вкладка "Основные сведения", раздел "Сведения о проекте"

Заполните следующие поля:

  1. Подписка: выберите любую подписку.
  2. Группа ресурсов: укажите любую группу ресурсов.
  3. Управляемая группа ресурсов: оставьте это поле пустым.

Вкладка "Основные сведения", раздел "Сведения о рабочей области"

Заполните следующие поля:

  1. Имя рабочей области: выберите любое глобально уникальное имя. В этом учебнике используется имя myworkspace.
  2. Регион. Выберите регион, в котором вы разместили свои клиентские приложения/службы (например, виртуальная машина Azure, Power BI, служба анализа Azure) и хранилища, содержащие данные (например, хранилище озера данных Azure, аналитическое хранилище Azure Cosmos DB).

Примечание

Рабочая область, не связанная с клиентскими приложениями или хранилищем, может являться основной причиной множества проблем с производительностью. Если ваши данные или клиенты размещены в нескольких регионах, вы можете создавать отдельные рабочие области в разных регионах, размещенные вместе с вашими данными и клиентами.

В разделе Выбор Data Lake Storage 2-го поколения:

  1. В разделе Имя учетной записи выберите Создать новую и присвойте новой учетной записи хранения имя contosolake или аналогичное имя, так как оно должно быть уникальным.
  2. В разделе Имя файловой системы выберите Создать новую и присвойте файловой системе имя users. Будет создан контейнер хранилища с именем users. В рабочей области эта учетная запись хранения будет использоваться как основная для таблиц и журналов приложений Spark.
  3. Установите флажок, позволяющий назначить себе роль "Участник для данных BLOB-объектов хранилища" в учетной записи Data Lake Storage 2-го поколения.

Завершение процесса

Выберите команду Просмотреть и создать > Создать. Рабочая область будет готова через несколько минут.

Примечание

Сведения о том, как использовать функции рабочей области из существующего выделенного пула SQL (ранее — Хранилище данных SQL), см. здесь.

Открытие Synapse Studio

После создания рабочей области Azure Synapse можно открыть Synapse Studio двумя способами:

  • Откройте рабочую область Synapse на портале Azure и в ее разделе Обзор выберите элемент Открыть в поле Open Synapse Studio (Открыть Synapse Studio).
  • Перейдите по адресу https://web.azuresynapse.net и войдите в рабочую область.

Размещение данных примера в основной учетной записи хранения

В контексте многих примеров, приведенных в данном руководстве по началу работы, мы будем использовать небольшую выборку данных из 100 тыс. строк данных такси NYX. Мы начнем с его размещения в основной учетной записи хранения, созданной вами для рабочей области.

  • Скачайте файл https://azuresynapsestorage.blob.core.windows.net/sampledata/NYCTaxiSmall/NYCTripSmall.parquet на свой компьютер.
  • В Synapse Studio перейдите в Центр данных.
  • Выберите Связано.
  • В категории Azure Data Lake Storage 2-го поколения вы увидите элемент с именем, например myworkspace (Primary - contosolake) .
  • Выберите контейнер с именем users (Primary) .
  • Щелкните Отправить и выберите скачанный вами файл NYCTripSmall.parquet.

После загрузки файла parquet он доступен через два эквивалентных URI:

  • https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquet
  • abfss://users@contosolake.dfs.core.windows.net/NYCTripSmall.parquet

В контексте примеров, приведенных в данном руководстве, не забудьте заменить contosolake в пользовательском интерфейсе именем основной учетной записи хранения, которую вы выбрали для своей рабочей области.

Дальнейшие действия