Анализ сценария и сопоставление его с параметром конфигурации HDInsight.

Завершено

Прочтите приведенный ниже пример и ответьте на вопросы, чтобы подобрать для сценария конфигурацию кластера HDInsight.

Пример — велосипеды AdventureWorks

AdventureWorks продает велосипеды и запчасти к ним напрямую клиентам и распространителям. У компании в настоящее время есть один офис в Нидерландах. Они продают велосипеды клиентам в США, Германии и Испании по цепочке распространителей и через интернет-магазин. Выполнение доставки осуществляется через локальные распределительные центры.

Компания планирует расширить, создав новые офисы, так как рост продаж в этих странах или регионах увеличился за последние три года. Расположения:

  • Токио, Япония
  • Сиэтл, США
  • Чикаго, США
  • Берлин, Германия
  • Барселона, Испания
  • Париж, Франция

В течение последних 15 лет компания AdventureWorks работает на рынке с высокой конкуренцией. Они хотят стать самой инновационной велосипедной компанией, предоставляя текущим и будущим владельцам велосипедов лучшие в своем классе технологии и услуги. Отдел исследования и разработки в AdventureWorks придумал следующую волну инновационных продуктов. Они ожидают, что инженеры данных, инженеры по ИИ и специалисты по обработке и анализу данных помогут им в проектировании и реализации решения.

Учитывая повышенный уровень продаж и расширение в глобальном масштабе, существующая инфраструктура данных не будет соответствовать общим бизнес-требованиям или будущему росту, на который надеется AdventureWorks. Руководители по информационным технологиям хотят отказаться от существующих локальных систем и перейти в облако, чтобы поддержать ожидаемый рост. Этот план поддерживается финансовым директором, так как поступил запрос на замену оборудования в результате устаревания существующей инфраструктуры. Финансовый директор знает, что облако может предложить альтернативные, более экономичные варианты.

Как старший инженер данных вы будете помогать компании AdventureWorks в проектировании и реализации решения. Это поможет компании удовлетворить бизнес-требования, а также функциональные и технические требования для стратегий развития, расширения и внедрения инноваций. Этот план необходимо реализовать таким образом, чтобы можно было минимизировать эксплуатационные расходы и отслеживать эффективность.

На встрече по обсуждению потребностей вы узнаете о следующих требованиях:

Анализ данных

В настоящее время бизнес-отчеты предоставляются отдельной локальной базой данных, настроенной как хранилище данных. Она содержит базу данных с именем AdventureWorksDW, которая используется для создания отчетов за прошлые периоды и описательной аналитики. В последнее время этот сервер с трудом обрабатывает данные отчетов, поэтому ваша команда должна ограничить доступ к этим данным.

Кроме того, руководство компании AdventureWorks также хотело бы использовать анализ данных в дальнейшем наряду с возможностями прогнозной аналитики. В настоящее время эти операции не выполняются. Организация понимает, что можно создать подсистему анализа рекомендаций или текста. Они хотели бы разработать лучшую технологию и подход к реализации такого решения, которое также должно быть устойчивым и производительным.

Анализ социальных сетей

В последние годы отдел маркетинга в организации организовал множество кампаний в Twitter с привязкой к различным моментам года. Они хотят измерять влияние своей работы путем отслеживания активов в социальных сетях, таких как хэштеги, в ходе этих кампаний. Им нужна возможность отслеживать любой хэштег.

Подключенный велосипед

Велосипеды AdventureWorks могут быть оснащены инновационным встроенным компьютером. Этот компьютер состоит из автоматических функций блокировки велосипеда, а также отслеживает рабочее состояние. Компьютер собирает следующую информацию:

  • Модель, серийный номер и зарегистрированный владелец велосипеда.
  • Расположение велосипеда (долгота и широта).
  • Текущее состояние (стоит, движется).
  • Текущая скорость в километрах в час.
  • Велосипед заблокирован/разблокирован.
  • Сведения о частях и компонентах велосипеда (на электрических велосипедах)

Собственные и сторонние приложения могут получить доступ к информации о велосипедном компьютере, которая должна быть защищена. Эту информацию можно использовать для интеграции в мобильные приложения, отображения местоположения в реальном времени и получения сведений о велошеринге. Кроме того, ежедневные сводные данные можно сохранять в неструктурированные файлы. Эти данные включают в себя модель, серийный номер, зарегистрированного владельца, сводку по общему количеству километров за день и среднюю скорость.

Услуги по обслуживанию велосипедов

Существующие владельцы велосипедов могут подписаться на уведомления о том, когда велосипеду требуется ремонт, на основе следующих сведений:

  • Данные телеметрии из электрического велосипеда на основе данных с датчиков.
  • Сведения об использовании велосипеда, поступающие от встроенного велосипедного компьютера, на основе среднего пройденного расстояния и износа.
  • Этот сценарий прогнозного обслуживания связан с услугой, на которую владельцы велосипедов могут подписаться за отдельную плату.

Вопросы

На основе приведенного ниже примера ответьте на следующие вопросы


Проверка знаний

1.

Какой тип конфигурации кластера HDInsight подходит для выполнения требований потоковой передачи, необходимых для сценария подключенного велосипеда?

2.

Какой тип конфигурации кластера HDInsight подходит для размещения анализа данных, выполняемого хранилищем данных на локальном сервере SQL Server?

3.

Какой тип конфигурации кластера HDInsight подойдет для выполнения прогнозного обслуживания для услуги технического обслуживания велосипедов?

4.

Какой тип хранилища данных следует использовать для работы со всеми этими рабочими нагрузками из сценариев в предыдущих вопросах?