Создание решений аналитики с открытым кодом при помощи Azure HDInsight

Средний уровень
Инженер по анализу и обработке данных
Специалист по обработке и анализу данных
HDInsight

В этой схеме обучения вы узнаете о HDInsight и о том, как применить эту технологию для решения разнообразных реальных задач.

Предварительные требования

Необходимо выполнить следующие предварительные требования

  • Вход на портал Azure
  • Общее представление о вариантах службы хранилища Azure
  • Общее представление о вариантах вычислений в Azure

Модули, включенные в эту схему обучения

После прохождения этого модуля вы узнаете, что Azure HDInsight — это полностью управляемая облачная служба, которая позволяет эффективно обрабатывать большие объемы данных с помощью самых популярных платформ с открытым кодом.

В этом модуле вы узнаете о различных конфигурациях, обеспечивающих оптимальное использование HDInsight с точки зрения производительности и стоимости.

В этом модуле вы узнаете, как создать кластер HDInsight, отслеживать его и выявлять распространенные проблемы с подготовкой.

Узнайте о том, как HBase обеспечивает произвольный доступ и строгую согласованность для больших объемов неструктурированных и частично структурированных данных в базе данных, не имеющей схемы, которая упорядочена по семействам столбцов.

В этом модуле вы узнаете, как создавать конвейеры и приложения для потоковой обработки данных в режиме реального времени в облаке с помощью Apache Kafka и Apache Spark в Azure HDInsight.

По завершении этого модуля вы сможете выполнять нерегламентированные запросы к наборам больших данных. Использование интерактивного запроса HDInsight помогает достичь задержек меньше секунды.

Azure HDInsight в сочетании с другими службами Azure предоставляет комплексное многоуровневое решение для обеспечения безопасности, управление которым является общей обязанностью корпорации Майкрософт и клиента.