Создание решений аналитики с открытым кодом при помощи Azure HDInsight
В этой схеме обучения вы узнаете о HDInsight и о том, как применить эту технологию для решения разнообразных реальных задач.
Предварительные требования
Необходимо выполнить следующие предварительные требования
- Вход на портал Azure
- Общее представление о вариантах службы хранилища Azure
- Общее представление о вариантах вычислений в Azure
Модули, включенные в эту схему обучения
После прохождения этого модуля вы узнаете, что Azure HDInsight — это полностью управляемая облачная служба, которая позволяет эффективно обрабатывать большие объемы данных с помощью самых популярных платформ с открытым кодом.
В этом модуле вы узнаете о различных конфигурациях, обеспечивающих оптимальное использование HDInsight с точки зрения производительности и стоимости.
В этом модуле вы узнаете, как создать кластер HDInsight, отслеживать его и выявлять распространенные проблемы с подготовкой.
Узнайте о том, как HBase обеспечивает произвольный доступ и строгую согласованность для больших объемов неструктурированных и частично структурированных данных в базе данных, не имеющей схемы, которая упорядочена по семействам столбцов.
В этом модуле вы узнаете, как создавать конвейеры и приложения для потоковой обработки данных в режиме реального времени в облаке с помощью Apache Kafka и Apache Spark в Azure HDInsight.
По завершении этого модуля вы сможете выполнять нерегламентированные запросы к наборам больших данных. Использование интерактивного запроса HDInsight помогает достичь задержек меньше секунды.