Azure HDInsight를 사용하여 OSS (오픈 소스 소프트웨어) 분석 솔루션 빌드

중급
데이터 엔지니어
데이터 과학자
Azure HDInsight

이 학습 경로에서 학습자는 HDInsight를 소개받고, 이 기술을 적용하여 다양한 실제 문제를 해결하는 방법을 배웁니다.

사전 요구 사항

다음 필요조건을 충족해야 합니다.

  • Azure Portal에 로그인
  • Azure Storage 옵션 이해
  • Azure 컴퓨팅 옵션 이해

이 학습 경로의 모듈

이 모듈의 끝부분에서는 Azure HDInsight가 가장 인기 있는 오픈 소스 프레임워크를 사용하여 대량 데이터를 효율적으로 처리할 수 있도록 하는 완전 관리형 클라우드 서비스임을 알아봅니다.

이 모듈에서는 성능 및 비용 관점에서 HDInsight 사용을 최적화하기 위한 다양한 구성을 알아봅니다.

이 모듈에서는 HDInsight 클러스터를 만들고, 클러스터를 모니터링하고, 일반적인 프로비전 문제를 인식하는 방법을 알아봅니다.

HBase를 통해 열 패밀리로 구성된 스키마 없는 데이터베이스에서 대량의 비정형 데이터 및 반정형 데이터에 임의 액세스 및 뛰어난 일관성을 제공하는 방법을 알아봅니다.

이 모듈에서는 Apache Kafka 및 Apache Spark와 함께 Azure HDInsight를 사용하여 클라우드에서 실시간 스트리밍 데이터 분석 파이프라인 및 애플리케이션을 만드는 방법에 대해 설명합니다.

이 모듈을 마치면 빅데이터 세트에 대해 임시 쿼리를 수행할 수 있습니다. HDInsight Interactive Query를 사용하여 1초 미만의 쿼리 대기 시간을 달성할 수 있습니다.

다른 Azure 서비스와 함께 Azure HDInsight는 포괄적인 다중 계층 보안 솔루션을 제공하며 이는 Microsoft와 고객 간의 공동 책임입니다.