Azure HDInsight에 타사 Apache Hadoop 애플리케이션 설치

Azure HDInsight에 타사 Apache Hadoop 애플리케이션을 설치하는 방법을 알아봅니다. 사용자 고유의 애플리케이션을 설치하는 방법에 대한 지침은 사용자 지정 HDInsight 애플리케이션 설치를 참조하세요.

HDInsight 애플리케이션은 HDInsight 클러스터에 사용자가 설치할 수 있는 애플리케이션입니다. Microsoft, ISV(독립 소프트웨어 공급 업체) 또는 사용자가 직접 이러한 애플리케이션을 개발할 수 있습니다.

다음 목록에서는 게시된 애플리케이션을 보여 줍니다.

애플리케이션 클러스터 유형 설명
AtScale 인텔리전스 플랫폼 Hadoop은 AtScale은 HDInsight 클러스터를 스케일 아웃 OLAP 서버로 전환하여 Microsoft Excel, Power BI, Tableau Software에서 QlikView로 이미 알고, 소유하고, 좋아하는 BI 도구를 사용하여 수십억 개의 데이터 행을 대화형으로 쿼리할 수 있도록 합니다.
Datameer Hadoop은 Datameer는 분석할 데이터를 준비, 탐색, 관리하는 셀프 서비스 확장형 플랫폼으로, 복잡한 다중 소스 데이터를 비즈니스에 바로 사용 가능한 소중한 정보로 전환하여 더 빠르고 스마트한 인사이트를 기업 전체에 제공합니다.
HDInsight의 Dataiku DSS Hadoop, Spark 데이터 과학자와 데이터 분석가가 협업을 통해 원시 데이터를 매우 효과적인 예측으로 전환하여 새 데이터 제품 및 서비스를 보다 효율적으로 디자인하고 실행할 수 있도록 하는 엔터프라이즈 데이터 과학 플랫폼의 Dataiku DSS.
WANdisco Fusion HDI 앱 Hadoop, Spark, HBase, Kafka 분산 환경에서 데이터를 일관되게 유지하는 것은 엄청난 데이터 작업 과제입니다. 엔터프라이즈급 소프트웨어 플랫폼인 WANdisco Fusion은 모든 환경에서 비정형 데이터 일관성을 사용하여 이 문제를 해결합니다.
HDInsight용 H2O SparklingWater Spark H2O Sparkling Water는 다음 분산 알고리즘을 지원합니다. GLM, Naïve Bayes, 분산 랜덤 포리스트, 경사 부스팅 머신, 심층 신경망, 딥 러닝, K-평균, PCA, 일반화된 하위 순위 모델, 이상 탐지 및 자동 인코더
HDInsight에 대한 실시간 데이터 통합을 위한 Striim Hadoop, HBase, Spark, Kafka Striim(“스트림”으로 발음)은 엔드투엔드 데이터 통합 + 인텔리전스 플랫폼으로, 서로 다른 데이터 스트림을 연속으로 수집, 처리, 분석할 수 있습니다.
Jumbune 엔터프라이즈 - 빅 데이터 분석 가속화 Hadoop, Spark 높은 수준에서 Jumbune은 엔터프라이즈를 지원합니다. 1. Tez, MapReduce 및 Spark 엔진 기반 Hive, Java, Scala 워크로드 성능 가속화. 2. 자동 관리 Hadoop 클러스터 모니터링. 3. 분산 파일 시스템에 데이터 품질 관리 설정.
Kyligence Enterprise Hadoop, HBase, Spark Apache Kylin에서 제공하는 Kyligence Enterprise는 빅 데이터를 기반으로 BI를 가능하게 합니다. Hadoop의 엔터프라이즈 OLAP 엔진인 Kyligence Enterprise는 산업 표준 데이터 웨어하우스 및 BI 방법론을 사용하여 Hadoop에서 BI를 설계하는 비즈니스 분석가의 역량을 강화합니다.
HDInsight Cloud용 StreamSets Data Collector Hadoop, HBase, Spark, Kafka StreamSets Data Collector는 데이터를 실시간으로 스트림하는 간단하고 강력한 엔진입니다. Data Collector를 사용하여 데이터 스트림에서 데이터를 라우팅하고 처리합니다. 30일 평가판 라이선스가 함께 제공됩니다.
Trifacta Wrangler Enterprise Hadoop, Spark, HBase HDInsight용 Trifacta Wrangler Enterprise는 모든 규모의 데이터에 대해 엔터프라이즈 전체 데이터 랭글링를 지원합니다. Azure에서 Trifacta를 실행하는 비용은 Trifacta 구독 비용과 가상 머신에 대한 Azure 인프라 비용의 조합입니다.
Unifi 데이터 플랫폼 Hadoop, HBase, Spark Unifi Data Platform은 원활하게 통합되는 셀프 서비스 데이터 도구 제품군으로, 비즈니스 사용자가 데이터 과제를 해결하여 수익을 높이고 비용 또는 운영 복잡성을 줄일 수 있도록 설계되었습니다.

이 문서에서 제공하는 지침은 Azure Portal을 사용합니다. 또한 포털에서 Azure Resource Manager 템플릿을 내보내거나 공급 업체에서 Resource Manager 템플릿의 복사본을 가져오고 Azure PowerShell 및 Azure 클래식 CLI를 사용하여 템플릿을 배포할 수 있습니다. Resource Manager 템플릿을 사용하여 HDInsight에서 Apache Hadoop 클러스터 만들기를 참조하세요.

필수 조건

기존 HDInsight 클러스터에 HDInsight 애플리케이션을 설치하려면 HDInsight 클러스터가 있어야 합니다. HDInsight 클러스터를 만들려면 클러스터 만들기를 참조하세요. HDInsight 클러스터를 만들 경우 HDInsight 애플리케이션도 설치할 수 있습니다.

기존 클러스터에 애플리케이션 설치

다음 절차에서는 기존 HDInsight 클러스터에 HDInsight 애플리케이션을 설치하는 방법을 보여 줍니다.

HDInsight 애플리케이션 설치

  1. Azure Portal에 로그인합니다.

  2. 왼쪽 메뉴에서 모든 서비스>Analytics>HDInsight 클러스터로 이동합니다.

  3. 목록에서 HDInsight 클러스터를 선택합니다. HDInsight 클러스터가 없는 경우 만듭니다. see 클러스터 만들기를 참조하세요.

  4. 설정 범주에서 애플리케이션을 선택합니다. 주 창에서 설치된 애플리케이션 목록을 볼 수 있습니다.

    HDInsight applications portal menu.

  5. 메뉴에서 +추가를 선택합니다. 사용 가능한 애플리케이션 목록을 볼 수 있습니다. +추가가 회색으로 표시되면 이 버전의 HDInsight 클러스터용 애플리케이션이 없는 것입니다.

    HDInsight applications available applications.

  6. 사용할 수 있는 애플리케이션 중 하나를 선택한 다음, 지침에 따라 약관에 동의합니다.

포털 알림에서 설치 상태를 확인할 수 있습니다(포털 맨 위에 있는 종 모양 아이콘 선택). 애플리케이션이 설치되면 설치된 앱 목록에 표시됩니다.

클러스터 생성 중에 애플리케이션 설치

클러스터를 만들 때 HDInsight 애플리케이션을 설치하는 옵션이 있습니다. 클러스터가 만들어지고 실행 상태가 되면 프로세스 중에 HDInsight 애플리케이션이 설치됩니다. Azure Portal을 사용하여 클러스터를 만드는 동안 애플리케이션을 설치하려면 구성 + 가격 책정 탭에서 + 애플리케이션 추가를 선택합니다.

Azure portal cluster configuration applications.

설치된 HDInsight 앱 및 속성 나열

포털에서는 클러스터에 설치된 HDInsight 애플리케이션의 목록과 설치된 애플리케이션 각각의 속성을 보여 줍니다.

HDInsight 애플리케이션 나열 및 속성 표시

  1. Azure Portal에 로그인합니다.

  2. 왼쪽 메뉴에서 모든 서비스>Analytics>HDInsight 클러스터로 이동합니다.

  3. 목록에서 HDInsight 클러스터를 선택합니다.

  4. 설정 범주에서 애플리케이션을 선택합니다. 주 창에서 설치된 애플리케이션 목록을 볼 수 있습니다.

    HDInsight applications installed apps.

  5. 설치된 애플리케이션 중 하나를 선택하여 속성을 표시합니다. 속성 목록:

    속성 설명
    앱 이름 애플리케이션 이름.
    상태 애플리케이션 상태입니다.
    웹 페이지 에지 노드에 배포한 웹 애플리케이션의 URL입니다. 자격 증명은 클러스터에 대해 구성한 HTTP 사용자 자격 증명과 동일합니다.
    SSH 엔드포인트 SSH를 사용하여 에지 노드에 연결할 수 있습니다. SSH 자격 증명은 클러스터에 대해 구성한 SSH 사용자 자격 증명과 동일합니다. 자세한 내용은 HDInsight와 함께 SSH 사용을 참조하세요.
    설명 애플리케이션 설명입니다.
  6. 애플리케이션을 삭제하려면 애플리케이션을 마우스 오른쪽 단추로 클릭한 다음, 상황에 맞는 메뉴에서 삭제를 클릭합니다.

에지 노드에 연결

HTTP 및 SSH를 사용하여 에지 노드에 연결할 수 있습니다. 엔드포인트 정보는 포털에서 찾을 수 있습니다. 자세한 내용은 HDInsight와 함께 SSH 사용을 참조하세요.

HTTP 엔드포인트 자격 증명은 HDInsight 클러스터에 대해 구성된 HTTP 사용자 자격 증명입니다. SSH 엔드포인트 자격 증명은 HDInsight 클러스터에 대해 구성된 SSH 자격 증명입니다.

문제 해결

설치 문제 해결을 참조하세요.

다음 단계