Azure Virtual Network의 HDInsight에서 Apache HBase 클러스터 만들기

Azure Virtual Network에서 Azure HDInsight Apache HBase 클러스터를 만드는 방법을 알아봅니다.

가상 네트워크 통합을 사용하면 애플리케이션이 HBase와 직접 통신할 수 있도록 애플리케이션과 동일한 가상 네트워크에 Apache HBase 클러스터를 배포할 수 있습니다. 이점은 다음과 같습니다.

  • 웹 애플리케이션을 HBase 클러스터의 노드에 직접 연결하므로 HBase Java RPC(원격 프로시저 호출) API를 통해 통신할 수 있습니다.
  • 트래픽이 여러 게이트웨이 및 부하 분산 장치를 통과하지 않도록 하여 성능을 향상시킵니다.
  • 공용 엔드포인트를 노출하지 않고 중요한 정보를 보다 안전한 방식으로 처리할 수 있습니다.

Azure 구독이 없는 경우 시작하기 전에 체험 계정을 만듭니다.

가상 네트워크에 Apache HBase 클러스터 만들기

이 섹션에서는 Azure Resource Manager 템플릿을 사용하여 Azure 가상 네트워크에서 종속 Azure Storage 계정으로 Linux 기반 Apache HBase 클러스터를 만듭니다. 기타 클러스터 생성 방법 및 설정에 대한 이해는 HDInsight 클러스터 만들기를 참조하세요. 템플릿을 사용하여 HDInsight에서 Apache Hadoop 클러스터를 만드는 방법에 대한 자세한 내용은 Azure Resource Manager 템플릿을 사용하여 HDInsight에서 Apache Hadoop 클러스터 만들기를 참조하세요.

참고 항목

일부 속성이 템플릿에 하드 코딩되었습니다. 예시:

  • 위치: 미국 동부 2
  • 클러스터 버전: 3.6
  • 클러스터 작업자 노드 수: 2
  • 기본 스토리지 계정: 고유한 문자열
  • 가상 네트워크 이름: CLUSTERNAME-vnet
  • 가상 네트워크 주소 공간: 10.0.0.0/16
  • 서브넷 이름: subnet1
  • 서브넷 주소 범위: 10.0.0.0/24

CLUSTERNAME은 템플릿을 사용할 때 제공하는 클러스터 이름으로 대체됩니다.

  1. Azure Portal에서 템플릿을 열려면 다음 이미지를 선택합니다. 템플릿은 Azure 빠른 시작 템플릿에 있습니다.

    Deploy to Azure button for new cluster

  2. 사용자 지정 배포 대화 상자에서 템플릿 편집을 선택합니다.

  3. 165번 줄에서 값 Standard_A3Standard_A4_V2로 변경합니다. 그런 다음 저장을 선택합니다.

  4. 다음 정보를 사용하여 나머지 템플릿을 완료합니다.

    속성
    구독 HDInsight 클러스터, 종속 Storage 계정 및 Azure 가상 네트워크를 만드는 데 사용한 Azure 구독을 선택합니다.
    Resource group 새로 만들기를 선택하고 새 리소스 그룹 이름을 지정합니다.
    위치 리소스 그룹의 위치를 선택합니다.
    클러스터 이름 만들려는 Hadoop 클러스터의 이름을 입력합니다.
    클러스터 로그인 사용자 이름 및 암호 기본 사용자 이름은 admin입니다. 암호를 제공합니다.
    Ssh 사용자 이름 및 암호 기본 사용자 이름은 sshuser입니다. 암호를 입력합니다.

    사용 약관에 동의함을 선택합니다.

  5. 구매를 선택합니다. 클러스터를 만들려면 20분 정도가 걸립니다. 클러스터가 만들어졌으면 포털에서 클러스터를 선택하면 열립니다.

문서를 완료한 후에 클러스터를 삭제할 수 있습니다. HDInsight를 사용하면 데이터가 Azure Storage에 저장되기 때문에 클러스터를 사용하지 않을 때 안전하게 삭제할 수 있습니다. HDInsight 클러스터를 사용하지 않는 기간에도 요금이 청구됩니다. 클러스터에 대한 요금이 스토리지에 대한 요금보다 몇 배 더 많기 때문에, 클러스터를 사용하지 않을 때는 삭제하는 것이 경제적인 면에서 더 합리적입니다. 클러스터 삭제에 대한 내용은 Azure Portal을 사용하여 HDInsight에서 Apache Hadoop 클러스터 관리를 참조하세요.

새 HBase 클러스터 사용을 시작하려는 경우 HDInsight에서 Apache Hadoop을 통해 Apache HBase 사용 시작의 절차를 따르면 됩니다.

Apache HBase Java RPC API를 사용하여 Apache HBase 클러스터에 연결

가상 머신 만들기

동일한 Azure 가상 네트워크와 동일한 서브넷에 IaaS(infrastructure as a service) 가상 머신을 만듭니다. 새 IaaS 가상 머신을 만드는 지침은 Windows Server를 실행하는 Virtual Machine 만들기를 참조하세요. 이 문서의 단계를 수행할 때 다음과 같은 네트워크 구성 값을 사용해야 합니다.

  • 가상 네트워크: CLUSTERNAME-vnet
  • 서브넷: subnet1

Important

CLUSTERNAME을 이전 단계에서 HDInsight 클러스터를 만들 때 사용한 이름으로 변경합니다.

이러한 값을 사용하면 가상 머신이 HDInsight 클러스터와 동일한 가상 네트워크와 서브넷에 배치됩니다. 이 구성을 사용하면 서로 직접 통신할 수 있습니다. 빈 에지 노드가 있는 HDInsight 클러스터를 만드는 방법이 있습니다. 에지 노드를 사용하여 클러스터를 관리할 수 있습니다. 자세한 내용은 HDInsight에서 빈 에지 노드 사용을 참조하세요.

정규화된 도메인 이름 가져오기

Java 애플리케이션을 사용하여 HBase에 원격으로 연결할 때는 FQDN(정규화된 도메인 이름)을 사용해야 합니다. 확인하려면 HBase 클러스터의 연결별 DNS 접미사를 가져와야 합니다. 이렇게 하려면 다음 방법 중 하나를 사용합니다.

  • 웹 브라우저를 사용하여 Apache Ambari를 호출합니다.

    https://CLUSTERNAME.azurehdinsight.net/api/v1/clusters/CLUSTERNAME/hosts?minimal_response=true으로 이동합니다. DNS 접미사를 사용하여 JSON 파일을 반환합니다.

  • Ambari 웹 사이트를 사용합니다.

    1. https://CLUSTERNAME.azurehdinsight.net으로 이동합니다.
    2. 상위 메뉴에서 호스트를 선택합니다.
  • Curl을 사용하여 REST를 호출합니다.

    curl -u <username>:<password> -k https://CLUSTERNAME.azurehdinsight.net/ambari/api/v1/clusters/CLUSTERNAME.azurehdinsight.net/services/hbase/components/hbrest
    

반환되는 JSON(JavaScript Object Notation) 데이터에서 "host_name" 항목을 찾습니다. 이 항목에는 클러스터의 노드에 대한 FQDN이 포함되어 있습니다. 예시:

"host_name" : "hn*.hjfrnszlumfuhfk4pi1guh410c.bx.internal.cloudapp.net"

클러스터 이름으로 시작하는 도메인 이름 부분이 DNS 접미사입니다. 예: hjfrnszlumfuhfk4pi1guh410c.bx.internal.cloudapp.net.

가상 네트워크 내 통신 확인

가상 머신이 HBase 클러스터와 통신할 수 있는지 확인하려면 가상 머신에서 ping headnode0.<dns suffix> 명령을 사용합니다. 예: ping hn*.hjfrnszlumfuhfk4pi1guh410c.bx.internal.cloudapp.net.

Java 애플리케이션에서 이 정보를 사용하려는 경우 Apache Maven을 통해 HDInsight(Hadoop)와 함께 Apache HBase를 사용하는 Java 애플리케이션 작성 의 단계에 따라 애플리케이션을 만들 수 있습니다. 애플리케이션이 원격 HBase 서버에 연결하도록 하려면 이 예제의 hbase-site.xml 파일이 ZooKeeper의 FQDN을 사용하도록 수정합니다. 예시:

<property>
    <name>hbase.zookeeper.quorum</name>
    <value>zookeeper0.<dns suffix>,zookeeper1.<dns suffix>,zookeeper2.<dns suffix></value>
</property>

참고 항목

자체 DNS 서버를 사용하는 방법을 포함한 Azure Virtual Network의 이름 확인에 대한 자세한 내용은 이름 확인(DNS)을 참조하세요.

다음 단계

이 문서에서는 Apache HBase 클러스터를 만드는 방법을 배웠습니다. 자세한 내용은 다음을 참조하세요.