HDInsight on AKS - 질문과 대답

아티클
02/29/2024

이 문서에서는 Azure HDInsight on AKS에 대한 몇 가지 일반적인 질문을 다룹니다.

일반

HDInsight on AKS란?

HDInsight on AKS는 Apache Flink(스트리밍용), Trino(임시 분석 및 BI용), Apache Spark와 같은 새로운 오픈 소스 분석 프로젝트를 통해 엔터프라이즈급 관리형 클러스터 서비스를 제공하는 새로운 HDInsight 버전입니다. 자세한 내용은 개요를 참조하세요.
HDInsight on AKS는 어떤 클러스터 형태를 지원하나요?

HDInsight on AKS는 먼저 Trino, Apache Flink 및 Apache Spark를 지원합니다. 그러나 Kafka, Hive 등과 같은 다른 클러스터 형태는 로드맵에 있습니다.
HDInsight on AKS를 시작하려면 어떻게 해야 하나요?

시작하려면 Azure Marketplace를 방문하여 Azure HDInsight on AKS 서비스를 검색하고 시작을 참조하세요.
VM의 기존 HDInsight와 현재 실행 중인 클러스터는 어떻게 되나요?

기존 HDInsight(VM의 HDInsight)에는 변경 내용이 없습니다. 모든 기존 클러스터는 계속 실행되며 새 HDInsight 클러스터를 계속 만들고 크기 조정할 수 있습니다.
HDInsight on AKS에서는 어떤 운영 체제가 지원되나요?

HDInsight on AKS는 Mariner OS를 기반으로 합니다. 자세한 내용은 OS 버전을 참조하세요.
HDInsight on AKS를 사용할 수 있는 모든 지역은 어디인가요?

지원되는 지역 목록은 지역 가용성을 참조하세요.
HDInsight on AKS 클러스터를 배포하는 데 드는 비용은 얼마인가요?

가격 책정에 대한 자세한 내용은 HDInsight on AKS 가격 책정을 참조하세요.

클러스터 관리

여러 클러스터를 동시에 실행할 수 있나요?

예. 클러스터 풀당 원하는 만큼의 클러스터를 동시에 실행할 수 있습니다. 그러나 구독 할당량에 따른 제약 조건이 없는지 확인합니다. 클러스터 풀에 허용되는 최대 노드 수는 250개(공개 미리 보기)입니다.
내 클러스터에 더 많은 플러그 인/라이브러리를 설치하거나 추가할 수 있나요?

예, 클러스터 형태에 따라 사용자 지정 플러그 인과 라이브러리를 설치할 수 있습니다.
- Trino의 경우 사용자 지정 플러그 인 설치를 참조하세요.
- Spark의 경우 Spark의 라이브러리 관리를 참조하세요.
내 클러스터에 SSH를 통해 연결할 수 있나요?

예, webssh를 통해 클러스터에 SSH를 통해 쿼리를 실행하고 해당 위치에서 직접 작업을 제출할 수 있습니다.

메타 저장소

외부 메타스토어를 사용하여 내 클러스터에 연결할 수 있나요?

예, 외부 메타스토어를 사용할 수 있습니다. 그러나 외부 사용자 지정 메타스토어로는 Azure SQL Database만 지원됩니다.
여러 클러스터에서 메타스토어를 공유할 수 있나요?

예, AKS의 여러 HDInsight에서 메타스토어를 공유할 수 있습니다.
지원되는 Hive 메타스토어 버전은 무엇인가요?

Hive 메타스토어 버전 3.1.2

워크로드

Trino

Trino란?

Trino는 중앙 데이터 웨어하우스로 이동하지 않고도 다양한 데이터 원본에 있는 데이터를 쿼리할 수 있는 오픈 소스 페더레이션된 분산 SQL 쿼리 엔진입니다. 새로운 언어를 알아볼 필요 없이 ANSI SQL을 사용하여 데이터를 쿼리할 수 있습니다. 자세한 내용은 Trino 개요를 참조하세요.
어떤 커넥터를 지원하나요?

HDInsight on AKS Trino는 여러 커넥터를 지원합니다. 자세한 내용은 Trino 커넥터 목록을 참조하세요. 오픈 소스 버전에서 새 커넥터를 사용할 수 있게 되면 계속해서 새 커넥터를 추가하고 있습니다.
기존 클러스터에 카탈로그를 추가할 수 있나요?

예, 기존 클러스터에 지원되는 카탈로그를 추가할 수 있습니다. 자세한 내용은 기존 클러스터에 카탈로그 추가를 참조하세요.

Apache Flink

Apache Flink란?

Apache Flink는 스트림을 처리하고 제한되지 않은 데이터 스트림과 제한된 데이터 스트림에 대한 상태 저장 계산을 수행하기 위한 동급 최고의 오픈 소스 분석 엔진입니다. 이는 메모리 내 속도와 규모에 관계없이 계산을 수행할 수 있습니다. HDInsight on AKS의 Flink는 관리 오픈 소스 Apache Flink를 제공합니다. 자세한 내용은 Flink 개요를 참조하세요.
Apache Flink에서 세션 모드와 앱 모드를 모두 지원하나요?

HDInsight on AKS에서 Flink는 현재 세션 모드 클러스터를 지원합니다.
상태 백 엔드 관리란 무엇이며 HDInsight on AKS에서 어떻게 수행되나요?

백 엔드는 상태가 저장되는 위치를 결정합니다. 검사점이 활성화되면 데이터 손실을 방지하고 일관되게 복구하기 위해 검사점에 상태가 유지됩니다. 상태가 내부적으로 표현되는 방식과 검사점에서 지속되는 방식과 위치는 선택한 상태 백 엔드에 따라 다릅니다. 자세한 내용은 Flink 개요를 참조하세요.

Apache Spark

Apache Spark란?

Apache Spark는 대규모 데이터 세트에 대한 처리 작업을 신속하게 수행할 수 있고 자체적으로 또는 다른 분산 컴퓨팅 도구와 함께 여러 컴퓨터에 데이터 처리 작업을 분산할 수 있는 데이터 처리 프레임워크입니다.
Spark에서는 어떤 언어 API가 지원되나요?

Azure HDInsight on AKS는 Python 및 Scala를 지원합니다.
HDInsight on AKS Spark에서 외부 메타스토어가 지원되나요?

HDInsight on AKS는 외부 메타스토어 연결을 지원합니다. 현재는 Azure SQL DB만 외부 메타스토어로 지원됩니다.
HDInsight on AKS Spark에서 작업을 제출하는 다양한 방법은 무엇인가요?

Jupyter Notebook, Zeppelin Notebook, SDK 및 클러스터 터미널을 사용하여 HDInsight on AKS Spark에서 작업을 제출할 수 있습니다. 자세한 내용은 HDInsight on AKS에서 Spark 클러스터에 대한 작업 제출 및 관리를 참조하세요.

Share via

HDInsight on AKS - 질문과 대답

일반

클러스터 관리

메타 저장소

워크로드

Trino

Apache Flink

Apache Spark

피드백

피드백

추가 리소스