PolyBase의 질문과 대답

적용 대상: SQL Server 2016(13.x) 이상 버전

PolyBase 및 연결된 서버

다음 표에서는 PolyBase와 연결된 서버 기능 간의 차이점을 보여 줍니다.

PolyBase 연결된 서버
데이터베이스 범위 지정 개체 인스턴스 범위 개체
ODBC 드라이버 사용 OLEDB 공급자 사용
모든 데이터 원본에 대한 읽기 전용 작업을 지원하고 일부 외부 데이터 원본에 쓰기 읽기와 쓰기 작업을 모두 지원합니다.
단일 연결에서 원격 데이터 원본에 수행하는 쿼리는 확장할 수 있습니다. 단일 연결에서 원격 데이터 원본에 대한 쿼리는 스케일 아웃할 수 없습니다.
조건자 푸시다운이 지원됩니다. 조건자 푸시다운이 지원됩니다.
가용성 그룹에 별도의 구성이 필요하지 않음 가용성 그룹의 각 인스턴스에 별도 구성이 필요합니다.
기본 인증 전용입니다. 기본 및 통합 인증
많은 수의 행을 처리하는 분석 쿼리에 적합합니다. 단일 또는 몇 개의 행을 반환하는 OLTP 쿼리에 적합합니다.
외부 테이블을 사용하는 쿼리는 분산 트랜잭션에 참여할 수 없습니다. 분산 쿼리는 분산 트랜잭션에 참여할 수 있습니다.

SQL Server 2022의 PolyBase의 새로운 기능

SQL Server 2022(16.x)는 이제 S3 REST API, 온-프레미스 또는 클라우드를 사용하여 Azure Storage 계정 v2, Azure Data Lake Storage Gen2 또는 S3 호환 개체 스토리지에 저장된 CSV, Parquet 및 델타 파일을 지원합니다.

이제 SQL Server 2022(16.x)는 OPENROWSET, CREATE EXTERNAL TABLE(CET) 및 모든 새로운 T-SQL 향상된 기능과 함께 CREATE EXTERNAL TABLE as SELECT(CETAS)를 사용할 수 있습니다.

현재 Hadoop 외부 데이터 원본에 대한 지원은 SQL Server 2022(16.x)에서 제거되었습니다.

이제 SQL Server 2022(16.x) 누적 업데이트 2에서 Oracle TNS 파일에 대한 지원이 도입되었습니다. 자세한 내용 및 샘플은 CREATE EXTERNAL DATA SOURCE 를 참조하세요.

SQL Server 2022용 PolyBase를 사용한 데이터 가상화에 대해 자세히 알아보고 SQL Server 2022 PolyBase의 향상된 기능을 검토하세요.

SQL Server 2019의 PolyBase의 새로운 기능

SQL Server 2019(15.x)의 PolyBase는 이제 더 다양한 데이터 원본에서 데이터를 읽을 수 있습니다. 이러한 외부 데이터 원본의 데이터는 SQL Server의 외부 테이블로 저장할 수 있습니다. PolyBase는 ODBC 제네릭 형식을 제외한 이러한 외부 데이터 원본에 대한 푸시다운 계산도 지원합니다.

호환되는 데이터 원본

  • SQL Server
  • Oracle
  • Teradata
  • MongoDB
  • 호환되는 ODBC 제네릭 형식

SQL Server 2019(15.x) 누적 업데이트 19는 이제 Oracle TNS 파일에 대한 지원을 도입했습니다. 자세한 내용 및 샘플은 CREATE EXTERNAL DATA SOURCE 를 참조하세요.

참고 항목

PolyBase는 타사 ODBC 드라이버를 사용하여 외부 데이터 원본에 대한 연결을 허용할 수 있습니다. 이러한 드라이버는 PolyBase와 함께 제공되지 않으며 의도한 대로 작동하지 않을 수 있습니다. 자세한 내용은 ODBC 제네릭 형식을 사용하여 외부 데이터에 액세스하도록 PolyBase 구성을 참조 하세요.

타사 데이터 원본에 연결하려면 어떤 CONNECTION_OPTIONS 지정할 수 있나요?

SQL Server, Oracle, Teradata, Cosmos DB용 MongoDB API 및 일반 ODBC 데이터 공급자에 대해 지원되는 데이터 공급자 연결 옵션은 CREATE EXTERNAL DATA SOURCE(Transact-SQL) CONNECTION_OPTIONS 검토합니다.

PolyBase 푸시다운 계산의 원격 쿼리 실행 계획을 보려면 어떻게 해야 하나요?

이는 SQL Server 버전에 따라 몇 가지 방법을 통해 가능합니다. PolyBase 문제 해결 - PolyBase 쿼리 계획을 보려면 참조하세요.

PolyBase 푸시다운 계산이 발생하는지를 확인하려면 어떻게 하나요?

외부 푸시다운이 발생했는지 확인하는 방법을 참조하세요.

PolyBase는 Azure SQL Database에서 지원되는가요?

아니요. 하지만 OPENROWSET 함수를 사용하여 Azure Blob Storage에 배치된 파일의 데이터를 쿼리하거나 CREATE EXTERNAL TABLE을 사용하여 Synapse Analytics의 서버리스 SQL 풀에서 읽을 수 있습니다. 자세한 내용은 Synapse SQL 외부 테이블을 사용하여 Azure SQL에서 Azure Data Lake Storage 파일을 읽을 수 있습니다.

PolyBase는 Azure SQL Managed Instance에서 지원되는가요?

Azure SQL Managed Instance에는 ADLS(Azure Data Lake Storage) 및 Azure Blob Storage를 데이터 원본으로 사용할 수 있는 자체 데이터 가상화 기능이 있습니다. 자세한 내용은 Azure SQL Managed Instance를 사용한 데이터 가상화를 참조 하세요.

PolyBase에 대해 방화벽을 통해 어떤 포트를 허용해야 하나요?

Polybase 스케일 아웃 그룹의 경우를 제외하고는 PolyBase 자체에 대해 열어야 하는 추가 포트는 없습니다. 스케일 아웃 그룹이 없으면 PolyBase 서비스만 방화벽 규칙이 필요하지 않습니다.

Windows 서버에서 PolyBase는 SQL Server 구성 관리자 TCP/IP 설정의 IPAll 섹션에서 SQL Server에서 사용하는 포트를 활용합니다. 자세한 내용은 TCP/IP 속성을 참조하세요. Linux 서버에서 PolyBase는 network.tcpport 설정을 활용합니다. 자세한 내용은 TCP 포트를 참조하세요.

여러 Windows 서버에 대한 PolyBase 스케일 아웃 그룹의 경우 다음 질문의 포트 정보를 참조하세요.

그러나 PolyBase에서 사용되는 다양한 외부 데이터 원본에 대한 통신을 위해 다른 포트를 허용해야 합니다. ODBC 구성, Azure 리소스 구성 또는 특정 데이터 원본 설명서를 참조하세요. 예시:

원본 플랫폼 참조
Microsoft SQL Server SQL Server에서 사용하는 포트
Hortonworks HDP Administering HDFS(HDFS 관리)
Cloudera CDH CDH 구성 요소에서 사용하는 포트

PolyBase 스케일 아웃 그룹에 사용되는 포트는 무엇인가요?

기본적으로 PolyBase 데이터 이동 서비스는 일반적으로 16450-16453 및 포트 17001을 사용하는 TCP 16450-16460의 포트 범위를 통해 스케일 아웃 그룹의 헤드 노드에 연결합니다. 이러한 포트는 PolyBase 스케일 아웃 그룹이 구성된 경우에만 사용되며 서버 방화벽을 통해 허용되어야 합니다. SQL Server 설치 프로그램은 기능 설치 시 이러한 포트를 허용하는 로컬 방화벽 규칙을 자동으로 만들어야 합니다. 자세한 내용은 Windows에서 PolyBase 스케일 아웃 그룹 구성을 참조하세요.

참고 항목

Microsoft SQL Server PolyBase 스케일 아웃 그룹은 사용 중지됩니다. 스케일 아웃 그룹 기능은 SQL Server 2022(16.x) 제품에서 제거됩니다.

빅 데이터 클러스터 PolyBase 및 독립 실행형 인스턴스의 PolyBase

ODBC 제네릭 커넥터를 사용하는 연결에 대한 자세한 내용은 ODBC 제네릭 형식을 구성하기 위한 방법 가이드를 참조하세요.

다음 표에서는 SQL Server 2019(15.x) 독립 실행형 설치 및 SQL Server 2019(15.x) 빅 데이터 클러스터에서 사용할 수 있는 PolyBase 기능을 강조 표시합니다.

기능 빅 데이터 클러스터 독립 실행형 인스턴스
SQL Server, Oracle, Teradata 및 Mongo DB를 위한 외부 데이터 원본 만들기 X X
호환되는 타사 ODBC 드라이버를 사용하여 외부 데이터 원본 만들기 X
HADOOP 데이터 원본에 대한 외부 데이터 원본 만들기 X X
Azure Blob Storage에 대한 외부 데이터 원본 만들기 X X
SQL Server 데이터 풀에 외부 테이블 만들기 X
SQL Server 스토리지 풀에 외부 테이블 만들기 X
스케일 아웃 쿼리 실행 X X(Windows에만 해당)

Important

Microsoft SQL Server 2019 빅 데이터 클러스터 추가 기능이 사용 중지됩니다. SQL Server 2019 빅 데이터 클러스터에 대한 지원은 2025년 2월 28일에 종료됩니다. Software Assurance를 사용하는 SQL Server 2019의 모든 기존 사용자는 플랫폼에서 완전히 지원되며 소프트웨어는 해당 시간까지 SQL Server 누적 업데이트를 통해 계속 기본 얻을 수 있습니다. 자세한 내용은 공지 블로그 게시물Microsoft SQL Server 플랫폼의 빅 데이터 옵션을 참조하세요.