Apache Spark용 SQL Server 빅 데이터 클러스터 런타임 가이드

적용 대상: 예SQL Server 2019 (15.x)

Apache Spark용 SQL Server 빅 데이터 클러스터 런타임 소개

Apache Spark용 SQL Server 빅 데이터 클러스터 런타임 은 배포 간에 원활한 상호 운용성을 가능하게 하는 Apache Spark를 위한 표준화된 사양입니다. 이 Spark 런타임은 프로그래밍 언어 배포, 엔진 최적화, 핵심 라이브러리, 패키지의 일관되고 버전이 지정된 블록입니다.

이 런타임 사양을 사용하는 모든 제품에는 동일한 버전의 Apache Spark Core, PySpark, Scala Spark, Spark.R, sparklyr, .NET for Spark가 포함됩니다.

모든 분산 패키지와 라이브러리도 동일합니다. 사양의 주요 목표 중 하나는 즉시 사용 가능한 패키지 및 커넥터의 지속적으로 큐레이팅되고 업데이트된 목록을 제공하여 데이터 엔지니어와 데이터 과학자에게 최고 수준의 환경을 제공하는 것입니다.

Apache Spark용 SQL Server 빅 데이터 클러스터 런타임의 이점은 다음과 같습니다.

  1. 모든 제품 및 서비스에서 사용할 수 있는 Spark 엔진 최적화 및 기능
  2. 설정된 릴리스 주기
  3. Spark 제품과 서비스 간의 원활한 상호 운용성
  4. 데이터 엔지니어 및 데이터 과학자를 위한 큐레이팅된 패키지
  5. 일관된 패키지 관리 스토리

릴리스 주기 및 명명 표준

Apache Spark용 SQL Server 빅 데이터 클러스터 런타임 사양은 다음을 정의합니다.

런타임 명명 표준은 다음과 같습니다.

PRODUCT_NAME.SPARK_MAJOR_VERSION.CALENDAR_YEAR.RELEASE#

예를 들면 “BDC.3.2021.1”입니다.

RELEASE# 은 순차적 의미 체계 번호입니다. 월 또는 다른 표준에 바인딩되지 않습니다. 런타임 릴리스를 만든 후에는 변경할 수 없습니다. SQL Server 빅 데이터 클러스터의 각 릴리스는 한 가지 버전의 런타임과 함께 제공됩니다.

현재 런타임 릴리스에는 무엇이 있나요?

SQL Server 빅 데이터 클러스터 플랫폼 릴리스 정보에 런타임 이름 및 릴리스의 전체 내용이 있습니다.

다음 단계

자세한 내용은 SQL Server 빅 데이터 클러스터 소개를 참조하세요.