Databricks 데이터 엔지니어링

아티클
03/18/2024

Databricks 데이터 엔지니어링 기능은 데이터 과학자, 데이터 엔지니어 및 데이터 분석가 간의 협업을 위한 강력한 환경입니다. 데이터 엔지니어링 작업은 Databricks 기계 학습 솔루션의 중추이기도 합니다.

참고 항목

주로 SQL 쿼리 및 BI 도구를 사용하는 데이터 분석가인 경우 Databricks SQL을 선호할 수 있습니다.

속성	다음을 원하는 경우 사용합니다.
델타 라이브 테이블	Databricks Delta Live Tables를 사용하여 수집 및 변환을 위한 데이터 파이프라인을 빌드하는 방법을 알아봅니다.
구조적 스트리밍	Databricks의 구조적 스트리밍을 통해 구동되는 스트리밍, 증분 및 실시간 워크로드에 대해 알아봅니다.
Apache Spark	Databricks 및 Databricks 플랫폼에서 Apache Spark가 작동하는 방식을 알아봅니다.
컴퓨팅	Databricks 클러스터 및 클러스터를 만들고 관리하는 방법에 대해 알아봅니다.
Notebooks	Databricks Notebook의 내용과 Notebook을 사용하고 관리하여 데이터를 처리, 분석 및 시각화하는 방법을 알아봅니다.
워크플로	Databricks 플랫폼에서 데이터 처리, 기계 학습 및 데이터 분석 워크플로를 오케스트레이션하는 방법을 알아봅니다.
라이브러리	라이브러리를 사용하여 Databricks에서 타사 또는 사용자 지정 코드를 사용할 수 있도록 하는 방법을 알아봅니다. Databricks에 라이브러리를 설치하기 위한 다양한 모드에 대해 알아봅니다.
Git 폴더	Git을 사용하여 Databricks에서 개발을 위해 Notebook 및 기타 파일을 버전 제어하는 방법을 알아봅니다.
DBFS	Databricks 작업 영역에 탑재되고 Databricks 클러스터에서 사용할 수 있는 분산 파일 시스템인 DBFS(Databricks 파일 시스템)에 대해 알아봅니다.
파일	Databricks의 파일 작업에 대한 옵션에 대해 알아봅니다.
마이그레이션	ETL 작업, 엔터프라이즈 데이터 웨어하우스, ML, 데이터 과학 및 분석과 같은 데이터 애플리케이션을 Databricks로 마이그레이션하는 방법을 알아봅니다.
최적화 및 성능	Databricks의 최적화 및 성능 권장 사항에 대해 알아봅니다.

피드백

출시 예정: 2024년 내내 콘텐츠에 대한 피드백 메커니즘으로 GitHub 문제를 단계적으로 폐지하고 이를 새로운 피드백 시스템으로 바꿀 예정입니다. 자세한 내용은 다음을 참조하세요. https://aka.ms/ContentUserFeedback

다음에 대한 사용자 의견 제출 및 보기

이 제품 이 페이지

모든 페이지 피드백 보기