Databricks 데이터 엔지니어링
Databricks 데이터 엔지니어링 기능은 데이터 과학자, 데이터 엔지니어 및 데이터 분석가 간의 협업을 위한 강력한 환경입니다. 데이터 엔지니어링 작업은 Databricks 기계 학습 솔루션의 중추이기도 합니다.
참고 항목
주로 SQL 쿼리 및 BI 도구를 사용하는 데이터 분석가인 경우 Databricks SQL을 선호할 수 있습니다.
속성 | 다음을 원하는 경우 사용합니다. |
---|---|
델타 라이브 테이블 | Databricks Delta Live Tables를 사용하여 수집 및 변환을 위한 데이터 파이프라인을 빌드하는 방법을 알아봅니다. |
구조적 스트리밍 | Databricks의 구조적 스트리밍을 통해 구동되는 스트리밍, 증분 및 실시간 워크로드에 대해 알아봅니다. |
Apache Spark | Databricks 및 Databricks 플랫폼에서 Apache Spark가 작동하는 방식을 알아봅니다. |
컴퓨팅 | Databricks 클러스터 및 클러스터를 만들고 관리하는 방법에 대해 알아봅니다. |
Notebooks | Databricks Notebook의 내용과 Notebook을 사용하고 관리하여 데이터를 처리, 분석 및 시각화하는 방법을 알아봅니다. |
워크플로 | Databricks 플랫폼에서 데이터 처리, 기계 학습 및 데이터 분석 워크플로를 오케스트레이션하는 방법을 알아봅니다. |
라이브러리 | 라이브러리를 사용하여 Databricks에서 타사 또는 사용자 지정 코드를 사용할 수 있도록 하는 방법을 알아봅니다. Databricks에 라이브러리를 설치하기 위한 다양한 모드에 대해 알아봅니다. |
Git 폴더 | Git을 사용하여 Databricks에서 개발을 위해 Notebook 및 기타 파일을 버전 제어하는 방법을 알아봅니다. |
DBFS | Databricks 작업 영역에 탑재되고 Databricks 클러스터에서 사용할 수 있는 분산 파일 시스템인 DBFS(Databricks 파일 시스템)에 대해 알아봅니다. |
파일 | Databricks의 파일 작업에 대한 옵션에 대해 알아봅니다. |
마이그레이션 | ETL 작업, 엔터프라이즈 데이터 웨어하우스, ML, 데이터 과학 및 분석과 같은 데이터 애플리케이션을 Databricks로 마이그레이션하는 방법을 알아봅니다. |
최적화 및 성능 | Databricks의 최적화 및 성능 권장 사항에 대해 알아봅니다. |
피드백
https://aka.ms/ContentUserFeedback
출시 예정: 2024년 내내 콘텐츠에 대한 피드백 메커니즘으로 GitHub 문제를 단계적으로 폐지하고 이를 새로운 피드백 시스템으로 바꿀 예정입니다. 자세한 내용은 다음을 참조하세요.다음에 대한 사용자 의견 제출 및 보기