DBFS 루트 작업에 대한 권장 사항

Azure Databricks는 DBFS 루트 디렉터리를 일부 작업 영역 작업의 기본 위치 로 사용합니다. Databricks는 프로덕션 데이터 또는 중요한 정보를 DBFS 루트에 저장하지 않는 것이 좋습니다. 이 문서에서는 DBFS 루트에서 중요한 데이터가 실수로 노출되는 것을 방지하기 위한 권장 사항에 중점을 둡니다.

참고

Azure Databricks는 내부 DBFS라고 하는 고객 소유 클라우드 스토리지에서 데이터 및 구성을 유지하기 위해 별도의 프라이빗 스토리지 위치를 구성합니다. 이 위치는 사용자에게 노출되지 않습니다.

중요

2023년 3월 6일부터 새 Azure Databricks 작업 영역은 DBFS 루트에 Azure Data Lake Storage Gen2 스토리지 계정을 사용합니다. 이전에 프로비전된 작업 영역은 Blob Storage를 사용합니다.

DBFS 루트에 데이터를 저장하지 않도록 사용자 교육

DBFS 루트는 작업 영역의 모든 사용자가 액세스할 수 있으므로 모든 사용자는 여기에 저장된 모든 데이터에 액세스할 수 있습니다. 중요한 데이터를 저장하기 위해 이 위치를 사용하지 않도록 사용자에게 지시하는 것이 중요합니다. Azure Databricks의 Hive 메타스토어에서 관리되는 테이블의 기본 위치는 DBFS 루트입니다. 관리 테이블을 만드는 최종 사용자가 DBFS 루트에 쓰지 못하도록 하려면 Hive 메타스토어에서 데이터베이스를 만들 때 외부 스토리지의 위치를 선언합니다.

Unity 카탈로그 관리 테이블은 기본적으로 보안 스토리지 위치를 사용합니다. Databricks는 관리되는 테이블에 Unity 카탈로그를 사용하는 것이 좋습니다.

감사 로깅을 사용하여 활동 모니터링

참고

DBFS 감사 이벤트에 대한 자세한 내용은 DBFS 이벤트를 참조하세요.

고객 관리형 키를 사용하여 DBFS 루트 데이터 암호화

고객 관리형 키를 사용하여 DBFS 루트 데이터를 암호화할 수 있습니다. DBFS 루트에 대한 고객 관리형 키를 참조하세요.