기계 학습 및 딥 러닝을 위한 데이터 전처리

Databricks 기능 저장소를 사용하여 새 기능을 만들고, 기존 기능을 탐색 및 재사용하고, 기계 학습 모델을 학습 및 채점하기 위한 기능을 선택하고, 실시간 유추를 위해 대기 시간이 짧은 온라인 저장소에 기능을 게시할 수 있습니다.

대규모 데이터 세트의 경우 기능 엔지니어링에 Spark SQL 및 MLlib를 사용할 수 있습니다. scikit-learn과 같은 Databricks Runtime ML에 포함된 타사 라이브러리도 유용한 도우미 메서드를 제공합니다. 예를 들어 scikit-learn 및 MLlib에 대한 다음 기계 학습 Notebook을 참조하세요.

보다 복잡한 딥 러닝 기능 처리를 위해 이 예제 Notebook에서는 기능화에 전이 학습을 사용하는 방법을 보여 줍니다.