MLlib를 사용한 기계 학습 자습서

참고

Databricks Runtime ML은 Azure Databricks 사용하여 기계 학습 모델을 개발하고 배포하기 위한 포괄적인 도구입니다. 여기에는 가장 인기 있는 기계 학습 및 딥 러닝 라이브러리와 엔드투엔드 기계 학습 수명 주기를 추적하고 관리하기 위한 기계 학습 플랫폼 API인 MLflow가 포함됩니다. 자세한 내용은 Databricks Machine Learning 가이드를 참조하세요.

Apache Spark MLlib(기계 학습 라이브러리)를 사용하면 데이터 과학자가 분산 데이터(예: 인프라, 구성 등)와 관련된 복잡성을 해결하는 대신 데이터 문제와 모델에 집중할 수 있습니다. 자습서 Notebook에서는 데이터를 로드 및 전처리하고, MLlib 알고리즘을 사용하여 모델을 학습하고, 모델 성능을 평가하고, 모델을 조정하고, 예측하는 단계를 안내합니다. 또한 MLlib 파이프라인 및 MLflow 기계 학습 플랫폼의 사용도 보여줍니다.

Notebook

클러스터의 Databricks Runtime 버전에 해당하는 Notebook을 사용합니다. 더 많은 기계 학습 예제는 Databricks Machine Learning 가이드를 참조하세요.

MLlib Notebook 시작(Databricks Runtime 7.0 이상)

Notebook 가져오기

MLlib Notebook 시작(Databricks Runtime 5.5 LTS 또는 6.x)

Notebook 가져오기