클러스터링 모듈

이 문서에서는 클러스터링 모델 생성을 지 원하는 Azure Machine Learning Studio (클래식)의 모듈을 설명 합니다.

참고

적용 대상: Machine Learning Studio (클래식)

이 콘텐츠는 Studio (클래식)에만 해당 됩니다. Azure Machine Learning 디자이너에는 비슷한 끌어서 놓기 모듈이 추가 되었습니다. 이 문서에서는 두 가지 버전을 비교 하는방법에 대해 자세히 알아보세요.

클러스터링의 정의

기계 학습에서 클러스터링은 데이터 요소를 유사한 클러스터로 그룹화 하는 방법입니다. 이를 조각화 라고도 합니다.

몇 년 동안 많은 클러스터링 알고리즘이 개발 되었습니다. 거의 모든 클러스터링 알고리즘은 개별 항목의 기능을 사용 하 여 유사한 항목을 찾습니다. 예를 들어 클러스터링을 적용 하 여 유사한 사람을 인구 통계로 찾을 수 있습니다. 텍스트 분석과 클러스터링을 사용 하 여 비슷한 토픽 또는 감정의 문장을 그룹화 할 수 있습니다.

레이블이 없는 데이터에서 사용할 수 있기 때문에 클러스터링은 감독 되지 않는 학습 기법 이라고 부릅니다. 실제로 클러스터링은 새 패턴을 검색 하기 위한 첫 번째 단계 이며, 데이터가 구조화 된 방법 또는 항목의 관계에 대 한 사전 지식이 거의 필요 하지 않습니다. 클러스터링은 다른 예측 알고리즘을 사용 하 여 분석 하기 전에 데이터를 탐색 하는 데 주로 사용 됩니다.

클러스터링 모델을 만드는 방법

Machine Learning Studio (클래식)에서는 레이블이 지정 되거나 레이블이 지정 되지 않은 데이터와 함께 클러스터링을 사용할 수 있습니다.

  • 레이블이 지정 되지 않은 데이터에서 클러스터링 알고리즘은 가장 가까이 있는 데이터 요소를 결정 하 고 중앙 지점을 중심으로 또는 중심 클러스터를 만듭니다. 그런 다음 클러스터 ID를 데이터 그룹의 임시 레이블로 사용할 수 있습니다.

  • 데이터에 레이블이 있으면 레이블을 사용 하 여 클러스터 수를 구동 하거나 레이블을 다른 기능으로 사용할 수 있습니다.

클러스터링 알고리즘을 구성한 후에는 클러스터링 모델 학습 또는 스윕 클러스터링 모듈을 사용 하 여 데이터에 대해 학습 합니다.

모델을 학습 하는 경우이 모델을 사용 하 여 새 데이터 요소에 대 한 클러스터 멤버 자격을 예측 합니다. 예를 들어 클러스터링을 사용 하 여 구매 행동으로 고객을 그룹화 하는 경우이 모델을 사용 하 여 새 고객의 구매 동작을 예측할 수 있습니다.

모듈 목록

클러스터링 범주에는 다음 모듈이 포함 됩니다.

  • K-클러스터링: k를 구성 하 고 초기화 합니다. 클러스터링 모델을 의미 합니다.

다른 클러스터링 알고리즘을 사용 하거나 R을 사용 하 여 사용자 지정 클러스터링 모델을 만들려면 다음 항목을 참조 하십시오.

예제

작동 중인 클러스터링의 예는 Azure AI Gallery를 참조 하세요.

알고리즘 선택에 대 한 도움말은 다음 문서를 참조 하세요.

참고 항목