클러스터링 모델 학습

클러스터링 모델을 학습하고 학습 집합에서 클러스터로 데이터 할당

범주: Machine Learning/학습

참고

적용 대상: Machine Learning Studio (클래식)

이 콘텐츠는 Studio (클래식)에만 해당 됩니다. Azure Machine Learning 디자이너에는 비슷한 끌어서 놓기 모듈이 추가 되었습니다. 이 문서에서는 두 가지 버전을 비교 하는방법에 대해 자세히 알아보세요.

모듈 개요

이 문서에서는 Azure Machine Learning Studio (클래식)에서 클러스터링 모델 학습 모듈을 사용 하 여 클러스터링 모델을 학습 하는 방법을 설명 합니다.

이 모듈은 이미 K- 를 사용 하 여 클러스터링 모듈을 사용 하 여 구성한 학습 되지 않은 클러스터링 모델을 사용 하 고 레이블이 지정 되거나 레이블이 지정 되지 않은 데이터 집합을 사용 하 여 모델을 학습 합니다. 이 모듈은 예측에 사용할 수 있는 학습 된 모델 및 학습 데이터의 각 사례에 대 한 클러스터 할당 집합을 만듭니다.

참고

클러스터링 모델은 기계 학습 모델을 만들기 위한 일반 모듈인 모델 학습 모듈을 사용 하 여 학습 없습니다. 모델 학습 은 감독 된 학습 알고리즘 에서만 작동 하기 때문입니다. K-를 사용 하는 경우 및 다른 클러스터링 알고리즘은 자율 learning을 허용 합니다. 즉, 알고리즘은 레이블이 없는 데이터에서 학습할 수 있습니다.

클러스터링 학습 모델을 사용 하는 방법

  1. Studio (클래식)의 실험에 클러스터링 모델 학습 모듈을 추가 합니다. 학습 범주에서 모듈 Machine Learning모듈 아래에 있는 모듈을 찾을 수 있습니다.

  2. K 의미 클러스터링 모듈 또는 호환 클러스터링 모델을 만들고 클러스터링 모델의 매개 변수를 설정 하는 다른 사용자 지정 모듈을 추가 합니다.

  3. 학습 클러스터링 모델 의 오른쪽 입력에 학습 데이터 집합을 연결 합니다.

  4. 열 집합 에서 클러스터를 작성 하는 데 사용할 데이터 집합의 열을 선택 합니다. 올바른 기능을 제공 하는 열을 선택 해야 합니다. 예를 들어 Id 또는 고유한 값이 있는 다른 열을 사용 하거나 모든 값이 같은 열을 사용 하지 마십시오.

    레이블을 사용할 수 있는 경우 해당 레이블을 기능으로 사용 하거나 그대로 둘 수 있습니다.

  5. 새 클러스터 레이블과 함께 학습 데이터를 출력 하려면 옵션을 선택 하 고, 추가를 확인 하거나 결과에 대해서만 선택 취소 합니다.

    이 옵션의 선택을 취소 하면 클러스터 할당만 출력 됩니다.

  6. 실험을 실행 하거나 클러스터링 모델 학습 모듈을 클릭 하 고 선택 된 실행 을 선택 합니다.

결과

학습을 완료 한 후:

  • 그래프에서 클러스터와 해당 분리를 보려면 결과 데이터 집합 출력을 마우스 오른쪽 단추로 클릭 하 고 시각화 를 선택 합니다.

    그래프는 실제 값이 아닌 클러스터의 주요 구성 요소를 나타냅니다. 자세한 내용은 주 구성 요소 분석 을 참조 하세요.

  • 데이터 집합의 값을 보려면 데이터 집합으로 변환 모듈의 인스턴스를 추가 하 고 결과 데이터 집합 출력에 연결 합니다. 데이터 집합으로 변환 모듈을 실행 하 여 보거나 다운로드할 수 있는 데이터의 복사본을 가져옵니다.

  • 나중에 다시 사용 하기 위해 학습 된 모델을 저장 하려면 모듈을 마우스 오른쪽 단추로 클릭 하 고 학습 된 모델 을 선택한 다음 학습 된 모델로 저장 을 클릭 합니다.

  • 모델에서 점수를 생성 하려면 클러스터에 데이터 할당을 사용 합니다.

예제

기계 학습에서 클러스터링을 사용 하는 방법에 대 한 예제는 Azure AI Gallery를 참조 하세요.

예상 입력

Name Type 설명
학습되지 않은 모델 ICluster 인터페이스 학습되지 않은 클러스터링 모델입니다.
데이터 세트 데이터 테이블 입력 데이터 원본입니다.

모듈 매개 변수

Name 범위 Type 기본값 설명
열 집합 any ColumnSelection 열 선택 패턴입니다.
추가하려면 선택/결과만 출력하려면 선택 취소 any 부울 true 출력 데이터 집합에 할당 열이 추가된 입력 데이터 집합이 포함되어야 하는지(선택) 아니면 할당 열만 포함되어야 하는지(선택 취소)를 지정합니다.

출력

Name Type 설명
학습된 모델 ICluster 인터페이스 학습된 클러스터링 모델입니다.
결과 데이터 집합 데이터 테이블 할당의 데이터 열이 추가되거나 할당 열만 포함된 입력 데이터 집합입니다.

예외

예외 설명
오류 0003 하나 이상의 입력이 null이거나 비어 있으면 예외가 발생합니다.

스튜디오 (클래식) 모듈과 관련 된 오류 목록은 Machine Learning 오류 코드를 참조 하세요.

API 예외 목록은 Machine Learning REST API 오류 코드를 참조 하세요.

참고 항목

A-z 모듈 목록
타는
클러스터에 데이터 할당
K-Means 클러스터링