2클래스 Bayes 지점 컴퓨터

Bayes 지점 컴퓨터 이진 분류 모델 만들기

범주: 모델/분류 Machine Learning/초기화

참고

적용 대상: Machine Learning Studio (클래식)

이 콘텐츠는 Studio (클래식)에만 해당 됩니다. Azure Machine Learning 디자이너에는 비슷한 끌어서 놓기 모듈이 추가 되었습니다. 이 문서에서는 두 가지 버전을 비교 하는방법에 대해 자세히 알아보세요.

모듈 개요

이 문서에서는 Azure Machine Learning Studio (클래식)에서 2 클래스 Bayes Point 컴퓨터 모듈을 사용 하 여 학습 되지 않은 이진 분류 모델을 만드는 방법을 설명 합니다.

이 모듈의 알고리즘에서는 "Bayes Point Machine" 이라는 선형 분류에 Bayesian 접근 방식을 사용 합니다. 이 알고리즘은 단일 "평균" 분류자 인 Bayes Point를 선택 하 여 일반화 성능 측면에서 선형 분류자의 이론적으로 최적 Bayesian 평균을 효율적으로 대략적으로 계산 합니다. Bayes 지점 컴퓨터는 Bayes 분류 모델이므로 학습 데이터에 과잉 맞춤이 되지는 않습니다.

자세한 내용은 Microsoft Machine Learning 블로그에서 확률 유추를 수용하는 Chris Bishop의 게시물을 참조 하세요.

Two-Class Bayes Point 컴퓨터를 구성 하는 방법

  1. Azure Machine Learning Studio (클래식)에서 실험에 2 클래스 Bayes Point 컴퓨터 모듈을 추가 합니다. Machine Learning, 모델 초기화, 분류 에서 모듈을 찾을 수 있습니다.

  2. 학습 반복 횟수 에 대 한 숫자를 입력 하 여 메시지 전달 알고리즘이 학습 데이터에 대해 반복 되는 빈도를 지정 합니다. 일반적으로는 반복 횟수를 5-100 사이의 값으로 설정해야 합니다.

    학습 반복 횟수가 많을수록 예측 정확도는 높아지지만 학습 속도는 느려집니다.

    대부분의 데이터 집합에서는 기본 설정인 학습 반복 30회를 사용하면 알고리즘이 충분히 정확한 예측을 할 수 있습니다. 그러나 더 적은 반복으로 정확한 예측이 가능한 경우도 있습니다. 서로 밀접하게 관련된 기능을 포함하는 데이터 집합의 경우 학습 반복 횟수를 늘리면 도움이 될 수 있습니다.

  3. 학습 및 예측의 각 인스턴스에 상수 기능 또는 바이어스를 추가 하려면 편향 포함 옵션을 선택 합니다.

    데이터에 상수 기능이 이미 포함되어 있지 않으면 바이어스를 포함해야 합니다.

  4. 범주 기능에서 알 수 없는 값 허용 옵션을 선택 하 여 알 수 없는 값에 대 한 그룹을 만듭니다.

    이 옵션의 선택을 취소 하면 모델에서 학습 데이터에 포함 된 값만 수락할 수 있습니다.

    이 옵션을 선택 하 고 알 수 없는 값을 허용 하는 경우 알려진 값에 대 한 모델의 정확도가 떨어질 수 있지만 새 (알 수 없는) 값에 대해 더 나은 예측을 제공할 수 있습니다.

  5. 모델 학습 모듈 및 학습 데이터의 인스턴스를 추가 합니다.

  6. 학습 데이터와 2 클래스 Bayes Point 컴퓨터 모듈의 출력을 모델 학습 모듈에 연결 하 고 레이블 열을 선택 합니다.

  7. 실험을 실행합니다.

결과

교육이 완료 된 후 모델 학습 모듈의 출력을 마우스 오른쪽 단추로 클릭 하 여 결과를 확인 합니다.

  • 모델 매개 변수의 요약을 보고 학습에서 배운 기능 가중치와 함께 시각화 를 선택 합니다.

  • 나중에 사용할 수 있도록 모델을 저장 하려면 모델 학습 의 출력을 마우스 오른쪽 단추로 클릭 하 고 학습 된 모델로 저장 을 선택 합니다.

  • 예측을 만들려면 학습 된 모델을 모델 점수 매기기 모듈의 입력으로 사용 합니다.

    학습 되지 않은 모델은 레이블이 지정 된 데이터 집합에 대 한 교차 유효성 검사를 위해 교차 유효성 검사 모델 에 전달 될 수도 있습니다.

예제

기계 학습에서 Two-Class Bayes Point 컴퓨터를 사용 하는 방법에 대 한 자세한 내용은 Azure AI Gallery의 다음 샘플 실험을 참조 하세요.

  • 이진 분류자 비교:이 샘플에서는 여러 개의 2 클래스 분류자를 사용 하는 방법을 보여 줍니다.

기술 정보

이 섹션에는이 알고리즘에 대 한 구현 세부 정보 및 질문과 대답이 포함 되어 있습니다.

원래 연구 및 기본 이론의 세부 정보는이 문서 (PDF): Bayes Point Machines, Herbert, Graepe 및 Campbell 에서 제공 됩니다.

그러나이 구현은 다음과 같은 여러 가지 방법으로 원래 알고리즘을 향상 시킵니다.

이러한 기능 개선으로 인해 Bayes 지점 컴퓨터 분류 모델은 더욱 강력해졌으며 쉽게 사용할 수 있습니다. 또한 시간이 많이 걸리는 매개 변수 조정 단계를 건너뛸 수 있습니다.

모듈 매개 변수

Name 범위 Type 기본값 설명
학습 반복 횟수 >= 1 정수 30 학습 시 사용할 반복 횟수를 지정합니다.
바이어스 포함 모두 부울 True 각 인스턴스에 상수 기능 또는 바이어스를 추가해야 하는지 여부를 나타냅니다.
범주 기능에서 알 수 없는 값 허용 모두 부울 True True로 설정하면 각 범주 열에 대해 추가 수준을 만듭니다. 학습 데이터 집합에서 사용할 수 없는 테스트 데이터 집합의 모든 수준은 이 추가 수준으로 매핑됩니다.

출력

Name Type 설명
학습되지 않은 모델 ILearner 인터페이스 학습되지 않은 이진 분류 모델입니다.

참고 항목

분류 A-Z 모듈 목록