2클래스 Bayes 지점 컴퓨터

중요

Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.

2021년 12월 1일부터 새로운 Machine Learning Studio(클래식) 리소스를 만들 수 없습니다. 2024년 8월 31일까지는 기존 Machine Learning Studio(클래식) 리소스를 계속 사용할 수 있습니다.

ML Studio(클래식) 설명서는 사용 중지되며 나중에 업데이트되지 않을 수 있습니다.

Bayes 지점 컴퓨터 이진 분류 모델 만들기

범주: Machine Learning/모델 초기화/분류

참고

적용 대상: Machine Learning Studio(클래식) 전용

유사한 끌어서 놓기 모듈은 Azure Machine Learning 디자이너에서 사용할 수 있습니다.

모듈 개요

이 문서에서는 Machine Learning Studio(클래식)에서 2클래스 Bayes Point Machine 모듈을 사용하여 학습되지 않은 이진 분류 모델을 만드는 방법을 설명합니다.

이 모듈의 알고리즘은 Bayesian 접근 방식을 사용하여 "Bayes Point Machine"이라는 선형 분류를 사용합니다. 이 알고리즘은 하나의 "평균" 분류자인 Bayes Point를 선택하여 이론적으로 최적인 선형 분류자(일반화 성능 측면에서)의 Bayesian 평균을 효율적으로 근사화합니다. Bayes 지점 컴퓨터는 Bayes 분류 모델이므로 학습 데이터에 과잉 맞춤이 되지는 않습니다.

자세한 내용은 Microsoft Machine Learning 블로그에 있는 Chris Bishop의 게시물: 불확실성 수용 - 확률적 유추를 참조하세요.

Two-Class Bayes Point Machine을 구성하는 방법

  1. Machine Learning Studio(클래식)에서 실험에 2클래스 Bayes Point Machine 모듈을 추가합니다. Machine Learning 모델 초기화, 분류에서 모듈을 찾을 수 있습니다.

  2. 학습 반복 횟수의 경우 숫자를 입력하여 메시지 전달 알고리즘이 학습 데이터를 반복하는 빈도를 지정합니다. 일반적으로는 반복 횟수를 5-100 사이의 값으로 설정해야 합니다.

    학습 반복 횟수가 많을수록 예측 정확도는 높아지지만 학습 속도는 느려집니다.

    대부분의 데이터 집합에서는 기본 설정인 학습 반복 30회를 사용하면 알고리즘이 충분히 정확한 예측을 할 수 있습니다. 그러나 더 적은 반복으로 정확한 예측이 가능한 경우도 있습니다. 서로 밀접하게 관련된 기능을 포함하는 데이터 집합의 경우 학습 반복 횟수를 늘리면 도움이 될 수 있습니다.

  3. 학습 및 예측에서 각 인스턴스에 상수 기능 또는 바이어스 추가를 원하는 경우 선택 옵션인 바이어스 포함을 선택합니다.

    데이터에 상수 기능이 이미 포함되어 있지 않으면 바이어스를 포함해야 합니다.

  4. 범주 기능에서 알 수 없는 값 허용 옵션을 선택하여 알 수 없는 값에 대한 그룹을 만듭니다.

    선택을 취소하면 모델에서 학습 데이터에 포함된 값만 수락할 수 있습니다.

    이 옵션을 선택하고 알 수 없는 값을 허용하는 경우 모델은 알려진 값에 대해 정확도가 낮을 수 있지만 새(알 수 없음) 값에 대해 더 나은 예측을 제공할 수 있습니다.

  5. 모델 학습 모듈의 인스턴스와 학습 데이터를 추가합니다.

  6. 학습 데이터와 2클래스 Bayes Point Machine 모듈의 출력을 모델 학습 모듈에 커넥트 레이블 열을 선택합니다.

  7. 실험을 실행합니다.

결과

학습이 완료되면 모델 학습 모듈의 출력을 마우스 오른쪽 단추로 클릭하여 결과를 봅니다.

  • 모델의 매개 변수 요약을 학습에서 학습한 기능 가중치와 함께 보려면 시각화를 선택합니다.

  • 나중에 사용할 수 있도록 모델을 저장하려면 학습 MOdel의 출력을 마우스 오른쪽 단추 로 클릭하고 학습된 모델로 저장을 선택합니다.

  • 예측을 만들려면 학습된 모델을 모델 점수 매기 기 모듈에 대한 입력으로 사용합니다.

    학습되지 않은 모델은 레이블이 지정된 데이터 집합에 대한 교차 유효성 검사를 위해 교차 유효성 검사 모델에 전달될 수도 있습니다.

기계 학습에서 Two-Class Bayes Point Machine을 사용하는 방법을 보려면 Azure AI 갤러리에서 다음 샘플 실험을 참조하세요.

  • 이진 분류자 비교: 이 샘플에서는 여러 개의 2클래스 분류자를 사용하는 방법을 보여 줍니다.

기술 정보

이 섹션에는 구현 세부 정보 및 이 알고리즘에 대한 질문과 대답이 포함되어 있습니다.

원래 연구 및 기본 이론의 세부 사항은이 논문에서 사용할 수 있습니다 (PDF): 베이즈 포인트 머신, 허버트에 의해, 그라프, 캠벨

그러나 이 구현은 다음과 같은 여러 가지 방법으로 원래 알고리즘을 개선합니다.

이러한 기능 개선으로 인해 Bayes 지점 컴퓨터 분류 모델은 더욱 강력해졌으며 쉽게 사용할 수 있습니다. 또한 시간이 많이 걸리는 매개 변수 조정 단계를 건너뛸 수 있습니다.

모듈 매개 변수

Name 범위 Type 기본값 설명
학습 반복 횟수 >=1 정수 30 학습 시 사용할 반복 횟수를 지정합니다.
바이어스 포함 모두 부울 True 각 인스턴스에 상수 기능 또는 바이어스를 추가해야 하는지 여부를 나타냅니다.
범주 기능에서 알 수 없는 값 허용 모두 부울 True True로 설정하면 각 범주 열에 대해 추가 수준을 만듭니다. 학습 데이터 집합에서 사용할 수 없는 테스트 데이터 집합의 모든 수준은 이 추가 수준으로 매핑됩니다.

출력

Name 유형 설명
학습되지 않은 모델 ILearner 인터페이스 학습되지 않은 이진 분류 모델입니다.

참고 항목

ClassificationA-Z 모듈 목록