Bike Buyer DMX 자습서

이 자습서에서는 DMX(Data Mining Extensions) 쿼리 언어를 사용하여 마이닝 모델을 만들고 학습하며 탐색하는 방법을 설명합니다. 이러한 마이닝 모델을 사용하여 고객이 자전거를 구입할 것인지 여부를 결정하는 예측을 만들 수 있습니다.

마이닝 모델은 가상 회사인 Adventure Works Cycles에 대한 데이터를 저장하는 AdventureWorksDW2012 예제 데이터베이스에 포함된 데이터에서 만들어집니다. Adventure Works Cycles는 규모가 큰 다국적 제조 회사입니다. 이 회사는 금속 및 합성 소재 자전거를 제조하여 북미, 유럽 및 아시아 시장에 판매합니다. 워싱턴 주 보셀에 위치한 본사에는 290명의 직원이 근무하고 있으며 각 지역 시장별로 영업 팀이 배치되어 있습니다. AdventureWorksDW2012 예제 데이터베이스에 대한 자세한 내용은 AdventureWorks 예제 데이터 웨어하우스을 참조하십시오.

자습서 시나리오

Adventure Works Cycles에서는 데이터 마이닝 기능을 사용하는 사용자 지정 응용 프로그램을 만들어 데이터 분석의 범위를 확장하기로 결정했습니다. 이 사용자 정의 응용 프로그램을 만드는 목적은 다음과 같습니다.

  • 잠재 고객의 특정 특징을 입력으로 사용하여 해당 고객이 자전거를 구입할 것인지 여부 예측

  • 잠재 고객 목록뿐만 아니라 고객의 특징을 입력으로 사용하여 자전거를 구입할 고객 예측

첫 번째 경우 고객 등록 페이지에서 고객 데이터를 얻을 수 있으며 두 번째 경우 Adventure Works Cycles 마케팅 부서에서 잠재 고객 목록을 얻을 수 있습니다.

또한 마케팅 부서에서는 거주지, 자녀 수 및 통근 거리와 같은 특징을 기반으로 기존 고객을 여러 범주로 그룹화하는 기능을 요청했습니다. 이 부서에서는 이러한 클러스터를 사용하여 마케팅 대상으로 삼을 특정 유형의 고객을 선택하는 데 도움이 되는지 알아보려고 합니다. 여기에는 추가 마이닝 모델이 필요합니다.

Microsoft SQL Server Analysis Services에서는 이러한 태스크를 완료하는 데 사용할 수 있는 여러 가지 도구를 제공합니다.

DMX(Data Mining Extensions)는 마이닝 모델을 만들고 작업할 때 사용할 수 있는 Analysis Services에서 제공하는 쿼리 언어입니다. Microsoft 의사 결정 트리 알고리즘에서는 특정 고객이 자전거를 구입할 것인지 여부를 예측하는 데 사용할 수 있는 모델을 만듭니다. 결과 모델에서는 개인 고객이나 고객 테이블을 입력으로 사용할 수 있습니다. Microsoft 클러스터링 알고리즘에서는 공유 특징을 기반으로 고객을 그룹화할 수 있습니다. 이 자습서의 목표는 사용자 지정 응용 프로그램에서 사용할 DMX 스크립트를 제공하는 것입니다.

참조 항목: 데이터 마이닝 솔루션

마이닝 구조 및 마이닝 모델

DMX 문을 만들려면 먼저 Analysis Services에서 마이닝 모델 생성 시 사용하는 주요 개체를 이해하는 것이 중요합니다. 마이닝 구조는 마이닝 모델이 생성된 데이터 도메인을 정의하는 데이터 구조입니다. 단일 마이닝 구조에 같은 도메인을 공유하는 여러 개의 마이닝 모델이 포함될 수 있습니다. 마이닝 모델은 마이닝 구조로 나타나는 데이터에 마이닝 모델 알고리즘을 적용합니다.

마이닝 구조의 빌드 블록은 데이터 원본에 포함된 데이터를 설명하는 마이닝 구조 열입니다. 이러한 열에는 데이터 형식, 내용 유형, 데이터 배포 방법 등의 정보가 포함됩니다.

마이닝 모델에는 마이닝 구조에 설명된 키 열뿐만 아니라 나머지 열의 하위 집합도 포함되어야 합니다. 마이닝 모델은 각 열의 사용법을 정의하고 마이닝 모델을 만드는 데 사용되는 알고리즘을 정의합니다. 예를 들어 DMX에서 열을 Key 열이나 Predict 열로 지정할 수 있습니다. 열을 지정하지 않으면 Input 열로 간주됩니다.

DMX에서는 두 가지 방법으로 마이닝 모델을 만들 수 있습니다. CREATE MINING MODEL 문을 사용하여 마이닝 구조 및 연결 마이닝 모델을 함께 만들거나 CREATE MINING STRUCTURE 문을 사용하여 먼저 마이닝 구조를 만든 다음 ALTER STRUCTURE 문을 사용하여 구조에 마이닝 모델을 추가할 수 있습니다. 다음 표에서는 이러한 방법에 대해 설명합니다.

  • CREATE MINING MODEL
    이 문을 사용하여 동일한 이름으로 마이닝 구조 및 연결 마이닝 모델을 함께 만들 수 있습니다. 이때 마이닝 모델 이름에 "Structure"가 추가되므로 마이닝 구조와 구분할 수 있습니다. 이 문은 단일 마이닝 모델을 포함하는 마이닝 구조를 만드는 경우 유용합니다.

    자세한 내용은 CREATE MINING MODEL(DMX)을 참조하십시오.

  • ALTER MINING STRUCTURE
    이 문을 사용하여 이미 서버에 있는 마이닝 구조에 마이닝 모델을 추가할 수 있습니다. 이 문은 여러 마이닝 모델을 포함하는 마이닝 구조를 만드는 경우 유용합니다. 단일 마이닝 구조에 마이닝 모델을 두 개 이상 추가하는 이유에는 여러 가지가 있습니다. 예를 들어 서로 다른 알고리즘을 사용하는 여러 마이닝 모델을 만들어 이 중 가장 적합한 알고리즘이 무엇인지 알아볼 수 있습니다. 또한 사용하는 알고리즘은 동일하지만 매개 변수 설정이 다른 마이닝 모델을 여러 개 만들어 최적의 매개 변수 설정을 찾을 수 있습니다.

    자세한 내용은 ALTER MINING STRUCTURE(DMX)를 참조하십시오.

이 자습서에서는 여러 마이닝 모델을 포함하는 마이닝 구조를 만들 것이므로 두 번째 방법을 사용합니다.

참조 항목

DMX(Data Mining Extensions) 참조, Select 문 이해(DMX), DMX 예측 쿼리의 구조 및 사용법

학습 내용

이 자습서는 다음 단원으로 이루어져 있습니다.

요구 사항

이 자습서를 사용하려면 먼저 다음을 설치해야 합니다.

  • Microsoft SQL Server 

  • Microsoft SQL Server 2005 Analysis Services(SSAS), SSAS(SQL Server 2008 Analysis Services), SSAS(SQL Server 2012 Analysis Services) 또는 SQL Server Analysis Services 

  • AdventureWorksDW2012 데이터베이스. 보안을 위해 예제 데이터베이스는 기본적으로 설치되지 않습니다. Microsoft SQL Server의 공식 예제 데이터베이스를 설치하려면 Microsoft SQL 예제 데이터베이스 페이지를 방문하고 설치할 데이터베이스를 선택합니다. 예제 데이터베이스를 설치하는 방법은 Initial Installation (Analysis Services)를 참조하십시오.

[!참고]

자습서를 검토할 때는 문서 뷰어 도구 모음에 다음 항목 단추 및 이전 항목 단추를 추가하는 것이 좋습니다. 자세한 내용은 도움말에 다음 및 이전 단추 추가를 참조하십시오.

참고 항목

태스크

기본 데이터 마이닝 자습서

개념

Market Basket DMX 자습서