CREATE MINING MODEL(DMX)CREATE MINING MODEL (DMX)

이 항목은 다음에 적용됩니다.예SQL Server(2008부터)아니요Azure SQL Database아니요Azure SQL Data Warehouse 아니요병렬 데이터 웨어하우스 THIS TOPIC APPLIES TO:yesSQL Server (starting with 2008)noAzure SQL DatabasenoAzure SQL Data Warehouse noParallel Data Warehouse

데이터베이스에 새 마이닝 모델과 마이닝 구조를 만듭니다.Creates both a new mining model and a mining structure in the database. 이 문에서 새 모델을 정의하거나 PMML(Predictive Model Markup Language)을 사용하여 모델을 만들 수 있습니다.You can create a model either by defining the new model in the statement, or by using the Predictive Model Markup Language (PMML). 두 번째 옵션은 고급 사용자만 사용해야 합니다.This second option is for advanced users only.

모델 이름에 "_structure"가 추가되어 마이닝 구조의 이름이 정해지므로 구조 이름이 모델 이름과 달리 고유합니다.The mining structure is named by appending "_structure" to the model name, which ensures that the structure name is unique from the model name.

기존 마이닝 구조에 대 한 마이닝 모델을 만들려면 사용는 ALTER MINING STRUCTURE ( DMX ) 문.To create a mining model for an existing mining structure, use the ALTER MINING STRUCTURE (DMX) statement.

구문Syntax


CREATE [SESSION] MINING MODEL <model>  
(  
    [(<column definition list>)]  
)  
USING <algorithm> [(<parameter list>)] [WITH DRILLTHROUGH]  
CREATE MINING MODEL <model> FROM PMML <xml string>  

인수Arguments

모델model
모델의 고유 이름입니다.A unique name for the model.

열 정의 목록column definition list
쉼표로 구분된 열 정의 목록입니다.A comma-separated list of column definitions.

알고리즘algorithm
현재 공급자가 정의한 데이터 마이닝 알고리즘 이름입니다.The name of a data mining algorithm, as defined by the current provider.

참고

사용 하 여 검색할 수는 현재 공급자에서 지 원하는 알고리즘 목록은 DMSCHEMA_MINING_SERVICES 행 집합합니다.A list of the algorithms supported by the current provider can be retrieved by using DMSCHEMA_MINING_SERVICES Rowset. 현재 인스턴스에 지원 되는 알고리즘을 보려면 Analysis ServicesAnalysis Services, 참조 Data Mining Properties합니다.To view the algorithms supported in the current instance of Analysis ServicesAnalysis Services, see Data Mining Properties.

매개 변수 목록parameter list
(선택 사항)Optional. 알고리즘에 대해 공급자가 정의한 매개 변수의 쉼표로 구분된 목록입니다.A comma-separated list of provider-defined parameters for the algorithm.

XML 문자열XML string
고급 사용자만 사용해야 합니다. XML 인코딩 모델(PMML)이며(For advanced use only.) An XML-encoded model (PMML). 문자열을 작은따옴표(')로 묶어야 합니다.The string must be enclosed in single quotation marks (').

세션 절을 사용 하면 연결이 종료 되거나 세션 제한 시간이 초과 하는 경우 서버에서 자동으로 제거 하는 마이닝 모델을 만들 수 있습니다.The SESSION clause lets you create a mining model that is automatically removed from the server when the connection closes or the session times out. 세션 마이닝 모델은 데이터베이스 관리자가 되려면 사용자 필요가 없으므로 연결이 열려 있는 상태로 디스크 공간을 사용 하므로 유용 합니다.SESSION mining models are useful because they do not require the user to be a database administrator, and they only use disk space for as long as the connection is open.

WITH DRILLTHROUGH 절을 사용 하면 새 마이닝 모델에서 드릴스루 합니다.The WITH DRILLTHROUGH clause enables drill through on the new mining model. 드릴스루는 모델을 만들 때만 사용할 수 있습니다.Drillthrough can only be enabled when you create the model. 일부 모델 유형의 경우 사용자 지정 뷰어에서 모델을 찾아보는 데 드릴스루가 필요합니다.For some model types, drillthrough is required in order to browse the model in the custom viewer. 드릴스루는 예측 또는 Microsoft 일반 콘텐츠 트리 뷰어를 사용하여 모델을 찾는 데 필요하지 않습니다.Drillthrough is not required for prediction or for browsing the model by using the Microsoft Generic Content Tree Viewer.

CREATE MINING MODEL 문은 열 정의 목록, 알고리즘 및 알고리즘 매개 변수 목록을 기반으로 하는 새 마이닝 모델을 만듭니다.The CREATE MINING MODEL statement creates a new mining model that is based on the column definition list, the algorithm, and the algorithm parameter list.

열 정의 목록Column Definition List

각 열에 대해 다음 정보를 포함하여 열 정의 목록을 사용하는 모델 구조를 정의합니다.You define the structure of a model that uses the column definition list by including the following information for each column:

  • 이름(필수)Name (mandatory)

  • 데이터 형식(필수)Data type (mandatory)

  • 배포Distribution

  • 모델링 플래그 목록List of modeling flags

  • 내용 유형(필수)Content type (mandatory)

  • 이 열을 예측 하는 알고리즘을 나타내는 예측 요청으로 표시 된 PREDICT 또는 PREDICT_ONLYPrediction request, which indicates to the algorithm to predict this column, indicated by the PREDICT or PREDICT_ONLY clause

  • 으로 표시 되는 특성 열 (필수 적용 되는 경우에)의 관계는 RELATED TORelationship to an attribute column (mandatory only if it applies), indicated by the RELATED TO clause

    열 정의 목록에 대해 다음 구문을 사용하여 단일 열을 정의합니다.Use the following syntax for the column definition list, to define a single column:

<column name>    <data type>    [<Distribution>]    [<Modeling Flags>]    <Content Type>    [<prediction>]    [<column relationship>]   

열 정의 목록에 대해 다음 구문을 사용하여 중첩 테이블 열을 정의합니다.Use the following syntax for the column definition list, to define a nested table column:

<column name>    TABLE    [<prediction>] ( <non-table column definition list> )  

모델링 플래그를 제외하고 특정 그룹에서 하나의 절만 사용하여 열을 정의할 수 있습니다.Except for modeling flags, you can use no more than one clause from a particular group to define a column. 열 하나에 대해 여러 개의 모델링 플래그를 정의할 수 있습니다.You can define multiple modeling flags for a column.

열을 정의하는 데 사용할 수 있는 데이터 형식, 내용 유형, 열 배포 및 모델링 플래그 목록은 다음 항목을 참조하십시오.For a list of the data types, content types, column distributions, and modeling flags that you can use to define a column, see the following topics:

<예측 > 절<prediction> clause DescriptionDescription
예측PREDICT 이 열은 모델에 의해 예측될 수 있으며 다른 예측 가능 열 값을 예측하기 위해 입력 사례에 제공될 수 있습니다.This column can be predicted by the model, and it can be supplied in input cases to predict the value of other predictable columns.
PREDICT_ONLYPREDICT_ONLY 이 열은 모델에 의해 예측될 수 있지만 이 열의 값을 입력 사례에 사용하여 다른 예측 가능 열 값을 예측할 수는 없습니다.This column can be predicted by the model, but its values cannot be used in input cases to predict the value of other predictable columns.

매개 변수 정의 목록Parameter Definition List

매개 변수 목록을 사용하여 마이닝 모델의 성능과 기능을 조정할 수 있습니다.You can use the parameter list to adjust the performance and functionality of a mining model. 매개 변수 목록의 구문은 다음과 같습니다.The syntax of the parameter list is as follows:

[<parameter> = <value>, <parameter> = <value>,…]  

각 알고리즘에 연관 된 매개 변수 목록에 대 한 참조 Data Mining Algorithms ( Analysis Services-데이터 마이닝 ) .For a list of the parameters that are associated with each algorithm, see Data Mining Algorithms (Analysis Services - Data Mining).

주의Remarks

기본 제공 테스트 데이터 집합이 있는 모델을 만들려는 경우 CREATE MINING STRUCTURE 문과 ALTER MINING STRUCTURE 문을 차례로 사용해야 합니다.If you want to create a model that has a built-in testing data set, you should use the statement CREATE MINING STRUCTURE followed by ALTER MINING STRUCTURE. 그러나 모든 모델 유형이 홀드아웃 데이터 집합을 지원하는 것은 아닙니다.However, not all model types support a holdout data set. 자세한 내용은 CREATE MINING STRUCTURE(DMX)를 참조하세요.For more information, see CREATE MINING STRUCTURE (DMX).

CREATEMODEL 문을 사용 하 여 마이닝 모델을 만드는 방법의 연습을 참조 하십시오. 시계열 예측 DMX 자습서합니다.For a walkthrough of how to create a mining model by using the CREATEMODEL statement, see Time Series Prediction DMX Tutorial.

Naive Bayes 예Naive Bayes Example

다음 예에서는 MicrosoftMicrosoft Naive Bayes 알고리즘을 사용하여 새 마이닝 모델을 만듭니다.The following example uses the MicrosoftMicrosoft Naive Bayes algorithm to create a new mining model. Bike Buyer 열은 예측 가능한 특성으로 정의됩니다.The Bike Buyer column is defined as the predictable attribute.

CREATE MINING MODEL [NBSample]  
(  
    CustomerKey LONG KEY,   
    Gender TEXT DISCRETE,  
    [Number Cars Owned] LONG DISCRETE,  
    [Bike Buyer] LONG DISCRETE PREDICT  
)  
USING Microsoft_Naive_Bayes  

연결 모델의 예Association Model Example

다음 예에서는 MicrosoftMicrosoft 연결 알고리즘을 사용하여 새 마이닝 모델을 만듭니다.The following example uses the MicrosoftMicrosoft Association algorithm to create a new mining model. 이 문은 테이블 열을 사용하여 모델 정의 안에 테이블을 중첩하는 기능을 사용합니다.The statement takes advantage of the ability to nest a table inside the model definition by using a table column. 모델을 사용 하 여 수정 된 MINIMUM_PROBABILITYMINIMUM_SUPPORT 매개 변수입니다.The model is modified by using the MINIMUM_PROBABILITY and MINIMUM_SUPPORT parameters.

CREATE MINING MODEL MyAssociationModel (  
    OrderNumber TEXT KEY,  
    [Products] TABLE PREDICT (  
        [Model] TEXT KEY  
    )  
)  
USING Microsoft_Association_Rules (Minimum_Probability = 0.1, MINIMUM_SUPPORT = 0.01)  

시퀀스 클러스터링의 예Sequence Clustering Example

다음 예에서는 MicrosoftMicrosoft 시퀀스 클러스터링 알고리즘을 사용하여 새 마이닝 모델을 만듭니다.The following example uses the MicrosoftMicrosoft Sequence Clustering algorithm to create a new mining model. 두 개의 키를 사용하여 모델을 정의합니다.Two keys are used to define the model. OrderNumber 열은 사례 키로 사용되며 주문 순서를 지정합니다.The OrderNumber column is used as the case key, and specifies individual orders. LineNumber 열은 중첩된 테이블 키로 사용되며 항목이 주문에 추가된 시퀀스를 지정합니다.The LineNumber column is used as the nested table key, and specifies the sequence in which items were added to an order.

CREATE MINING MODEL BuyingSequence (  
    [Order Number] TEXT KEY,  
    [Products] TABLE   
     (  
        [Line Number] LONG KEY SEQUENCE,  
        [Model] TEXT DISCRETE PREDICT  
    )  
)  
USING Microsoft_Sequence_Clustering  

시계열 예Time Series Example

다음 예에서는 MicrosoftMicrosoft 시계열 알고리즘을 사용하여 ARTxp 알고리즘을 사용함으로써 새 마이닝 모델을 만듭니다.The following example uses the MicrosoftMicrosoft Times Series algorithm to create a new mining model by using the ARTxp algorithm. ReportingDate는 시계열의 키 열이고 ModelRegion은 데이터 계열의 키 열입니다.ReportingDate is the key column for the time series and ModelRegion is the key column for the data series. 이 예에서는 데이터 주기를 매 12개월로 가정하므로In this example, it is assumed that the periodicity of the data is every 12 months. 따라서는 PERIODICITY_HINT 매개 변수는 12로 설정 됩니다.Therefore, the PERIODICITY_HINT parameter is set to 12.

참고

지정 해야 합니다는 PERIODICITY_HINT 중괄호를 사용 하 여 매개 변수입니다.You must specify the PERIODICITY_HINT parameter by using brace characters. 또한 값은 문자열, 묶어야 작은따옴표로: "{<숫자 값 >}"입니다.Moreover, because the value is a string, it must be enclosed in single quotation marks: "{<numeric value>}".

CREATE MINING MODEL SalesForecast (  
        ReportingDate DATE KEY TIME,  
        ModelRegion TEXT KEY,  
        Amount LONG CONTINUOUS PREDICT,  
        Quantity LONG CONTINUOUS PREDICT  
)  
USING Microsoft_Time_Series (PERIODICITY_HINT = '{12}', FORECAST_METHOD = 'ARTXP')  

관련 항목:See Also

Data Mining Extensions ( DMX ) 데이터 정의 문 Data Mining Extensions (DMX) Data Definition Statements
Data Mining Extensions ( DMX ) 데이터 조작 문 Data Mining Extensions (DMX) Data Manipulation Statements
Data Mining Extensions ( DMX ) 문 참조Data Mining Extensions (DMX) Statement Reference