마이닝 모델(Analysis Services - 데이터 마이닝)Mining Models (Analysis Services - Data Mining)

마이닝 모델 은 데이터에 알고리즘을 적용하여 만들지만 단순한 알고리즘 또는 메타데이터 컨테이너가 아니며, 새로운 데이터에 적용하여 예측을 생성하고 관계를 추론할 수 있는 데이터, 통계 및 패턴의 집합입니다.A mining model is created by applying an algorithm to data, but it is more than an algorithm or a metadata container: it is a set of data, statistics, and patterns that can be applied to new data to generate predictions and make inferences about relationships.

이 섹션에서는 데이터 마이닝 모델의 정의와 용도에 대해 설명합니다. 즉, 모델 및 구조의 기본 아키텍처, 마이닝 모델의 속성, 마이닝 모델을 만들고 사용하는 방법에 대해 설명합니다.This section explains what a data mining model is and what it can be used for: the basic architecture of models and structures, the properties of mining models, and ways to create and work with mining models.

마이닝 모델 아키텍처Mining Model Architecture

데이터 마이닝 모델 정의Defining Data Mining Models

마이닝 모델 속성Mining Model Properties

마이닝 모델 열Mining Model Columns

마이닝 모델 처리Processing Mining Models

마이닝 모델 보기 및 쿼리Viewing and Querying Mining Models

마이닝 모델 아키텍처 Mining Model Architecture

데이터 마이닝 모델은 마이닝 구조에서 데이터를 가져온 다음 데이터 마이닝 알고리즘을 사용하여 해당 데이터를 분석합니다.A data mining model gets data from a mining structure and then analyzes that data by using a data mining algorithm. 마이닝 구조와 마이닝 모델은 별개의 개체입니다.The mining structure and mining model are separate objects. 마이닝 구조에는 데이터 원본을 정의하는 정보가 저장되고,The mining structure stores information that defines the data source. 마이닝 모델에는 분석 결과로 발견된 패턴과 같이 데이터의 통계적 처리에서 파생된 정보가 저장됩니다.A mining model stores information derived from statistical processing of the data, such as the patterns found as a result of analysis.

마이닝 모델은 마이닝 구조에서 제공한 데이터가 처리 및 분석되기 전까지 비어 있습니다.A mining model is empty until the data provided by the mining structure has been processed and analyzed. 마이닝 모델이 처리된 후에는 메타데이터, 결과 및 마이닝 구조에 대한 바인딩으로 채워집니다.After a mining model has been processed, it contains metadata, results, and bindings back to the mining structure.

모델 메타 데이터, 패턴 및 바인딩이 포함model contains metadata, patterns, and bindings

메타데이터는 모델의 이름과 해당 모델이 저장된 서버뿐 아니라 모델을 만드는 데 사용된 마이닝 구조의 열을 비롯한 모델 정의, 모델을 처리할 때 적용된 필터 정의 및 데이터를 분석하는 데 사용된 알고리즘도 지정합니다.The metadata specifies the name of the model and the server where it is stored, as well as a definition of the model, including the columns from the mining structure that were used in building the model, the definitions of any filters that were applied when processing the model, and the algorithm that was used to analyze the data. 데이터 열, 데이터 유형, 필터, 알고리즘 등 모든 선택 항목은 분석 결과에 상당한 영향을 줍니다.All these choices—the data columns and their data types, filters, and algorithm—have a powerful influence on the results of analysis.

예를 들어 클러스터링 알고리즘, 의사 결정 트리 알고리즘 및 Naïve Bayes 알고리즘을 사용하여 동일한 데이터로 여러 모델을 만들 수 있습니다.For example, you can use the same data to create multiple models, using perhaps a clustering algorithm, decision tree algorithm, and Naïve Bayes algorithm. 각 모델 유형은 예측을 만드는 데 사용할 수 있는 서로 다른 패턴, 항목 집합, 규칙 또는 수식 집합을 만듭니다.Each model type creates different set of patterns, itemsets, rules, or formulas, which you can use for making predictions. 일반적으로 각 알고리즘은 데이터를 다양한 방법으로 분석하므로 결과 모델의 콘텐츠 도 다른 구조로 구성됩니다.Generally each algorithm analyses the data in a different way, so the content of the resulting model is also organized in different structures. 한 모델 유형에서는 데이터와 패턴이 클러스터로 그룹화되고, 다른 모델 유형에서는 데이터가 트리, 분기, 트리와 분기를 분류하고 정의하는 규칙으로 구성될 수 있습니다.In one type of model, the data and patterns might be grouped in clusters; in another type of model, data might be organized into trees, branches, and the rules that divide and define them.

또한 모델은 모델 학습에 사용된 데이터의 영향을 받습니다. 따라서 분석 중에 데이터를 다르게 필터링하거나 다른 초기값을 사용하면 모델이 동일한 마이닝 구조에 대해 학습된 경우에도 다른 결과가 나타날 수 있습니다.The model is also affected by the data that you train it on: even models trained on the same mining structure can yield different results if you filter the data differently or use different seeds during analysis. 하지만 실제 데이터는 모델에 저장되지 않고 마이닝 구조에 그대로 있는 상태로 요약 통계만 저장됩니다.However, the actual data is not stored in the model—only summary statistics are stored, with the actual data residing in the mining structure. 모델을 학습할 때 데이터에 대한 필터를 만든 경우 필터 정의도 모델 개체와 함께 저장됩니다.If you have created filters on the data when you trained the model, the filter definitions are saved with the model object as well.

모델은 마이닝 구조에 캐시된 데이터를 다시 가리키는 바인딩 집합을 포함합니다.The model does contain a set of bindings, which point back to the data cached in the mining structure. 데이터가 구조에 캐시되었고 처리 후 아직 지워지지 않은 경우 이러한 바인딩을 통해 결과에서 해당 결과를 지원하는 사례로 드릴스루할 수 있습니다.If the data has been cached in the structure and has not been cleared after processing, these bindings enable you to drill through from the results to the cases that support the results. 그러나 실제 데이터는 모델이 아니라 구조 캐시에 저장됩니다.However, the actual data is stored in the structure cache, not in the model.

마이닝 모델 아키텍처Mining Model Architecture

데이터 마이닝 모델 정의 Defining Data Mining Models

데이터 마이닝 모델을 만드는 일반적인 단계는 다음과 같습니다.You create a data mining model by following these general steps:

  • 기본 마이닝 구조를 만들고 필요한 데이터 열을 포함시킵니다.Create the underlying mining structure and include the columns of data that might be needed.

  • 분석 태스크에 가장 적합한 알고리즘을 선택합니다.Select the algorithm that is best suited to the analytical task.

  • 구조에서 모델에 사용할 열을 선택하고 열을 사용하는 방법(예측할 결과를 포함하는 열, 입력 전용 열, 등)을 지정합니다.Choose the columns from the structure to use in the model, and specify how they should be used—which column contains the outcome you want to predict, which columns are for input only, and so forth.

  • 필요에 따라 매개 변수를 설정하여 알고리즘에 의한 처리를 세부 조정합니다.Optionally, set parameters to fine-tune the processing by the algorithm.

  • 구조 및 모델을 처리 하여 모델에 데이터를 채웁니다.Populate the model with data by processing the structure and model.

    Analysis ServicesAnalysis Services 에서는 마이닝 모델을 관리하는 데 유용한 다음과 같은 도구를 제공합니다. provides the following tools to help you manage your mining models:

  • 데이터 마이닝 마법사 - 구조와 관련 마이닝 모델을 만들 수 있습니다.The Data Mining Wizard helps you create a structure and related mining model. 이 도구를 사용하는 것이 가장 쉬운 방법입니다.This is the easiest method to use. 이 마법사를 사용하면 필요한 마이닝 구조가 자동으로 만들어지며 중요한 설정을 구성하는 데 도움이 됩니다.The wizard automatically creates the required mining structure and helps you with the configuration of the important settings.

  • DMX CREATE MODEL 문 - 모델을 정의하는 데 사용할 수 있습니다.A DMX CREATE MODEL statement can be used to define a model. 필요한 구조가 처리 과정에서 자동으로 만들어지므로 이 방법을 사용할 경우에는 기존 구조를 다시 사용할 수 없습니다.The required structure is automatically created as part of the process; therefore, you cannot reuse an existing structure with this method. 만들려는 모델을 이미 정확히 알고 있거나 모델을 스크립팅하려는 경우에 이 방법을 사용합니다.Use this method if you already know exactly which model you want to create, or if you want to script models.

  • DMX ALTER STRUCTURE ADD MODEL 문 - 기존 구조에 새 마이닝 모델을 추가하는 데 사용할 수 있습니다.A DMX ALTER STRUCTURE ADD MODEL statement can be used to add a new mining model to an existing structure. 동일한 데이터 집합을 기반으로 하는 다양한 모델을 시험하려면 이 방법을 사용합니다.Use this method if you want to experiment with different models that are based on the same data set.

    AMO 또는 XML/A를 사용하거나 Excel용 데이터 마이닝 클라이언트 등의 다른 클라이언트를 사용하여 프로그래밍 방식으로 마이닝 모델을 만들 수도 있습니다.You can also create mining models programmatically, by using AMO or XML/A, or by using other clients such as the Data Mining Client for Excel. 자세한 내용은 다음 항목을 참조하세요.For more information, see the following topics:

    마이닝 모델 아키텍처Mining Model Architecture

마이닝 모델 속성 Mining Model Properties

각 마이닝 모델에는 모델 및 해당 메타데이터를 정의하는 속성이 있습니다.Each mining model has properties that define the model and its metadata. 이러한 속성으로는 이름, 설명, 모델이 마지막으로 처리된 날짜, 모델에 대한 사용 권한, 학습에 사용되는 데이터에 대한 필터 등이 있습니다.These include the name, description, the date the model was last processed, permissions on the model, and any filters on the data that is used for training.

각 마이닝 모델에는 마이닝 구조에서 파생되었으며 해당 모델에서 사용하는 데이터의 열을 설명하는 속성도 있습니다.Each mining model also has properties that are derived from the mining structure, and that describe the columns of data used by the model. 모델에 사용된 열이 중첩 테이블인 경우 열에도 별도의 필터가 적용될 수 있습니다.If any column used by the model is a nested table, the column can also have a separate filter applied.

또한 각 마이닝 모델에는 AlgorithmUsage라는 두 특수 속성이 있습니다.In addition, each mining model contains two special properties: Algorithm and Usage.

  • Algorithm 속성 모델을 만드는 데 사용되는 알고리즘을 지정합니다.Algorithm property Specifies the algorithm that is used to create the model. 사용 가능한 알고리즘은 사용 중인 공급자에 따라 달라집니다.The algorithms that are available depend on the provider that you are using. 와 함께 제공 되는 알고리즘 목록은 SQL ServerSQL Server Analysis ServicesAnalysis Services, 참조 Data Mining Algorithms ( Analysis Services-데이터 마이닝 ) .For a list of the algorithms that are included with SQL ServerSQL Server Analysis ServicesAnalysis Services, see Data Mining Algorithms (Analysis Services - Data Mining). Algorithm 속성은 마이닝 모델에 적용되며 각 모델에 대해 한 번만 설정할 수 있습니다.The Algorithm property applies to the mining model and can be set only one time for each model. 나중에 알고리즘을 변경할 수 있지만 마이닝 모델의 일부 열은 선택하는 알고리즘에서 지원하지 않는 경우 사용할 수 없게 될 수 있습니다.You can change the algorithm later but some columns in the mining model might become invalid if they are not supported by the algorithm that you choose. 이 속성을 변경한 후 모델을 항상 다시 처리해야 합니다.You must always reprocess the model following a change to this property.

  • Usage 속성 모델에서 각 열이 사용되는 방법을 정의합니다.Usage property Defines how each column is used by the model. 열 사용을 Input, Predict, Predict Only또는 Key로 정의할 수 있습니다.You can define the column usage as Input, Predict, Predict Only, or Key. Usage 속성은 개별 마이닝 모델 열에 적용되고 모델에 포함되어 있는 각 열에 대해 개별적으로 설정되어야 합니다.The Usage property applies to individual mining model columns and must be set individually for every column that is included in a model. 구조에 모델에서 사용하지 않는 열이 포함되어 있는 경우 사용이 Ignore로 설정됩니다.If the structure contains a column that you do not use in the model, the usage is set to Ignore. 마이닝 구조에 포함되지만 분석에 사용되지 않는 데이터의 예로는 고객 이름, 전자 메일 주소 등이 있습니다.Examples of data that you might include in the mining structure but not use in analysis might be customer names or e-mail addresses. 이렇게 하면 분석 단계에서 데이터를 포함시키지 않고 나중에 해당 데이터를 쿼리할 수 있습니다.This way you can query them later without having to include them during the analysis phase.

    마이닝 모델을 만든 후 마이닝 모델 속성의 값을 변경할 수 있습니다.You can change the value of mining model properties after you create a mining model. 그러나 마이닝 모델의 이름을 포함하여 어떤 속성이든 변경할 경우에는 해당 모델을 다시 처리해야 합니다.However, any change, even to the name of the mining model, requires that you reprocess the model. 모델을 다시 처리한 후에는 다른 결과가 표시될 수 있습니다.After you reprocess the model, you might see different results.

    마이닝 모델 아키텍처Mining Model Architecture

마이닝 모델 열 Mining Model Columns

마이닝 모델은 마이닝 구조에 정의된 열에서 가져온 데이터 열을 포함합니다.The mining model contains columns of data that are obtained from the columns defined in the mining structure. 마이닝 구조에서 모델에 사용할 열을 선택할 수 있을 뿐 아니라, 마이닝 구조 열의 복사본을 만든 다음 해당 이름을 바꾸거나 사용법을 변경할 수 있습니다.You can choose which columns from the mining structure to use in the model, and you can create copies of the mining structure columns and then rename them or change their usage. 모델 작성 프로세스 중에 모델별 열 사용법도 정의해야 합니다.As part of the model building process, you must also define the usage of the column by the model. 여기에는 열이 키인지 여부, 열이 예측에 사용되는지 여부, 알고리즘에서 열을 무시할 수 있는지 여부 등과 같은 정보가 포함됩니다.That includes such information as whether the column is a key, whether it is used for prediction, or whether it can be ignored by the algorithm.

모델을 작성하는 동안 사용할 수 있는 모든 데이터 열을 자동으로 추가하는 것보다는 구조 내의 데이터를 신중히 검토하여 분석에 유용한 열만 모델에 포함되도록 하는 것이 좋습니다.While you are building a model, rather than automatically adding every column of data that is available, it is recommended that you review the data in the structure carefully and include in the model only those columns that make sense for analysis. 예를 들어 동일한 데이터를 반복하는 여러 열을 포함하지 말고 대부분 고유한 값을 갖는 열을 사용하지 않도록 합니다.For example, you should avoid including multiple columns that repeat the same data, and you should avoid using columns that have mostly unique values. 특정 열이 사용하기에 적합하지 않다고 생각되는 경우 해당 열을 마이닝 구조나 마이닝 모델에서 삭제할 필요는 없고, 대신 모델을 만들 때 열을 무시하도록 지정하는 플래그를 해당 열에 설정하면 됩니다.If you think a column should not be used, you do not need to delete it from the mining structure or mining model; instead, you can just set a flag on the column that specifies that it should be ignored when building the model. 그러면 열이 마이닝 구조에 유지되지만 마이닝 모델에 사용되지 않습니다.This means that the column will remain in the mining structure, but will not be used in the mining model. 모델에서 마이닝 구조로의 드릴스루를 사용하도록 설정한 경우 나중에 열에서 정보를 검색할 수 있습니다.If you have enabled drillthrough from the model to the mining structure, you can retrieve the information from the column later.

선택한 알고리즘에 따라 마이닝 구조의 일부 열은 특정 모델 유형과 호환되지 않거나 적절하지 않은 결과를 제공할 수 있습니다.Depending on which algorithm you choose, some columns in the mining structure might be incompatible with certain model types, or might give you poor results. 예를 들어 Income 열과 같이 데이터에 연속 숫자 데이터가 포함되고 있고 모델에 개별 값이 필요할 경우 데이터를 개별 범위로 변환하거나 데이터를 모델에서 제거해야 할 수 있습니다.For example, if your data contains continuous numeric data, such as an Income column, and your model requires discrete values, you might need to convert the data to discrete ranges or remove it from the model. 일부의 경우 알고리즘에서 데이터를 자동으로 변환하거나 저장하지만 원하는 결과나 필요한 결과가 나타나지 않을 수도 있습니다.In some cases the algorithm will automatically convert or bin the data for you, but the results might not always be what you want or expect. 열에 대한 추가 복사본을 만들어 다른 모델을 시도해 보십시오.Consider making additional copies of the column and trying out different models. 개별 열에 플래그를 설정하여 특수 처리가 필요한 위치를 나타낼 수도 있습니다.You can also set flags on the individual columns to indicate where special processing is required. 예를 들어 데이터에 null이 포함되어 있는 경우 모델링 플래그를 사용하여 처리를 제어할 수 있습니다.For example, if your data contains nulls, you can use a modeling flag to control handling. 특정 열을 모델의 회귀 변수로 간주하려면 모델링 플래그를 사용할 수 있습니다.If you want a particular column to be considered as a regressor in a model you can do that with a modeling flag.

모델을 만든 후 모델 이름 변경이나 열 추가 또는 제거 등의 변경 작업을 수행할 수 있습니다.After you have created the model, you can make changes such as adding or removing columns, or changing the name of the model. 그러나 모델 메타데이터만 변경할 경우를 포함하여 어떤 항목이든 변경할 경우에는 해당 모델을 다시 처리해야 합니다.However, any change, even only to the model metadata, requires that you reprocess the model.

마이닝 모델 아키텍처Mining Model Architecture

마이닝 모델 처리 Processing Mining Models

데이터 마이닝 모델은 처리되기 전까지는 비어 있는 개체입니다.A data mining model is an empty object until it is processed. 모델을 처리하면 구조에서 캐시된 데이터가 필터(모델에 정의된 필터가 있는 경우)를 통과하고 알고리즘에 의해 분석됩니다.When you process a model, the data that is cached by the structure is passed through a filter, if one has been defined in the model, and is analyzed by the algorithm. 이 알고리즘은 데이터를 설명하는 요약 통계 집합을 계산하고, 데이터 내의 규칙과 패턴을 파악한 다음 이를 사용하여 모델을 채웁니다.The algorithm computes a set of summary statistics that describes the data, identifies the rules and patterns within the data, and then uses these rules and patterns to populate the model.

마이닝 모델이 처리된 후 해당 마이닝 모델에는 데이터에 대한 풍부한 정보와 분석에서 얻은 패턴(통계, 규칙, 회귀 수식 등)이 포함되어 있습니다.After it has been processed, the mining model contains a wealth of information about the data and the patterns found through analysis, including statistics, rules, and regression formulas. 사용자 지정 뷰어를 사용하여 이 정보를 찾아보거나, 데이터 마이닝 쿼리를 만들어 이 정보를 검색한 다음 분석 및 프레젠테이션에 사용할 수 있습니다.You can use the custom viewers to browse this information, or you can create data mining queries to retrieve this information and use it for analysis and presentation.

마이닝 모델 아키텍처Mining Model Architecture

마이닝 모델 보기 및 쿼리 Viewing and Querying Mining Models

모델을 처리한 후에는 SQL Server Data Tools(SSDT)SQL Server Data Tools (SSDT)SQL Server Management StudioSQL Server Management Studio에서 제공하는 사용자 지정 뷰어를 사용하여 모델을 탐색할 수 있습니다.After you have processed a model, you can explore it by using the custom viewers that are provided in SQL Server Data Tools(SSDT)SQL Server Data Tools (SSDT) and SQL Server Management StudioSQL Server Management Studio. ForFor

마이닝 모델에 대한 쿼리를 작성하여 예측을 만들거나 모델 메타데이터 또는 해당 모델에서 생성된 패턴을 검색할 수도 있습니다.You can also create queries against the mining model either to make predictions, or to retrieve model metadata or the patterns created by the model. 쿼리를 작성하려면 DMX(Data Mining Extensions)를 사용합니다.You create queries by using Data Mining Extensions (DMX).

항목Topics 링크Links
여러 마이닝 모델을 지원할 수 있는 마이닝 구조를 작성하는 방법에 대해 알아봅니다.Learn how to build mining structures that can support multiple mining models. 모델의 열 사용법에 대해 알아봅니다.Learn about the usage of columns in models. 마이닝 구조 열Mining Structure Columns

마이닝 모델 열Mining Model Columns

콘텐츠 형식(데이터 마이닝)Content Types (Data Mining)
선택한 알고리즘이 모델 콘텐츠에 미치는 영향과 다른 알고리즘에 대해 알아봅니다.Learn about different algorithms, and how the choice of algorithm affects the model content. 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)Mining Model Content (Analysis Services - Data Mining)

데이터 마이닝 알고리즘(Analysis Services - 데이터 마이닝)Data Mining Algorithms (Analysis Services - Data Mining)
컴퍼지션과 동작에 영향을 미치는 모델에 대한 속성을 설정하는 방법에 대해 알아봅니다.Learn now you can set properties on the model that affects its composition and behavior. 마이닝 모델 속성Mining Model Properties

모델링 플래그(데이터 마이닝)Modeling Flags (Data Mining)
데이터 마이닝에 대한 프로그래밍 가능한 인터페이스에 대해 알아봅니다.Learn about the programmable interfaces for data mining. AMO(Analysis Management Objects)를 사용하여 개발Developing with Analysis Management Objects (AMO)

DMX(Data Mining Extensions) 참조Data Mining Extensions (DMX) Reference
Analysis ServicesAnalysis Services에서 사용자 지정 데이터 마이닝 뷰어를 사용하는 방법에 대해 알아봅니다.Learn how to use the custom data mining viewers in Analysis ServicesAnalysis Services. 데이터 마이닝 모델 뷰어Data Mining Model Viewers
데이터 마이닝 모델에 대해 사용할 수 있는 다양한 쿼리 유형의 예를 봅니다.View examples of the different types of queries that you can use against data mining models. 데이터 마이닝 쿼리Data Mining Queries

다음 링크를 사용하여 데이터 마이닝 모델 작업에 대한 자세한 정보를 확인할 수 있습니다.Use the following links to get more specific information about working with data mining models

태스크Task 링크Link
마이닝 모델 추가 및 삭제Add and delete mining models 기존 마이닝 구조에 마이닝 모델 추가Add a Mining Model to an Existing Mining Structure

마이닝 구조에서 마이닝 모델 삭제Delete a Mining Model from a Mining Structure
마이닝 모델 열 작업Work with mining model columns 마이닝 모델에서 열 제외Exclude a Column from a Mining Model

모델 열의 별칭 만들기Create an Alias for a Model Column

마이닝 모델에서 열의 분할 변경Change the Discretization of a Column in a Mining Model

모델에서 회귀 변수로 사용할 열 지정Specify a Column to Use as Regressor in a Model
모델 속성 변경Alter model properties 마이닝 모델의 속성 변경Change the Properties of a Mining Model

마이닝 모델에 필터 적용Apply a Filter to a Mining Model

마이닝 모델에서 필터 삭제Delete a Filter from a Mining Model

마이닝 모델에 드릴스루 사용Enable Drillthrough for a Mining Model

알고리즘 매개 변수 확인 또는 변경View or Change Algorithm Parameters
복사.Copy. 모델 복사, 이동 또는 관리move, or manage models 마이닝 모델 복사본 만들기Make a Copy of a Mining Model

마이닝 모델의 뷰 복사Copy a View of a Mining Model

EXPORT(DMX)EXPORT (DMX)

IMPORT(DMX)IMPORT (DMX)
모델에 데이터 채우기 또는 모델의 데이터 업데이트Populate models with data, or update data in a model 마이닝 모델 처리Process a Mining Model
OLAP 모델 작업Work with OLAP models 데이터 마이닝 차원 만들기Create a Data Mining Dimension

관련 항목:See Also

데이터베이스 개체(Analysis Services - 다차원 데이터)Database Objects (Analysis Services - Multidimensional Data)