마이닝 구조(Analysis Services - 데이터 마이닝)Mining Structures (Analysis Services - Data Mining)

마이닝 구조는 마이닝 모델을 작성하는 데이터, 즉 원본 데이터 뷰, 열 유형과 수, 학습 및 테스트 집합으로의 선택적 분할을 정의합니다.The mining structure defines the data from which mining models are built: it specifies the source data view, the number and type of columns, and an optional partition into training and testing sets. 하나의 마이닝 구조는 같은 도메인을 공유하는 여러 개의 마이닝 모델을 지원할 수 있습니다.A single mining structure can support multiple mining models that share the same domain. 다음 다이어그램에서는 데이터 마이닝 구조와 이를 구성하는 데이터 마이닝 모델 및 데이터 원본 간의 관계를 보여 줍니다.The following diagram illustrates the relationship of the data mining structure to the data source, and to its constituent data mining models.

데이터 처리: 원본 모델에 구조에Processing of data: source to structure to model

다이어그램의 마이닝 구조는 CustomerID 필드에 조인된 여러 개의 테이블 또는 뷰가 들어 있는 데이터 원본을 기반으로 합니다.The mining structure in the diagram is based on a data source that contains multiple tables or views, joined on the CustomerID field. 한 테이블에는 지리적 영역, 나이, 수입 및 성별과 같은 고객에 대한 정보가 들어 있고, 관련된 중첩 테이블에는 고객이 구매한 제품과 같은 각 고객에 대한 추가 정보가 여러 행으로 들어 있습니다.One table contains information about customers, such as the geographical region, age, income and gender, while the related nested table contains multiple rows of additional information about each customer, such as products the customer has purchased. 이 다이어그램에서는 한 마이닝 구조에서 여러 개의 모델이 만들어질 수 있으며 각 모델이 구조에서 사용하는 열이 서로 다를 수 있다는 것을 보여 줍니다.The diagram shows that multiple models can be built on one mining structure, and that the models can use different columns from the structure.

모델 1 CustomerID, Income, Age, Region을 사용하고 Region의 데이터를 필터링합니다.Model 1 Uses CustomerID, Income, Age, Region, and filters the data on Region.

모델 2 CustomerID, Income, Age, Region을 사용하고 Age의 데이터를 필터링합니다.Model 2 Uses CustomerID, Income, Age, Region and filters the data on Age.

모델 3 CustomerID, Age, Gender 및 중첩 테이블을 사용하고 필터는 적용하지 않습니다.Model 3 Uses CustomerID, Age, Gender, and the nested table, with no filter.

각 모델에서는 입력에 서로 다른 열을 사용하고 두 개의 모델에서는 추가적으로 필터를 적용하여 모델에 사용되는 데이터를 제한하므로 세 모델이 모두 동일한 데이터를 기반으로 함에도 불구하고 결과는 매우 다를 수 있습니다.Because the models use different columns for input, and because two of the models additionally restrict the data that is used in the model by applying a filter, the models might have very different results even though they are based on the same data. 사례 키로 사용할 수 있는 열은 CustomerID 열뿐이므로 모든 모델에서 이 열이 필요합니다.Note that the CustomerID column is required in all models because it is the only available column that can be used as the case key.

이 섹션에서는 데이터 마이닝 구조의 기본 아키텍처, 즉 마이닝 구조를 정의하고 정의된 마이닝 구조에 데이터를 채우고 마이닝 구조를 사용하여 모델을 만드는 방법에 대해 설명합니다.This section explains the basic architecture of data mining structures: how you define a mining structure, how you populate it with data, and how you use it to create models. 기존 데이터 마이닝 구조를 관리하거나 내보내는 방법에 대한 자세한 내용은 데이터 마이닝 솔루션 및 개체 관리를 참조하세요.For more information about how to manage or export existing data mining structures, see Management of Data Mining Solutions and Objects.

마이닝 구조 정의Defining a Mining Structure

마이닝 구조 설정은 다음과 같은 단계로 구성됩니다.Setting up a data mining structure includes the following steps:

  • 데이터 원본을 정의합니다.Define a data source.

  • 구조에 포함할 데이터의 열을 선택(모델에 모든 열을 추가할 필요는 없음)하고 키를 정의합니다.Select columns of data to include in the structure (not all columns need to be added to the model) and defining a key.

  • 해당될 경우 bested 테이블의 키를 포함하여 구조에 대한 키를 정의합니다.Define a key for the structure, including the key for the bested table, if applicable.

  • 학습 집합 및 테스트 집합에 별도의 원본 데이터를 설정할지 여부를 지정합니다.Specify whether the source data should be separate into a training set and testing set. 이 단계는 선택 사항입니다.This step is optional.

  • 구조를 처리합니다.Process the structure.

    각 단계에 대해서는 다음 섹션에서 자세하게 설명합니다.These steps are described in more detail in the following sections.

마이닝 구조를 위한 데이터 원본Data Sources for Mining Structures

마이닝 구조를 정의할 때는 기존 데이터 원본 뷰에서 제공하는 열을 사용합니다.When you define a mining structure, you use columns that are available in an existing data source view. 데이터 원본 뷰는 여러 데이터 원본을 결합하여 단일 원본으로 사용할 수 있는 공유 개체입니다.A data source view is a shared object that lets you combine multiple data sources and use them as a single source. 원래의 데이터 원본은 클라이언트 응용 프로그램에서 볼 수 없으며, 데이터 원본 뷰의 속성을 사용하여 데이터 유형을 수정하거나 집계를 만들거나 열의 별칭을 지정할 수 있습니다.The original data sources are not visible to client applications, and you can use the properties of the data source view to modify data types, create aggregations, or alias columns.

동일한 마이닝 구조에서 여러 마이닝 모델을 만드는 경우 각 모델은 구조의 서로 다른 열을 사용할 수 있습니다.If you build multiple mining models from the same mining structure, the models can use different columns from the structure. 예를 들어 단일 구조를 만든 다음, 이를 통해 각기 다른 열을 사용하고 다른 특성을 예측하는 별도의 의사 결정 트리 및 클러스터링 모델을 만들 수 있습니다.For example, you can create a single structure and then build separate decision tree and clustering models from it, with each model using different columns and predicting different attributes.

또한 각 모델에서 구조의 열을 서로 다른 방식으로 사용할 수도 있습니다.Moreover, each model can use the columns from the structure in different ways. 예를 들어 데이터 원본 뷰에 Income 열을 포함한 후 각 모델에서 서로 다른 방식으로 이 열을 바인딩할 수 있습니다.For example, your data source view might contain an Income column, which you can bin in different ways for different models.

데이터 마이닝 구조에는 데이터 원본 및 열에 대한 정의가 원본 데이터에 대한 바인딩 형식으로 저장됩니다.The data mining structure stores the definition of the data source and the columns in it in the form of bindings to the source data. 데이터 원본 바인딩에 대한 자세한 내용은 데이터 원본 및 바인딩(SSAS 다차원)을 참조하세요.For more information about data source bindings, see Data Sources and Bindings (SSAS Multidimensional). DMX CREATE MINING STRUCTURE(DMX) 문을 사용하여 특정 데이터 원본에 바인딩하지 않고 데이터 마이닝 구조를 만들 수도 있습니다.However, note that you can also create a data mining structure without binding it to a specific data source by using the DMX CREATE MINING STRUCTURE (DMX) statement.

마이닝 구조 열Mining Structure Columns

마이닝 구조의 빌드 블록은 데이터 원본에 포함된 데이터를 설명하는 마이닝 구조 열입니다.The building blocks of the mining structure are the mining structure columns, which describe the data that the data source contains. 이러한 열에는 데이터 형식, 내용 유형, 데이터 배포 방법 등의 정보가 포함됩니다.These columns contain information such as data type, content type, and how the data is distributed. 마이닝 구조는 특정 마이닝 모델의 열 사용 방법이나 모델 작성 시 사용되는 알고리즘 유형에 대한 정보를 포함하지 않습니다. 이 정보는 마이닝 모델에서 정의됩니다.The mining structure does not contain information about how columns are used for a specific mining model, or about the type of algorithm that is used to build a model; this information is defined in the mining model itself.

마이닝 구조는 중첩 테이블을 포함할 수도 있습니다.A mining structure can also contain nested tables. 중첩 테이블은 사례 엔터티 및 관련 특성 간의 일 대 다 관계를 나타냅니다.A nested table represents a one-to-many relationship between the entity of a case and its related attributes. 예를 들어 고객을 설명하는 정보가 한 테이블에 있고 이 고객의 구매 내용이 다른 테이블에 있으면 중첩 테이블을 사용하여 정보를 단일 사례로 결합할 수 있습니다.For example, if the information that describes the customer resides in one table, and the customer's purchases reside in another table, you can use nested tables to combine the information into a single case. 고객 식별자는 엔터티이고 구매 내용은 관련 특성입니다.The customer identifier is the entity, and the purchases are the related attributes. 중첩 테이블을 사용하는 경우에 대한 자세한 내용은 중첩 테이블(Analysis Services - 데이터 마이닝)을 참조하세요.For more information about when to use nested tables, see Nested Tables (Analysis Services - Data Mining).

SQL Server Data Tools(SSDT)SQL Server Data Tools (SSDT)에서 데이터 마이닝 모델을 만들려면 먼저 데이터 마이닝 구조를 만들어야 합니다.To create a data mining model in SQL Server Data Tools(SSDT)SQL Server Data Tools (SSDT), you must first create a data mining structure. 데이터 마이닝 마법사는 마이닝 구조를 만들고 데이터를 선택하고 마이닝 모델을 추가하는 과정을 안내해 줍니다.The Data Mining wizard walks you through the process of creating a mining structure, choosing data, and adding a mining model.

DMX(Data Mining Extensions)를 사용하여 마이닝 모델을 만드는 경우 모델과 해당 모델의 열을 지정할 수 있으며 DMX에서는 필요한 마이닝 구조를 자동으로 만듭니다.If you create a mining model by using Data Mining Extensions (DMX), you can specify the model and the columns in it, and DMX will automatically create the required mining structure. 자세한 내용은 CREATE MINING MODEL(DMX)을 참조하세요.For more information, see CREATE MINING MODEL (DMX).

자세한 내용은 Mining Structure Columns을 참조하세요.For more information, see Mining Structure Columns.

데이터를 학습 집합 및 테스트 집합으로 분할Dividing the Data into Training and Testing Sets

마이닝 구조를 위한 데이터를 정의할 때 학습 및 테스트에 사용될 몇 가지 데이터도 지정할 수 있습니다.When you define the data for the mining structure, you can also specify that some of the data be used for training, and some for testing. 따라서 데이터 마이닝 구조를 만들기 전에 데이터를 분리할 필요가 없습니다.Therefore, it is no longer necessary to separate your data in advance of creating a data mining structure. 대신 모델을 만들 때 특정 데이터 비율을 테스트용으로 지정하고 나머지는 학습용으로 지정하거나, 특정 사례 수를 테스트 데이터 집합으로 사용하도록 지정할 수 있습니다.Instead, while you create your model, you can specify that a certain percentage of the data be held out for testing, and the rest used for training, or you can specify a certain number of cases to use as the test data set. 학습 및 테스트 데이터 집합에 대한 정보가 마이닝 구조와 함께 캐시되므로, 이 구조를 기반으로 하는 모든 모델에서 동일한 테스트 집합을 사용할 수 있습니다.The information about the training and testing data sets is cached with the mining structure, and as a result, the same test set can be used with all models that are based on that structure.

자세한 내용은 Training and Testing Data Sets을 참조하세요.For more information, see Training and Testing Data Sets.

드릴스루 사용Enabling Drillthrough

특정 마이닝 모델에서 열을 사용할 계획이 없더라도 마이닝 구조에 해당 열을 추가할 수 있습니다.You can add columns to the mining structure even if you do not plan to use the column in a specific mining model. 예를 들어 클러스터링 모델에서는 고객의 전자 메일 주소를 검색하지만 분석 프로세스에서는 전자 메일 주소를 사용하지 않을 경우 이 기능이 매우 유용합니다.This is useful if, for example, you want to retrieve the e-mail addresses of customers in a clustering model, without using the e-mail address during the analysis process. 분석 및 예측 단계에서 특정 열을 무시하려면 구조에 열을 추가한 후 해당 열을 사용하도록 지정하지 않거나 사용 플래그를 무시로 지정하면 됩니다.To ignore a column during the analysis and prediction phase, you add it to the structure but do not specify a usage for the column, or set the usage flag to Ignore. 마이닝 모델에 드릴스루가 사용되도록 설정되어 있고 적절한 권한이 있을 경우 이와 같이 플래그가 지정된 데이터도 쿼리에 사용될 수 있습니다.Data flagged in this way can still be used in queries if drillthrough has been enabled on the mining model, and if you have the appropriate permissions. 예를 들어 전체 고객에 대한 분석 결과로 생성된 클러스터를 검토한 다음, 드릴스루 쿼리를 사용하여 특정 클러스터에서 모델을 만들 때 사용하도록 설정하지 않은 고객의 이름과 전자 메일 주소 데이터를 가져올 수 있습니다.For example, you could review the clusters resulting from analysis of all customers, and then use a drillthrough query to get the names and e-mail addresses of customers in a particular cluster, even though those columns of data were not used to build the model.

자세한 내용은 드릴스루 쿼리(데이터 마이닝)를 참조하세요.For more information, see Drillthrough Queries (Data Mining).

마이닝 구조 처리Processing Mining Structures

마이닝 구조는 처리되기 전까지는 단순한 메타데이터 컨테이너입니다.A mining structure is just a metadata container until it is processed. 마이닝 구조를 처리할 때 Analysis ServicesAnalysis Services 에서는 데이터에 대한 통계, 연속 특성을 불연속화하는 방법 및 나중에 마이닝 모델에서 사용되는 기타 정보를 저장하는 캐시를 만듭니다.When you process a mining structure, Analysis ServicesAnalysis Services creates a cache that stores statistics about the data, information about how any continuous attributes are discretized, and other information that is later used by mining models. 마이닝 모델은 이 요약 정보를 저장하지 않지만, 대신 마이닝 구조가 처리될 때 캐시된 요약 정보를 참조합니다.The mining model itself does not store this summary information, but instead references the information that was cached when the mining structure was processed. 따라서 기존 구조에 새 모델을 추가할 때마다 구조를 다시 처리할 필요가 없으며 해당 모델만 처리하면 됩니다.Therefore, you do not need to reprocess the structure each time you add a new model to an existing structure; you can process just the model.

캐시가 매우 큰 경우 또는 세부 데이터를 제거하려는 경우에는 캐시를 처리 후에 삭제하도록 지정할 수 있습니다.You can opt to discard this cache after processing, if the cache is very large or you want to remove detailed data. 데이터를 캐시하지 않으려면 마이닝 구조의 CacheMode 속성을 ClearAfterProcessing으로 변경하면 됩니다.If you do not want the data to be cached, you can change the CacheMode property of the mining structure to ClearAfterProcessing. 이렇게 하면 모델이 처리된 후 캐시가 삭제됩니다.This will destroy the cache after any models are processed. CacheMode 속성을 ClearAfterProcessing 으로 설정하면 마이닝 모델에서 드릴스루 기능을 사용할 수 없게 됩니다.Setting the CacheMode property to ClearAfterProcessing will disable drillthrough from the mining model.

그러나 캐시를 삭제한 후에는 마이닝 구조에 새 모델을 추가할 수 없습니다.However, after you destroy the cache, you will not be able to add new models to the mining structure. 구조에 새 마이닝 모델을 추가하거나 기존 모델의 속성을 변경하려면 먼저 마이닝 구조를 다시 처리해야 합니다.If you add a new mining model to the structure, or change the properties of existing models, you would need to reprocess the mining structure first. 자세한 내용은 처리 요구 사항 및 고려 사항(데이터 마이닝)을 참조하세요.For more information, see Processing Requirements and Considerations (Data Mining).

마이닝 구조 보기Viewing Mining Structures

뷰어를 사용하여 마이닝 구조의 데이터를 탐색할 수 있습니다.You cannot use viewers to browse the data in a mining structure. SQL Server Data Tools(SSDT)SQL Server Data Tools (SSDT)에서는 데이터 마이닝 디자이너의 마이닝 구조 탭을 사용하여 구조 열 및 해당 정의를 볼 수 있습니다.However, in SQL Server Data Tools(SSDT)SQL Server Data Tools (SSDT), you can use the Mining Structure tab of Data Mining Designer to view the structure columns and their definitions. 자세한 내용은 Data Mining Designer을(를) 참조하세요.For more information, see Data Mining Designer.

마이닝 구조의 데이터를 검토하려면 DMX(Data Mining Extensions)를 사용하여 쿼리를 만들면 됩니다.If you want to review the data in the mining structure, you can create queries by using Data Mining Extensions (DMX). 예를 들어 SELECT * FROM <structure>.CASES 문은 마이닝 구조의 모든 데이터를 반환합니다.For example, the statement SELECT * FROM <structure>.CASES returns all the data in the mining structure. 이 정보를 검토하려면 먼저 마이닝 구조가 처리되어 있고 처리 결과가 캐시되어 있어야 합니다.To retrieve this information, the mining structure must have been processed, and the results of processing must be cached.

SELECT * FROM <model>.CASES 문은 이와 동일하지만 해당 모델의 사례에 대한 열만 반환합니다.The statement SELECT * FROM <model>.CASES returns the same columns, but only for the cases in that particular model. 자세한 내용은 SELECT FROM <structure>.CASESSELECT FROM <model>.CASES(DMX)를 참조하세요.For more information, see SELECT FROM <structure>.CASES and SELECT FROM <model>.CASES (DMX).

마이닝 구조에서 데이터 마이닝 모델 사용Using Data Mining Models with Mining Structures

데이터 마이닝 모델은 마이닝 구조가 나타나는 데이터에 마이닝 모델 알고리즘을 적용합니다.A data mining model applies a mining model algorithm to the data that is represented by a mining structure. 마이닝 모델은 특정 마이닝 구조에 속하는 개체로서, 마이닝 구조에서 정의한 속성의 모든 값을 상속받습니다.A mining model is an object that belongs to a particular mining structure, and the model inherits all the values of the properties that are defined by the mining structure. 모델은 마이닝 구조에 포함된 모든 열이나 이 열의 하위 집합을 사용할 수 있습니다.The model can use all the columns that the mining structure contains or a subset of the columns. 하나의 구조에 여러 구조 열 복사본을 추가할 수 있습니다.You can add multiple copies of a structure column to a structure. 또한 하나의 모델에 여러 구조 열 복사본을 추가한 다음 모델의 각 구조 열에 다른 이름이나 별칭을 할당할 수 있습니다.You can also add multiple copies of a structure column to a model, and then assign different names, or aliases, to each structure column in the model. 구조 열의 별칭을 지정하는 방법에 대한 자세한 내용은 모델 열의 별칭 만들기마이닝 모델 속성을 참조하세요.For more information about aliasing structure columns, see Create an Alias for a Model Column and Mining Model Properties.

데이터 마이닝 모델의 아키텍처에 대한 자세한 내용은 마이닝 모델(Analysis Services - 데이터 마이닝)를 참조하세요.For more information about the architecture of data mining models, see Mining Models (Analysis Services - Data Mining).

마이닝 구조에 대한 정의, 관리 및 사용 방법에 대한 자세한 내용을 보려면 아래 링크를 참조하십시오.Use the links provided her to learn more about how to define, manage, and use mining structures.

태스크Tasks 링크Links
관계형 마이닝 구조 작업Work with relational mining structures 새 관계형 마이닝 구조 만들기Create a New Relational Mining Structure

마이닝 구조에 중첩 테이블 추가Add a Nested Table to a Mining Structure
OLAP 큐브 기반의 마이닝 구조 작업Work with mining structures based on OLAP cubes 새 OLAP 마이닝 구조 만들기Create a New OLAP Mining Structure
마이닝 구조의 열에 대한 작업Work with columns in a mining structure 마이닝 구조에 열 추가Add Columns to a Mining Structure

마이닝 구조에서 열 제거Remove Columns from a Mining Structure
마이닝 구조 속성 및 데이터의 변경 또는 쿼리Change or query mining structure properties and data 마이닝 구조 속성 변경Change the Properties of a Mining Structure
기본 데이터 원본 작업 및 원본 데이터 업데이트Work with the underlying data sources and update source data 마이닝 구조에 사용되는 데이터 원본 뷰 편집Edit the Data Source View used for a Mining Structure

마이닝 구조 처리Process a Mining Structure

관련 항목:See Also

데이터베이스 개체(Analysis Services - 다차원 데이터) Database Objects (Analysis Services - Multidimensional Data)
마이닝 모델(Analysis Services - 데이터 마이닝)Mining Models (Analysis Services - Data Mining)