마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)Mining Model Content (Analysis Services - Data Mining)

적용 대상:예SQL Server Analysis Services아니요Azure Analysis ServicesAPPLIES TO:yesSQL Server Analysis ServicesnoAzure Analysis Services디자인 하 고 기본 마이닝 구조에서 데이터를 사용 하 여 마이닝 모델 처리 후 마이닝 모델 완료 되 고이 포함 하는 마이닝 모델 콘텐츠합니다. After you have designed and processed a mining model using data from the underlying mining structure, the mining model is complete and contains mining model content. 이 콘텐츠를 사용하여 예측을 만들거나 데이터를 분석할 수 있습니다.You can use this content to make predictions or analyze your data.

마이닝 모델 콘텐츠에는 모델에 대한 메타데이터, 데이터에 대한 통계 및 마이닝 알고리즘을 통해 발견한 패턴이 포함됩니다.Mining model content includes metadata about the model, statistics about the data, and patterns discovered by the mining algorithm. 사용된 알고리즘에 따라 모델 콘텐츠에는 회귀 수식, 규칙 및 항목 집합의 정의, 가중치 또는 기타 통계가 포함될 수 있습니다.Depending on the algorithm that was used, the model content may include regression formulas, the definitions of rules and itemsets, or weights and other statistics.

사용된 알고리즘에 관계없이 마이닝 모델 콘텐츠는 표준 구조로 표시됩니다.Regardless of the algorithm that was used, mining model content is presented in a standard structure. SQL Server Data Tools(SSDT)SQL Server Data Tools (SSDT)에서 제공하는 Microsoft 일반 콘텐츠 트리 뷰어에서 구조를 탐색한 다음 사용자 지정 뷰어 중 하나로 전환하여 모델 유형에 따라 정보가 해석되고 그래픽으로 표시되는 방법을 확인할 수 있습니다.You can browse the structure in the Microsoft Generic Content Tree Viewer, provided in SQL Server Data Tools(SSDT)SQL Server Data Tools (SSDT), and then switch to one of the custom viewers to see how the information is interpreted and displayed graphically for each model type. 또한 MINING_MODEL_CONTENT 스키마 행 집합을 지원하는 클라이언트를 사용하여 마이닝 모델 콘텐츠에 대한 쿼리를 만들 수도 있습니다.You can also create queries against the mining model content by using any client that supports the MINING_MODEL_CONTENT schema rowset. 자세한 내용은 데이터 마이닝 쿼리 태스크 및 방법을 참조하세요.For more information, see Data Mining Query Tasks and How-tos.

이 섹션에서는 모든 종류의 마이닝 모델에 제공되는 콘텐츠의 기본 구조에 대해 설명합니다.This section describes the basic structure of the content provided for all kinds of mining models. 또한 이 섹션에서는 모든 마이닝 모델에 공통된 노드 유형에 대해 설명하고 정보를 해석하는 방법에 대한 지침을 제공합니다.It describes the node types that are common to all mining model content, and provides guidance on how to interpret the information.

마이닝 모델 콘텐츠의 구조Structure of Mining Model Content

모델 콘텐츠의 노드Nodes in the Model Content

알고리즘 유형별 마이닝 모델 콘텐츠Mining Model Content by Algorithm Type

마이닝 모델 콘텐츠를 보기 위한 도구Tools for Viewing Mining Model Content

마이닝 모델 콘텐츠를 쿼리하기 위한 도구Tools for Querying Mining Model Content

마이닝 모델 콘텐츠의 구조Structure of Mining Model Content

각 모델의 콘텐츠는 일련의 노드로 표시됩니다.The content of each model is presented as a series of nodes. 노드는 모델의 특정 부분에 대한 메타데이터 및 정보를 포함하는 마이닝 모델 개체이며A node is an object within a mining model that contains metadata and information about a portion of the model. 계층 구조로 정렬됩니다.Nodes are arranged in a hierarchy. 계층 구조에 노드를 정확히 배열하는 방법과 계층 구조의 의미는 사용된 알고리즘에 따라 다릅니다.The exact arrangement of nodes in the hierarchy, and the meaning of the hierarchy, depends on the algorithm that you used. 예를 들어 의사 결정 트리 모델을 만들면 모두 모델 루트에 연결된 여러 트리가 모델에 포함될 수 있고 신경망 모델을 만들면 하나 이상의 네트워크와 하나의 정적 노드가 모델에 포함될 수 있습니다.For example, if you create a decision trees model, the model can contain multiple trees, all connected to the model root; if you create a neural network model, the model may contain one or more networks, plus a statistics node.

각 모델의 첫 번째 노드는 루트 노드또는 모델 부모 노드라고 합니다.The first node in each model is called the root node, or the model parent node. 모든 모델에는 루트 노드(NODE_TYPE = 1)가 있습니다.Every model has a root node (NODE_TYPE = 1). 일반적으로 루트 노드에는 모델에 대한 몇 가지 메타데이터와 자식 노드 개수가 포함되지만 모델에서 발견되는 패턴에 대한 추가 정보는 거의 포함되지 않습니다.The root node typically contains some metadata about the model, and the number of child nodes, but little additional information about the patterns discovered by the model.

루트 노드의 자식 노드 개수는 모델을 만드는 데 사용된 알고리즘에 따라 달라집니다.Depending on which algorithm you used to create the model, the root node has a varying number of child nodes. 자식 노드의 의미와 내용은 이러한 알고리즘뿐 아니라 데이터의 깊이와 복잡도에 의해 결정됩니다.Child nodes have different meanings and contain different content, depending on the algorithm and the depth and complexity of the data.

마이닝 모델 콘텐츠의 노드Nodes in Mining Model Content

마이닝 모델에서 노드는 모델의 전부 또는 일부에 대한 정보를 저장하는 범용 컨테이너입니다.In a mining model, a node is a general-purpose container that stores a piece of information about all or part of the model. 각 노드의 구조는 항상 동일하며 데이터 마이닝 스키마 행 집합으로 정의된 열을 포함합니다.The structure of each node is always the same, and contains the columns defined by the data mining schema rowset. 자세한 내용은 DMSCHEMA_MINING_MODEL_CONTENT 행 집합을 참조하세요.For more information, see DMSCHEMA_MINING_MODEL_CONTENT Rowset.

각 노드에는 각 모델 내에서 고유한 식별자를 포함하는 노드에 대한 메타데이터, 보모 노드의 ID 및 노드에 있는 자식 노드 개수가 포함됩니다.Each node includes metadata about the node, including an identifier that is unique within each model, the ID of the parent node, and the number of child nodes that the node has. 메타데이터는 노드가 속한 모델과 특정 모델이 저장되는 데이터베이스 카탈로그를 식별합니다.The metadata identifies the model to which the node belongs, and the database catalog where that particular model is stored. 노드에 제공되는 추가 내용은 모델을 만드는 데 사용된 알고리즘의 유형에 따라 다르며, 여기에는 다음이 포함될 수 있습니다.Additional content provided in the node differs depending on the type of algorithm you used to create the model, and might include the following:

  • 특정 예측 값을 지원하는 학습 데이터의 사례 수Count of cases in the training data that supports a particular predicted value.

  • 평균, 표준 편차 또는 분산과 같은 통계Statistics, such as mean, standard deviation, or variance.

  • 계수 및 수식Coefficients and formulas.

  • 규칙 및 측면 포인터에 대한 정의Definition of rules and lateral pointers.

  • 모델의 특정 부분을 나타내는 XML 조각XML fragments that describe a portion of the model.

마이닝 콘텐츠 노드 유형 목록List of Mining Content Node Types

다음 표에서는 데이터 마이닝 모델에 출력되는 다양한 유형의 노드를 보여 줍니다.The following table lists the different types of nodes that are output in data mining models. 알고리즘마다 정보를 처리하는 방법이 다르기 때문에 각 모델은 몇 개의 특정 종류의 노드만 생성합니다.Because each algorithm processes information differently, each model generates only a few specific kinds of nodes. 알고리즘을 변경하면 노드 유형이 변경될 수 있습니다.If you change the algorithm, the type of nodes may change. 또한 모델을 다시 처리하면 각 노드의 내용이 변경될 수도 있습니다.Also, if you reprocess the model, the content of each node may change.

참고

다른 데이터 마이닝 서비스를 사용 하는 경우 또는 사용자 고유의 플러그 인 알고리즘을 만드는 경우 추가 사용자 지정 노드 유형을 사용할 수 있습니다.If you use a different data mining service, or if you create your own plug-in algorithms, additional custom node types may be available.

NODE_TYPE IDNODE_TYPE ID 노드 레이블Node Label 노드 내용Node Contents
11 ModelModel 메타데이터 및 루트 내용 노드입니다.Metadata and root content node. 모든 모델 유형에 적용됩니다.Applies to all model types.
22 trEETree 분류 트리의 루트 노드입니다.Root node of a classification tree. 의사 결정 트리 모델에 적용됩니다.Applies to decision tree models.
33 내부Interior 트리의 내부 분할 노드입니다.Interior split node in a tree. 의사 결정 트리 모델에 적용됩니다.Applies to decision tree models.
44 배포Distribution 트리의 터미널 노드입니다.Terminal node of a tree. 의사 결정 트리 모델에 적용됩니다.Applies to decision tree models.
55 클러스터Cluster 알고리즘을 통해 검색되는 클러스터입니다.Cluster detected by the algorithm. 클러스터링 모델 및 시퀀스 클러스터링 모델에 적용됩니다.Applies to clustering models and sequence clustering models.
66 UnknownUnknown 알 수 없는 노드 유형입니다.Unknown node type.
77 항목 집합ItemSet 알고리즘을 통해 검색되는 항목 집합입니다.Itemset detected by the algorithm. 연결 모델 및 시퀀스 클러스터링 모델에 적용됩니다.Applies to association models or sequence clustering models.
88 AssociationRuleAssociationRule 알고리즘을 통해 검색되는 연결 규칙입니다.Association rule detected by the algorithm. 연결 모델 및 시퀀스 클러스터링 모델에 적용됩니다.Applies to association models or sequence clustering models.
99 PredictableAttributePredictableAttribute 예측 가능한 특성입니다.Predictable attribute. 모든 모델 유형에 적용됩니다.Applies to all model types.
1010 InputAttributeInputAttribute 입력 특성입니다.Input attribute. 의사 결정 트리 및 Naïve Bayes 모델에 적용됩니다.Applies to decision trees and Naïve Bayes models.
1111 InputAttributeStateInputAttributeState 입력 특성의 상태에 대한 통계입니다.Statistics about the states of an input attribute. 의사 결정 트리 및 Naïve Bayes 모델에 적용됩니다.Applies to decision trees and Naïve Bayes models.
1313 시퀀스Sequence 시퀀스 클러스터의 Markov 모델 구성 요소에 대한 최상위 노드입니다.Top node for a Markov model component of a sequence cluster. 시퀀스 클러스터링 모델에 적용됩니다.Applies to sequence clustering models.
1414 전환Transition Markov 전환 행렬입니다.Markov transition matrix. 시퀀스 클러스터링 모델에 적용됩니다.Applies to sequence clustering models.
1515 TimeSeriesTimeSeries 시계열 트리의 루트가 아닌 노드입니다.Non-root node of a time series tree. 시계열 모델에만 적용됩니다.Applies to time series models only.
1616 TsTreeTsTree 예측 가능한 시계열에 해당하는 시계열 트리의 루트 노드입니다.Root node of a time series tree that corresponds to a predictable time series. MIXED 매개 변수를 사용하여 모델을 만든 경우에만 시계열 모델에 적용됩니다.Applies to time series models, and only if the model was created using the MIXED parameter.
1717 NNetSubnetworkNNetSubnetwork 하나의 하위 네트워크입니다.One sub-network. 신경망 모델에 적용됩니다.Applies to neural network models.
1818 NNetInputLayerNNetInputLayer 입력 계층의 노드가 포함된 그룹입니다.Group that contains the nodes of the input layer. 신경망 모델에 적용됩니다.Applies to neural network models.
1919 NNetHiddenLayerNNetHiddenLayer 숨겨진 계층을 나타내는 노드가 포함된 그룹입니다.Groups that contains the nodes that describe the hidden layer. 신경망 모델에 적용됩니다.Applies to neural network models.
2121 NNetOutputLayerNNetOutputLayer 출력 계층의 노드가 포함된 그룹입니다.Groups that contains the nodes of the output layer. 신경망 모델에 적용됩니다.Applies to neural network models.
2121 NNetInputNodeNNetInputNode 입력 특성과 해당 상태를 일치시키는 입력 계층의 노드입니다.Node in the input layer that matches an input attribute with the corresponding states. 신경망 모델에 적용됩니다.Applies to neural network models.
2222 NNetHiddenNodeNNetHiddenNode 숨겨진 계층의 노드입니다.Node in the hidden layer. 신경망 모델에 적용됩니다.Applies to neural network models.
2323 NNetOutputNodeNNetOutputNode 출력 계층의 노드입니다.Node in the output layer. 일반적으로 이 노드는 출력 특성과 해당 상태를 일치시킵니다.This node will usually match an output attribute and the corresponding states. 신경망 모델에 적용됩니다.Applies to neural network models.
2424 NNetMarginalNodeNNetMarginalNode 학습 집합에 대한 한계 통계입니다.Marginal statistics about the training set. 신경망 모델에 적용됩니다.Applies to neural network models.
2525 RegressionTreeRootRegressionTreeRoot 회귀 트리의 루트입니다.Root of a regression tree. 연속 입력 특성이 포함된 의사 결정 트리 모델 및 선형 회귀 모델에 적용됩니다.Applies to linear regression models and to decision trees models that contains continuous input attributes.
2626 NaiveBayesMarginalStatNodeNaiveBayesMarginalStatNode 학습 집합에 대한 한계 통계입니다.Marginal statistics about the training set. Naïve Bayes 모델에 적용됩니다.Applies to Naïve Bayes models.
2727 ArimaRootArimaRoot ARIMA 모델의 루트 노드입니다.Root node of an ARIMA model. ARIMA 알고리즘을 사용하는 시계열 모델에만 적용됩니다.Applies to only those time series models that use the ARIMA algorithm.
2828 ArimaPeriodicStructureArimaPeriodicStructure ARIMA 모델의 주기 구조입니다.A periodic structure in an ARIMA model. ARIMA 알고리즘을 사용하는 시계열 모델에만 적용됩니다.Applies to only those time series models that use the ARIMA algorithm.
2929 ArimaAutoRegressiveArimaAutoRegressive ARIMA 모델의 단일 용어에 대한 자동 회귀 계수입니다.Autoregressive coefficient for a single term in an ARIMA model.

ARIMA 알고리즘을 사용하는 시계열 모델에만 적용됩니다.Applies to only those time series models that use the ARIMA algorithm.
3030 ArimaMovingAverageArimaMovingAverage ARIMA 모델의 단일 용어에 대한 이동 평균 계수입니다.Moving average coefficient for a single term in an ARIMA model. ARIMA 알고리즘을 사용하는 시계열 모델에만 적용됩니다.Applies to only those time series models that use the ARIMA algorithm.
10001000 CustomBaseCustomBase 사용자 지정 노드 유형의 시작 지점입니다.Starting point for custom node types. 사용자 지정 노드 유형의 값은 이 상수보다 큰 정수여야 합니다.Custom node types must be integers greater in value than this constant. 사용자 지정 플러그 인 알고리즘을 사용하여 만든 모델에 적용됩니다.Applies to models created by using custom plug-in algorithms.

노드 ID, 이름, 캡션 및 설명Node ID, Name, Caption and Description

모든 모델의 루트 노드는 항상 고유 ID(NODE_UNIQUE_NAME)로 0을 갖습니다.The root node of any model always has the unique ID (NODE_UNIQUE_NAME) of 0. 모든 노드 ID는 Analysis Services에 의해 자동으로 할당되며 수정할 수 없습니다.All node IDs are assigned automatically by Analysis Services and cannot be modified.

각 모델의 루트 노드에는 모델에 대한 몇 가지 기본 메타데이터도 포함됩니다.The root node for each model also contains some basic metadata about the model. 이러한 메타데이터로는 모델이 저장되는 Analysis Services 데이터베이스(MODEL_CATALOG), 스키마(MODEL_SCHEMA)및 모델 이름(MODEL_NAME)이 있습니다.This metadata includes the Analysis Services database where the model is stored (MODEL_CATALOG), the schema (MODEL_SCHEMA), and the name of the model (MODEL_NAME). 그리나 이 정보는 모델의 모든 노드에서 반복되므로 이 메타데이터를 가져오기 위해 루트 노드를 쿼리할 필요는 없습니다.However, this information is repeated in all the nodes of the model, so you do not need to query the root node to get this metadata.

고유 식별자로 사용되는 이름 외에도 각 노드에는 별도의 이름 (NODE_NAME)이 있습니다.In addition to a name used as the unique identifier, each node has a name (NODE_NAME). 이 이름은 표시 목적으로 알고리즘을 통해 자동으로 생성되며 수정할 수 없습니다.This name is automatically created by the algorithm for display purposes and cannot be edited.

참고

Microsoft 클러스터링 알고리즘을 사용하면 각 클러스터에 이름을 할당할 수 있습니다.The Microsoft Clustering algorithm allows users to assign friendly names to each cluster. 그러나 이러한 이름은 서버에서 유지되지 않으며, 모델을 다시 처리하면 알고리즘을 통해 새 클러스터 이름이 생성됩니다.However, these friendly names are not persisted on the server, and if you reprocess the model, the algorithm will generate new cluster names.

각 노드의 캡션설명 은 알고리즘을 통해 자동으로 생성되며 노드 내용을 이해하는 데 도움이 되는 레이블 역할을 합니다.The caption and description for each node are automatically generated by the algorithm, and serve as labels to help you understand the content of the node. 각 필드에 대해 생성되는 텍스트는 모델 유형에 따라 다릅니다.The text generated for each field depends on the model type. 경우에 따라 이름, 캡션 및 설명에 똑같은 문자열이 포함될 수도 있고 설명에 추가 정보가 포함될 수도 있습니다.In some cases, the name, caption, and description may contain exactly the same string, but in some models, the description may contain additional information. 구현 세부 사항은 개별 모델 유형에 대한 항목을 참조하세요.See the topic about the individual model type for details of the implementation.

참고

Analysis Services 서버에서는 이름 바꾸기를 구현하는 사용자 지정 플러그 인 알고리즘을 사용하여 모델을 작성한 경우에만 모델의 이름 바꾸기를 지원합니다.Analysis Services server supports the renaming of nodes only if you build models by using a custom plug-in algorithm that implements renaming,. 이름 바꾸기를 사용하려면 플러그 인 알고리즘을 만들 때 메서드를 재정의해야 합니다.To enable renaming, you must override the methods when you create the plug-in algorithm.

부모 노드, 자식 노드 및 노드 카디널리티Node Parents, Node Children, and Node Cardinality

트리 구조에서 부모 노드와 자식 노드 간의 관계는 PARENT_UNIQUE_NAME 열의 값에 의해 결정됩니다.The relationship between parent and child nodes in a tree structure is determined by the value of the PARENT_UNIQUE_NAME column. 이 값은 자식 노드에 저장되며 부모 노드의 ID를 보여 줍니다.This value is stored in the child node and tells you the ID of the parent node. 다음은 이 정보의 사용 방법을 보여 주는 몇 가지 예입니다.Some examples follow of how this information might be used:

  • PARENT_UNIQUE_NAME의 값이 NULL이면 노드가 모델의 최상위 노드임을 나타냅니다.A PARENT_UNIQUE_NAME that is NULL means that the node is the top node of the model.

  • PARENT_UNIQUE_NAME의 값이 0이면 노드가 모델에서 최상위 노드의 직계 하위 항목이어야 합니다.If the value of PARENT_UNIQUE_NAME is 0, the node must be a direct descendant of the top node in the model. 이는 루트 노드의 ID는 항상 0이기 때문입니다.This is because the ID of the root node is always 0.

  • DMX(Data Mining Extensions) 쿼리 내의 함수를 사용하여 특정 노드의 하위 항목이나 부모를 찾을 수 있습니다.You can use functions within a Data Mining Extensions (DMX) query to find descendants or parents of a particular node. 쿼리에서 함수를 사용하는 방법은 데이터 마이닝 쿼리를 참조하세요.For more information about using functions in queries, see Data Mining Queries.

    카디널리티 는 집합에 있는 항목의 개수를 나타냅니다.Cardinality refers to the number of items in a set. 처리된 마이닝 모델의 컨텍스트에서 카디널리티는 특정 노드에 있는 자식의 개수를 보여 줍니다.In the context of a processed mining model, cardinality tells you the number of children in a particular node. 예를 들어 의사 결정 트리 모델에 [연간 소득] 노드가 있고 이 노드에 각각 [연간 소득] = 높음 및 [연간 소득] = 낮음 조건을 나타내기 위한 두 개의 자식 노드가 있으면 [연간 소득] 노드에 대한 CHILDREN_CARDINALITY 값은 2일 수 있습니다.For example, if a decision tree model has a node for [Yearly Income], and that node has two child nodes, one for the condition [Yearly Income] = High and one for the condition, [Yearly Income] = Low, the value of CHILDREN_CARDINALITY for the [Yearly Income] node would be 2.

참고

Analysis ServicesAnalysis Services에서는 노드의 카디널리티를 카운트할 때 직계 자식 노드만 카운트합니다.In Analysis ServicesAnalysis Services, only the immediate child nodes are counted when calculating the cardinality of a node. 그러나 사용자 지정 플러그 인 알고리즘을 만들면 CHILDREN_CARDINALITY를 오버로드하여 카디널리티를 다르게 카운트할 수 있습니다.However, if you create a custom plug-in algorithm, you can overload CHILDREN_CARDINALITY to count cardinality differently. 이렇게 하면 예를 들어 직계 자식뿐 아니라 모든 하위 항목의 개수를 카운트하려는 경우에 유용할 수 있습니다.This may be useful, for example, if you wanted to count the total number of descendants, not just the immediate children.

모든 모델에서 카디널리티가 카운트되는 방법은 동일하지만 카디널리티 값을 해석하거나 사용하는 방법은 모델 유형에 따라 다릅니다.Although cardinality is counted in the same way for all models, how you interpret or use the cardinality value differs depending on the model type. 예를 들어 클러스터링 모델에서는 최상위 노드의 카디널리티가 발견된 총 클러스터 수를 보여 주지만For example, in a clustering model, the cardinality of the top node tells you the total number of clusters that were found. 다른 유형의 모델에서는 카디널리티가 항상 노드 유형에 따라 설정된 값을 가질 수 있습니다.In other types of models, cardinality may always have a set value depending on the node type. 카디널리티를 해석하는 방법은 개별 모델 유형에 대한 항목을 참조하세요.For more information about how to interpret cardinality, see the topic about the individual model type.

참고

Microsoft 신경망 알고리즘을 통해 만든 모델과 같은 일부 모델에는 전체 모델의 학습 모델에 대한 기술 통계를 제공하는 특수한 노드 유형이 추가로 포함될 수 있습니다.Some models, such as those created by the Microsoft Neural Network algorithm, additionally contain a special node type that provides descriptive statistics about the training data for the entire model. 정의에 따르면 이러한 노드에는 자식 노드가 없습니다.By definition, these nodes never have child nodes.

노드 분포Node Distribution

NODE_DISTRIBUTION 열에는 많은 노드에서 알고리즘을 통해 발견된 패턴에 대한 중요한 세부 정보를 제공하는 중첩 테이블이 포함됩니다.The NODE_DISTRIBUTION column contains a nested table that in many nodes provides important and detailed information about the patterns discovered by the algorithm. 이 테이블에 제공되는 정확한 통계는 모델 유형, 트리에 있는 노드의 위치 및 예측 가능한 특성이 연속 숫자 값인지 또는 불연속 값인지 여부에 따라 달라집니다. 그러나 이러한 통계에는 특성의 최소값 및 최대값, 값에 할당된 가중치, 노드에 있는 사례 수, 회귀 수식에 사용되는 계수, 표준 편차 및 분산과 같은 통계 측정값 등이 포함될 수 있습니다.The exact statistics provided in this table change depending on the model type, the position of the node in the tree, and whether the predictable attribute is a continuous numeric value or a discrete value; however, they can include the minimum and maximum values of an attribute, weights assigned to values, the number of cases in a node, coefficients used in a regression formula, and statistical measures such as standard deviation and variance. 노드 분포를 해석하는 방법은 작업 중인 모델 유형에 대한 항목을 참조하세요.For more information about how to interpret node distribution, see the topic for the specific type of model type that you are working with.

참고

NODE_DISTRIBUTION 테이블은 노드 유형에 따라 비어 있을 수 있습니다.The NODE_DISTRIBUTION table may be empty, depending on the node type. 예를 들어 일부 노드는 자세한 통계가 포함된 자식 노드의 컬렉션을 구성하기 위해서만 사용됩니다.For example, some nodes serve only to organize a collection of child nodes, and it is the child nodes that contain the detailed statistics.

NODE_DISTRIBUTION 중첩 테이블에는 항상 다음과 같은 열이 포함되어 있습니다.The nested table, NODE_DISTRIBUTION, always contains the following columns. 각 열의 내용은 모델 유형에 따라 달라집니다.The content of each column varies depending on the model type. 특정 모델 유형에 대한 자세한 내용은 알고리즘 유형별 마이닝 모델 콘텐츠를 참조하세요.For more information about specific model types, see Mining Model Content by Algorithm Type.

ATTRIBUTE_NAMEATTRIBUTE_NAME
이 열에 포함되는 내용은 알고리즘에 따라 달라집니다.Content varies by algorithm. 이러한 내용은 예측 가능한 특성과 같은 열 이름, 규칙, 항목 집합, 수식의 일부와 같은 알고리즘 내부 정보 등일 수 있습니다.Can be the name of a column, such as a predictable attribute, a rule, an itemset, or a piece of information internal to the algorithm, such as part of a formula.

이 열에는 특성-값 쌍도 포함될 수 있습니다.This column can also contain an attribute-value pair.

ATTRIBUTE_VALUEATTRIBUTE_VALUE
ATTRIBUTE_NAME에 지정된 특성의 값입니다.Value of the attribute named in ATTRIBUTE_NAME.

특성 이름이 열이면 대부분의 간단한 사례에서는 ATTRIBUTE_VALUE에 해당 열의 불연속 값 중 하나가 포함됩니다.If the attribute name is a column, then in the most straightforward case, the ATTRIBUTE_VALUE contains one of the discrete values for that column.

ATTRIBUTE_VALUE에는 알고리즘이 값을 처리하는 방법에 따라 특성 값이 있는지 여부(Existing) 또는 값이 null인지 여부(Missing)를 나타내는 플래그도 포함될 수 있습니다.Depending on how the algorithm processes values, the ATTRIBUTE_VALUE can also contain a flag that tells you whether a value exists for the attribute (Existing), or whether the value is null (Missing).

예를 들어 특정 항목을 한 번 이상 구매한 고객을 찾도록 모델을 설정한 경우 ATTRIBUTE_NAME 열에는 Model = 'Water bottle'과 같은 관심 있는 항목을 정의하는 특성-값 쌍이 포함될 수 있고 ATTRIBUTE_VALUE 열에는 Existing 또는 Missing키워드만 포함될 수 있습니다.For example, if your model is set up to find customers who have purchased a particular item at least once, the ATTRIBUTE_NAME column might contain the attribute-value pair that defines the item of interest, such as Model = 'Water bottle', and the ATTRIBUTE_VALUE column would contain only the keyword Existing or Missing.

별칭SUPPORT
이 특성-값 쌍이 있거나 이 항목 집합 또는 규칙이 포함된 사례 수입니다.Count of the cases that have this attribute-value pair, or that contain this itemset or rule.

일반적으로 각 노드의 지지도 값은 현재 노드에 포함된 학습 집합의 사례 수를 나타냅니다.In general, for each node, the support value tells you how many cases in the training set are included in the current node. 대부분의 모델 유형에서 지지도는 사례의 정확한 개수를 나타냅니다.In most model types, support represents an exact count of cases. 지지도 값은 학습 데이터를 쿼리하지 않고도 학습 사례 내의 데이터 분포를 볼 수 있기 때문에 유용합니다.Support values are useful because you can view the distribution of data within your training cases without having to query the training data. 또한 Analysis Services 서버에서는 유추가 강력한 유추인지 아니면 약한 유추인지 여부를 확인하기 위해 이러한 저장된 값을 사용하여 저장된 확률과 이전 확률을 계산합니다.The Analysis Services server also uses these stored values to calculate stored probability versus prior probability, to determine whether inference is strong or weak.

예를 들어 분류 트리에서 지지도 값은 위에 설명된 특성 조합이 있는 사례 수를 나타냅니다.For example, in a classification tree, the support value indicates the number of cases that have the described combination of attributes.

의사 결정 트리에서는 각 트리 수준의 지지도 합계는 부모 노드의 지지도에 대한 합계입니다.In a decision tree, the sum of support at each level of a tree sums to the support of its parent node. 예를 들어 1200개의 사례가 있는 모델을 성별로 균등하게 나눈 다음 노드 (2)의 자식 노드인 노드 (4), (5), (6) 즉, 세 가지 소득 값인 낮음, 보통, 높음으로 균등하게 세분화하면 항상 노드 (2)와 동일한 사례 수가 합계로 구해집니다.For example, if a model containing 1200 cases is divided equally by gender, and then subdivided equally by three values for Income—Low, Medium, and High—the child nodes of node (2), which are nodes (4), (5) and (6), always sum to the same number of cases as node (2).

노드 ID 및 노드 특성Node ID and node attributes 지지도 개수Support count
(1) Model root(1) Model root 12001200
(2) Gender = Male(2) Gender = Male

(3) Gender = Female(3) Gender = Female
600600

600600
(4) Gender = Male and Income = High(4) Gender = Male and Income = High

(5) Gender = Male and Income = Medium(5) Gender = Male and Income = Medium

(6) Gender = Male and Income = Low(6) Gender = Male and Income = Low
200200

200200

200200
(7) Gender = Female and Income = High(7) Gender = Female and Income = High

(8) Gender = Female and Income = Medium(8) Gender = Female and Income = Medium

(9) Gender = Female and Income = Low(9) Gender = Female and Income = Low
200200

200200

200200

클러스터링 모델의 경우 여러 클러스터에 속할 확률을 포함하도록 지지도 개수에 가중치가 적용될 수 있습니다.For a clustering model, the number for support can be weighted to include the probabilities of belonging to multiple clusters. 여러 클러스터 멤버 자격은 기본 클러스터링 메서드입니다.Multiple cluster membership is the default clustering method. 이 경우 각 사례가 반드시 하나의 클러스터에만 속하는 것이 아니기 때문에 이러한 모델의 지지도는 모든 클러스터에서 더해져 100%가 될 수 없습니다.In this scenario, because each case does not necessarily belong to one and only one cluster, support in these models might not add up to 100 percent across all clusters.

PROBABILITYPROBABILITY
전체 모델 내의 특정 노드에 대한 확률을 나타냅니다.Indicates the probability for this specific node within the entire model.

일반적으로 확률은 노드 내의 총 사례 수로 나눈 이 특정 값에 대한 지지도(NODE_SUPPORT)를 나타냅니다.Generally, probability represents support for this particular value, divided by the total count of cases within the node (NODE_SUPPORT).

그러나 확률은 데이터에서 값이 누락되어 발생하는 바이어스를 제거하기 위해 약간 조정됩니다.However, probability is adjusted slightly to eliminate bias caused by missing values in the data.

예를 들어 [총 자녀 수]의 현재 값이 '1' 및 '2'이면 자녀 수가 0 또는 3일 수 없음을 예측하는 모델을 만들지 않을 수 있습니다.For example, if the current values for [Total Children] are 'One' and 'Two', you want to avoid creating a model that predicts that it is impossible to have no children, or to have three children. 누락 값이 희박하지만 발생할 수 있도록 하기 위해 특성의 실제 값 개수에는 항상 1이 더해집니다.To ensure that missing values are improbable, but not impossible, the algorithm always adds 1 to the count of actual values for any attribute.

예:Example:

[총 자녀 수 = 1]의 확률 = [총 자녀 수가 1인 사례 수] + 1/[모든 사례 수] + 3Probability of [Total Children = One] = [Count of cases where Total Children = One] + 1/[Count of all cases] + 3

[총 자녀 수 = 2]의 확률= [총 자녀 수가 2인 사례 수] +1/[모든 사례 수] +3Probability of [Total Children = Two]= [Count of cases where Total Children = Two] +1/[Count of all cases] +3

참고

조정값 3은 기존 값의 총 개수인 n에 1을 더하여 계산됩니다.The adjustment of 3 is calculated by adding 1 to the total number of existing values, n.

조정 후 모든 값의 확률은 여전히 더해져 1이 됩니다.After adjustment, the probabilities for all values still add up to 1. 데이터가 없는 값의 확률(이 예제의 경우, [총 자녀 수 = '0', '3' 또는 기타 다른 값])은 0이 아닌 매우 낮은 수준에서 시작해서 사례가 추가됨에 따라 천천히 증가합니다.The probability for the value with no data (in this example, [Total Children = 'Zero', 'Three', or some other value]), starts at a very low non-zero level, and rises slowly as more cases are added.

분산VARIANCE
노드 내의 값 분산을 나타냅니다.Indicates the variance of the values within the node. 정의에 따르면 불연속 값의 분산은 항상 0입니다.By definition, variance is always 0 for discrete values. 모델에서 연속 값을 지원하는 경우 분모 n 또는 노드에 있는 사례 수를 사용하여 분산이 σ(시그마)로 계산됩니다.If the model supports continuous values, variance is computed as σ (sigma), using the denominator n, or the number of cases in the node.

일반적으로 표준 편차(StDev)를 나타날 때는 두 가지 방법이 사용됩니다.There are two definitions in general use to represent standard deviation (StDev). 하나는 바이어스를 사용하여 표준 편차를 계산하는 방법이고 다른 하나는 바이어스를 사용하지 않고 표준 편차를 계산하는 방법입니다.One method for calculating standard deviation takes into account bias, and another method computes standard deviation without using bias. 일반적으로 Microsoft 데이터 마이닝 알고리즘은 표준 편차를 계산할 때 바이어스를 사용하지 않습니다.In general, Microsoft data mining algorithms do not use bias when computing standard deviation.

NODE_DISTRIBUTION 테이블에는 모든 불연속 및 분할된 특성의 실제 값과 연속 값의 평균이 표시됩니다.The value that appears in the NODE_DISTRIBUTION table is the actual value for all discrete and discretized attributes, and the mean for continuous values.

VALUE_TYPEVALUE_TYPE
값 또는 특성의 데이터 형식과 값의 사용법을 나타냅니다.Indicates the data type of the value or an attribute, and the usage of the value. 일부 값 형식은 다음과 같은 특정 모델 유형에만 적용됩니다.Certain value types apply only to certain model types:

VALUE_TYPE IDVALUE_TYPE ID 값 레이블Value Label 값 형식 이름Value Type Name
11 MissingMissing 사례 데이터에 해당 특성에 대한 값이 포함되지 않았음을 나타냅니다.Indicates that the case data did not contain a value for this attribute. Missing 상태는 값이 있는 특성과 별도로 계산됩니다.The Missing state is calculated separately from attributes that have values.
22 ExistingExisting 사례 데이터에 해당 특성에 대한 값이 포함되어 있음을 나타냅니다.Indicates that the case data contains a value for this attribute.
33 연속Continuous 특성 값이 연속 숫자 값이며 분산 및 표준 편차와 함께 평균으로 표시할 수 있음을 나타냅니다.Indicates that the value of the attribute is a continuous numeric value and therefore can be represented by a mean, together with variance and standard deviation.
44 불연속Discrete 불연속 값으로 처리되는 숫자 또는 텍스트 값을 나타냅니다.Indicates a value, either numeric or text, that is treated as discrete.

참고 불연속 값도 누락될 수 있지만 누락된 불연속 값은 계산을 수행할 때 다르게 처리됩니다.Note Discrete values can also be missing; however, they are handled differently when making calculations. 자세한 내용은 누락 값(Analysis Services - 데이터 마이닝)을 참조하세요.For information, see Missing Values (Analysis Services - Data Mining).
55 불연속화됨Discretized 특성에 불연속화 숫자 값이 포함되어 있음을 나타냅니다.Indicates that the attribute contains numeric values that have been discretized. 이러한 값은 불연속화 버킷을 나타내는 서식 있는 문자열이 됩니다.The value will be a formatted string that describes the discretization buckets.
66 기존Existing 특성에 연속 숫자 값이 포함되어 있고 이러한 값이 누락 또는 유추된 데이터 및 값에 제공되었음을 나타냅니다.Indicates that the attribute has continuous numeric values and that values have been supplied in the data, vs. values that are missing or inferred.
77 계수Coefficient 계수를 나타내는 숫자 값을 가리킵니다.Indicates a numeric value that represents a coefficient.

계수는 종속 변수의 값을 계산할 때 적용되는 값입니다.A coefficient is a value that is applied when calculating the value of the dependent variable. 예를 들어 모델에서 나이를 기반으로 소득을 예측하는 회귀 수식을 만들면 나이와 소득을 연결하는 수식에 계수가 사용됩니다.For example, if your model creates a regression formula that predicts income based on age, the coefficient is used in the formula that relates age to income.
88 득점Score gain 특성의 득점을 나타내는 숫자 값을 가리킵니다.Indicates a numeric value that represents score gain for an attribute.
99 통계Statistics 회귀 변수의 통계를 나타내는 숫자 값을 가리킵니다.Indicates a numeric value that represents a statistic for a regressor.
1010 노드 고유 이름Node unique name 값이 숫자나 문자열로 처리되지 않고 모델에 있는 다른 내용 노드의 고유 식별자로 처리되어야 함을 나타냅니다.Indicates that the value should not be handled not as numeric or string, but as the unique identifier of another content node in a model.

예를 들어 신경망 모델에서 ID는 출력 계층의 노드에서 숨겨진 계층의 노드를 가리키는 포인터와 숨겨진 계층의 노드에서 입력 계층의 노드를 가리키는 포인터를 제공합니다.For example, in a neural network model, the IDs provide pointers from nodes in the output layer to nodes in the hidden layer, and from nodes in the hidden layer to nodes in the input layer.
1111 가로채기Intercept 회기 수식의 가로채기를 나타내는 숫자 값을 가리킵니다.Indicates a numeric value that represents the intercept in a regression formula.
1212 주기성Periodicity 값이 모델의 주기 구조를 나타냄을 가리킵니다.Indicates that the value denotes a periodic structure in a model.

ARIMA 모델이 포함된 시계열 모델에만 적용됩니다.Applies only to time series models that contain an ARIMA model.

참고: Microsoft 시계열 알고리즘은 자동으로 학습 데이터를 기반으로 주기 구조를 검색합니다.Note: The Microsoft Time Series algorithm automatically detects periodic structures based on the training data. 따라서 최종 모델의 예측에는 모델을 만들 때 매개 변수로 제공하지 않은 주기성 값이 포함될 수 있습니다.As a result, the periodicities in the final model may include periodicity values that you did not provide as a parameter when creating the model.
1313 자동 회귀 순서Autoregressive order 값이 자동 회귀 계열의 개수를 나타냄을 가리킵니다.Indicates that the value represents the number of autoregressive series.

ARIMA 알고리즘을 사용하는 시계열 모델에 적용됩니다.Applies to time series models that use the ARIMA algorithm.
1414 이동 평균 순서Moving average order 계열의 이동 평균 수를 나타내는 값을 가리킵니다.Represents a value that represents the number of moving averages in a series.

ARIMA 알고리즘을 사용하는 시계열 모델에 적용됩니다.Applies to time series models that use the ARIMA algorithm.
1515 차이 순서Difference order 값이 계열이 차별화되는 횟수를 가리키는 값임을 나타냅니다.Indicates that the value represents a value that indicates how many times the series is differentiated.

ARIMA 알고리즘을 사용하는 시계열 모델에 적용됩니다.Applies to time series models that use the ARIMA algorithm.
1616 BooleanBoolean 부울 유형을 나타냅니다.Represents a Boolean type.
1717 기타Other 알고리즘을 통해 정의된 사용자 지정 값을 나타냅니다.Represents a custom value defined by the algorithm.
1818 미리 렌더링된 문자열Prerendered string 알고리즘을 통해 문자열로 렌더링되는 사용자 지정 값을 나타냅니다.Represents a custom value that the algorithm renders as a string. 개체 모델에 의해 서식이 적용되지 않았습니다.No formatting was applied by the object model.

값 형식은 ADMOMD.NET 열거형에서 파생됩니다.The value types are derived from the ADMOMD.NET enumeration. 자세한 내용은 Microsoft.AnalysisServices.AdomdServer.MiningValueType가 포함됩니다.For more information, see Microsoft.AnalysisServices.AdomdServer.MiningValueType.

노드 점수Node Score

노드 점수 관리는 모델 유형에 따라 다르며 노드 유형의 영향을 받을 수도 있습니다.The meaning of the node score differs depending on the model type, and can be specific to the node type as well. 각 모델 및 노드 유형에 따라 NODE_SCORE가 계산되는 방법은 알고리즘 유형별 마이닝 모델 콘텐츠를 참조하세요.For information about how NODE_SCORE is calculated for each model and node type, see Mining Model Content by Algorithm Type.

노드 확률 및 한계 확률Node Probability and Marginal Probability

마이닝 모델 스키마 행 집합에는 모든 모델 유형에 대해 NODE_PROBABILITY 및 MARGINAL_PROBABILITY 열이 포함됩니다.The mining model schema rowset includes the columns NODE_PROBABILITY and MARGINAL_PROBABILITY for all model types. 이러한 열에는 확률 값이 중요한 노드의 값만 포함됩니다.These columns contain values only in nodes where a probability value is meaningful. 예를 들어 모델의 루트 노드에는 확률 점수가 포함되지 않습니다.For example, the root node of a model never contains a probability score.

확률 점수를 제공하는 노드에서는 노드 확률과 한계 확률이 서로 다른 계산을 나타냅니다.In those nodes that do provide probability scores, the node probability and marginal probabilities represent different calculations.

  • 한계 확률 은 부모 노드에서 해당 노드에 도달할 확률입니다.Marginal probability is the probability of reaching the node from its parent.

  • 노드 확률 은 루트에서 해당 노드에 도달할 확률입니다.Node probability is the probability of reaching the node from the root.

  • 노드 확률 은 항상 한계 확률보다 작거나 같습니다.Node probability is always less than or equal to marginal probability.

    예를 들어 의사 결정 트리에 있는 모든 고객의 모집단을 누락된 값 없이 성별로 균등하게 나누면 자식 노드의 확률은 .5가 되어야 합니다.For example, if the population of all customers in a decision tree is split equally by gender (and no values are missing), the probability of the child nodes should be .5. 그러나 각 성별 노드가 소득에 따라 균등하게 높음, 보통, 낮음으로 나뉘어졌다고 가정할 경우However, suppose that each of the nodes for gender is divided equally by income levels—High, Medium, and Low. 각 자식 노드의 MARGINAL_PROBABILITY 점수는 항상 .33이어야 하지만 NODE_PROBABILTY 값이 해당 노드를 가리키는 모든 확률의 곱한 값이 되어 항상 MARGINAL_PROBABILITY 값보다 작습니다.In this case the MARGINAL_PROBABILITY score for each child node should always be .33 but the NODE_PROBABILTY value will be the product of all probabilities leading to that node and thus always less than the MARGINAL_PROBABILITY value.

노드 수준/특성 및 값Level of node/attribute and value 한계 확률Marginal probability 노드 확률Node probability
모델 루트Model root

모든 대상 고객All target customers
11 11
성별로 나눈 대상 고객Target customers split by gender .5.5 .5.5
성별로 나누고 다시 소득에 따라 세 가지로 나눈 대상 고객Target customers split by gender, and split again three ways by income .33.33 .5 * .33 = .165.5 * .33 = .165

노드 규칙 및 한계 규칙Node Rule and Marginal Rule

마이닝 모델 스키마 행 집합에는 모든 모델 유형에 대해 NODE_RULE 및 MARGINAL_RULE 열도 포함됩니다.The mining model schema rowset also includes the columns NODE_RULE and MARGINAL_RULE for all model types. 이러한 열에는 모델을 직렬화하고 모델 구조의 특정 부분을 나타내는 데 사용할 수 있는 XML 조각이 포함됩니다.These columns contain XML fragments that can be used to serialize a model, or to represent some part of the model structure. 이러한 열은 값이 의미가 없을 경우 일부 노드에 대해 비워 둘 수 있습니다.These columns may be blank for some nodes, if a value would be meaningless.

위 두 가지 종류의 확률 값과 유사한 두 가지 종류의 XML 규칙이 제공됩니다.Two kinds of XML rules are provided, similar to the two kinds of probability values. MARGINAL_RULE의 XML 조각은 현재 노드의 특성과 값을 정의하는 반면 NODE_RULE의 XML 조각은 모델 루트에서 현재 노드까지의 경로를 나타냅니다.The XML fragment in MARGINAL_RULE defines the attribute and value for the current node, whereas the XML fragment in NODE_RULE describes the path to the current node from the model root.

알고리즘 유형별 마이닝 모델 콘텐츠Mining Model Content by Algorithm Type

각 알고리즘은 콘텐츠 스키마의 일부로 서로 다른 유형의 정보를 저장합니다.Each algorithm stores different types of information as part of its content schema. 예를 들어 MicrosoftMicrosoft 클러스터링 알고리즘은 각각 가능한 클러스터를 나타내는 많은 자식 노드를 생성합니다.For example, the MicrosoftMicrosoft Clustering Algorithm generates many child nodes, each of which represents a possible cluster. 각 클러스터 노드에는 클러스터의 항목에서 공유하는 특성을 나타내는 규칙이 포함됩니다.Each cluster node contains rules that describe characteristics shared by items in the cluster. 반면에 MicrosoftMicrosoft 선형 회귀 알고리즘은 자식 노드를 포함하지 않고 대신 모델의 부모 노드에 분석을 통해 발견된 선형 관계를 나타내는 수식이 포함됩니다.In contrast, the MicrosoftMicrosoft Linear Regression algorithm does not contain any child nodes; instead, the parent node for the model contains the equation that describes the linear relationship discovered by analysis.

다음 표에서는 각 알고리즘 유형에 대해 설명하는 항목에 대한 링크를 제공합니다.The following table provides links to topics for each type of algorithm.

  • 모델 콘텐츠 항목: 알고리즘 유형별로 각 노드의 의미를 설명하고 모델 유형에 따라 가장 적합한 노드에 대한 지침을 제공합니다.Model content topics: Explain the meaning of each node type for each algorithm type, and provide guidance about which nodes are of most interest in a particular model type.

  • 쿼리 항목: 특정 모델 유형에 대한 쿼리 예와 쿼리 결과를 해석하는 방법에 대한 지침을 제공합니다.Querying topics: Provide examples of queries against a particular model type and guidance on how to interpret the results.

알고리즘 또는 모델 유형Algorithm or Model Type 모델 콘텐츠Model Content 마이닝 모델 쿼리Querying Mining Models
연결 규칙 모델Association rules models 연결 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)Mining Model Content for Association Models (Analysis Services - Data Mining) 연결 모델 쿼리 예제Association Model Query Examples
클러스터링 모델Clustering models 의사 결정 트리 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)Mining Model Content for Decision Tree Models (Analysis Services - Data Mining) 클러스터링 모델 쿼리 예제Clustering Model Query Examples
의사 결정 트리 모델Decision trees model 의사 결정 트리 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)Mining Model Content for Decision Tree Models (Analysis Services - Data Mining) 의사 결정 트리 모델 쿼리 예제Decision Trees Model Query Examples
선형 회귀 모델Linear regression models 선형 회귀 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)Mining Model Content for Linear Regression Models (Analysis Services - Data Mining) 선형 회귀 모델 쿼리 예제Linear Regression Model Query Examples
로지스틱 회귀 모델Logistic regression models 로지스틱 회귀 분석 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)Mining Model Content for Logistic Regression Models (Analysis Services - Data Mining) 선형 회귀 모델 쿼리 예제Linear Regression Model Query Examples
Naïve Bayes 모델Naïve Bayes models Naive Bayes 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)Mining Model Content for Naive Bayes Models (Analysis Services - Data Mining) Naive Bayes 모델 쿼리 예제Naive Bayes Model Query Examples
신경망 모델Neural network models 신경망 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)Mining Model Content for Neural Network Models (Analysis Services - Data Mining) 신경망 모델 쿼리 예제Neural Network Model Query Examples
시퀀스 클러스터링Sequence clustering 시퀀스 클러스터링 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)Mining Model Content for Sequence Clustering Models (Analysis Services - Data Mining) 시퀀스 클러스터링 모델 쿼리 예제Sequence Clustering Model Query Examples
시계열 모델Time series models 시계열 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)Mining Model Content for Time Series Models (Analysis Services - Data Mining) 시계열 모델 쿼리 예제Time Series Model Query Examples

마이닝 모델 콘텐츠를 보기 위한 도구Tools for Viewing Mining Model Content

SQL Server Data Tools(SSDT)SQL Server Data Tools (SSDT)에서 모델을 찾아볼 경우 에서 사용할 수 있는 SQL Server Data Tools(SSDT)SQL Server Data Tools (SSDT) Microsoft 일반 콘텐츠 SQL Server Management StudioSQL Server Management Studio트리 뷰어에서 정보를 볼 수 있습니다.When you browse or explore a model in SQL Server Data Tools(SSDT)SQL Server Data Tools (SSDT), you can view the information in the Microsoft Generic Content Tree Viewer, which is available in both SQL Server Data Tools(SSDT)SQL Server Data Tools (SSDT) and SQL Server Management StudioSQL Server Management Studio.

MicrosoftMicrosoft 일반 콘텐츠 뷰어에는 마이닝 모델 콘텐츠 스키마 행 집합에서 사용할 수 있는 것과 동일한 정보를 사용하여 마이닝 모델 콘텐츠 스키마 행 집합의 열, 규칙, 속성, 특성, 노드 및 기타 콘텐츠가 표시됩니다.The MicrosoftMicrosoft Generic Content Viewer displays the columns, rules, properties, attributes, nodes, and other content from the model by using the same information that is available in the content schema rowset of the mining model. 콘텐츠 스키마 행 집합은 데이터 마이닝 모델의 콘텐츠에 대한 세부 정보를 나타내는 일반 프레임워크입니다.The content schema rowset is a generic framework for presenting detailed information about the content of a data mining model. 모델 콘텐츠는 계층적 행 집합을 지원하는 모든 클라이언트에서 볼 수 있습니다.You can view model content in any client that supports hierarchical rowsets. SQL Server Data Tools(SSDT)SQL Server Data Tools (SSDT) 의 뷰어에서는 작성한 모델의 구조를 보다 쉽게 이해할 수 있도록 모든 정보를 일관된 형식으로 나타내는 HTML 테이블 뷰어에 이 정보를 표시합니다.The viewer in SQL Server Data Tools(SSDT)SQL Server Data Tools (SSDT) presents this information in an HTML table viewer that represents all models in a consistent format, making it easier to understand the structure of the models that you create. 자세한 내용은 Microsoft 일반 콘텐츠 트리 뷰어를 사용하여 모델 찾아보기를 참조하세요.For more information, see Browse a Model Using the Microsoft Generic Content Tree Viewer.

마이닝 모델 콘텐츠를 쿼리하기 위한 도구Tools for Querying Mining Model Content

마이닝 모델 콘텐츠를 검색하려면 데이터 마이닝 모델에 대한 쿼리를 만들어야 합니다.To retrieve mining model content, you must create a query against the data mining model.

내용 쿼리를 만드는 가장 쉬운 방법은 SQL Server Management StudioSQL Server Management Studio에서 다음 DMX 문을 실행하는 것입니다.The easiest way to create a content query is to execute the following DMX statement in SQL Server Management StudioSQL Server Management Studio:

SELECT * FROM [<mining model name>].CONTENT  

자세한 내용은 데이터 마이닝 쿼리를 참조하세요.For more information, see Data Mining Queries.

또한 데이터 마이닝 스키마 행 집합을 사용하여 마이닝 모델 콘텐츠를 쿼리할 수도 있습니다.You can also query the mining model content by using the data mining schema rowsets. 스키마 행 집합은 클라이언트에서 마이닝 구조 및 모델에 대한 정보를 검색하고 쿼리하기 위해 사용하는 표준 구조입니다.A schema rowset is a standard structure that clients use to discover, browse, and query information about mining structures and models. 스키마 행 집합은 XMLA, Transact-SQL 또는 DMX 문을 사용하여 쿼리할 수 있습니다.You can query the schema rowsets by using XMLA, Transact-SQL, or DMX statements.

SQL Server 2017SQL Server 2017에서는 Analysis ServicesAnalysis Services 인스턴스에 대한 연결을 열고 시스템 테이블을 쿼리하여 데이터 마이닝 스키마 행 집합의 정보에 액세스할 수도 있습니다.In SQL Server 2017SQL Server 2017, you can also access the information in the data mining schema rowsets by opening a connection to the Analysis ServicesAnalysis Services instance and querying the system tables. 자세한 내용은 데이터 마이닝 스키마 행 집합(SSAs)을 참조하세요.For more information, see Data Mining Schema Rowsets (SSAs).

관련 항목:See Also

Microsoft 일반 콘텐츠 트리 뷰어(데이터 마이닝) Microsoft Generic Content Tree Viewer (Data Mining)
데이터 마이닝 알고리즘(Analysis Services - 데이터 마이닝)Data Mining Algorithms (Analysis Services - Data Mining)