로지스틱 회귀 모델에 대한 모델 콘텐츠Mining Model Content for Logistic Regression Models

이 항목에서는 Microsoft 로지스틱 회귀 알고리즘을 사용하는 모델만의 마이닝 모델 콘텐츠에 대해 설명합니다.This topic describes mining model content that is specific to models that use the Microsoft Logistic Regression algorithm. 모든 모델 유형에서 공유하는 통계 및 구조를 해석하는 방법에 대한 설명은 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)를 참조하세요.For an explanation of how to interpret statistics and structure shared by all model types, and general definitions of terms related to mining model content, see Mining Model Content (Analysis Services - Data Mining).

로지스틱 회귀 모델의 구조 이해Understanding the Structure of a Logistic Regression Model

로지스틱 회귀 모델은 Microsoft 신경망 알고리즘과 숨겨진 노드를 제거하도록 모델을 제한하는 매개 변수를 사용하여 만듭니다.A logistic regression model is created by using the Microsoft Neural Network algorithm with parameters that constrain the model to eliminate the hidden node. 따라서 로지스틱 회귀 모델의 전체 구조는 신경망 모델의 구조와 거의 동일합니다. 즉, 각 모델에는 모델 및 해당 메타데이터를 나타내는 단일 부모 노드와 모델에 사용된 입력에 대한 기술 통계를 제공하는 특수한 한계 통계 노드(NODE_TYPE = 24)가 있습니다.Therefore, the overall structure of a logistic regression model is almost identical to that of a neural network: each model has a single parent node that represents the model and its metadata, and a special marginal statistics node (NODE_TYPE = 24) that provides descriptive statistics about the inputs used in the model.

또한 모델에는 예측 가능한 각 특성에 대한 하위 네트워크(NODE_TYPE = 17)가 포함되어 있습니다.Additionally, the model contains a subnetwork (NODE_TYPE = 17) for each predictable attribute. 신경망 모델에서와 마찬가지로 각 하위 네트워크에는 항상 두 개의 분기가 포함됩니다. 하나는 입력 계층에 대한 분기이고 숨겨진 계층(NODE_TYPE = 19) 및 출력 계층(NODE_TYPE = 20)이 포함된 다른 분기는 네트워크에 대한 분기입니다.Just like in a neural network model, each subnetwork always contains two branches: one for the input layer, and another branch that contains the hidden layer (NODE_TYPE = 19) and the output layer (NODE_TYPE = 20) for the network. 여러 특성이 예측 전용으로 지정된 경우 이들 특성에 동일한 하위 네트워크를 사용할 수 있습니다.The same subnetwork may be used for multiple attributes if they are specified as predict-only. 예측 가능한 특성이면서 동시에 입력 특성이기도 한 특성은 동일한 하위 네트워크에 나타나지 않을 수 있습니다.Predictable attributes that are also inputs may not appear in the same subnetwork.

그러나 로지스틱 회귀 모델에서는 숨겨진 계층을 나타내는 노드가 비어 있으며 자식이 없습니다.However, in a logistic regression model, the node that represents the hidden layer is empty, and has no children. 따라서 모델에는 개별 출력(NODE_TYPE = 23) 및 개별 입력(NODE_TYPE = 21)을 나타내는 노드만 있고 숨겨진 개별 노드는 없습니다.Therefore the model contains nodes that represent individual outputs (NODE_TYPE = 23) and individual inputs (NODE_TYPE = 21) but no individual hidden nodes.

로지스틱 회귀 모델에 대 한 콘텐츠 구조structure of content for logisitc regression model

기본적으로 로지스틱 회귀 모델은 Microsoft 신경망 뷰어에 표시됩니다.By default, a logistic regression model is displayed in the Microsoft Neural Network Viewer. 이 사용자 지정 뷰어를 사용하면 입력 특성과 해당 값을 필터링하고 이러한 항목이 출력에 주는 영향을 그래픽으로 볼 수 있습니다.With this custom viewer, you can filter on input attributes and their values, and graphically see how they affect the outputs. 뷰어의 도구 설명에는 각 입력 및 출력 값 쌍과 연결된 확률 및 리프트가 표시됩니다.The tooltips in the viewer show you the probability and lift associated with each pair of inputs and output values. 자세한 내용은 Microsoft 신경망 뷰어를 사용하여 모델 찾아보기를 참조하세요.For more information, see Browse a Model Using the Microsoft Neural Network Viewer.

입력 및 하위 네트워크의 구조를 탐색하고 자세한 통계를 보려면 Microsoft 일반 콘텐츠 트리 뷰어를 사용합니다.To explore the structure of the inputs and subnetworks, and to see detailed statistics, you can use the Microsoft Generic Content Tree viewer. 임의의 노드를 클릭하여 확장한 후 자식 노드를 보거나 노드에 포함된 가중치 및 기타 통계를 볼 수 있습니다.You can click on any node to expand it and see the child nodes, or view the weights and other statistics contained in the node.

로지스틱 회귀 모델에 대한 모델 콘텐츠Model Content for a Logistic Regression Model

이 섹션에서는 로지스틱 회귀와 특별히 관련된 마이닝 모델 콘텐츠 열에 대한 세부 정보 및 예만 제공합니다.This section provides detail and examples only for those columns in the mining model content that have particular relevance for logistic regression. 로지스틱 회귀 모델 콘텐츠는 신경망 모델 콘텐츠와 거의 동일하지만 편의상 신경망 모델에 적용되는 설명이 이 표에서 반복될 수 있습니다.The model content is almost identical to that of a neural network model, but descriptions that apply to neural network models may be repeated in this table for convenience.

MODEL_CATALOG와 MODEL_NAME을 비롯하여 여기에 설명되지 않은 스키마 행 집합의 범용 열에 대한 자세한 내용 또는 마이닝 모델 용어에 대한 자세한 내용은 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)를 참조하세요.For information about general-purpose columns in the schema rowset, such as MODEL_CATALOG and MODEL_NAME, that are not described here, or for explanations of mining model terminology, see Mining Model Content (Analysis Services - Data Mining).

MODEL_CATALOGMODEL_CATALOG
모델이 저장되는 데이터베이스의 이름입니다.Name of the database where the model is stored.

MODEL_NAMEMODEL_NAME
모델의 이름입니다.Name of the model.

ATTRIBUTE_NAMEATTRIBUTE_NAME
이 노드에 해당하는 특성의 이름입니다.The names of the attribute that corresponds to this node.

노드Node 콘텐츠Content
모델 루트Model root 비어 있음Blank
한계 통계Marginal statistics 비어 있음Blank
입력 계층Input layer 비어 있음Blank
입력 노드Input node 입력 특성 이름Input attribute name
숨겨진 계층Hidden layer 비어 있음Blank
출력 계층Output layer 비어 있음Blank
출력 노드Output node 출력 특성 이름Output attribute name

NODE_NAMENODE_NAME
노드 이름입니다.The name of the node. 현재 이 열은 NODE_UNIQUE_NAME과 동일한 값을 포함하지만 이는 이후 릴리스에서 변경될 수 있습니다.Currently, this column contains the same value as NODE_UNIQUE_NAME, though this may change in future releases.

NODE_UNIQUE_NAMENODE_UNIQUE_NAME
노드의 고유한 이름입니다.The unique name of the node.

이름과 ID가 모델에 대한 구조 정보를 반영하는 방식에 대한 자세한 내용은 노드 이름 및 ID 사용섹션을 참조하세요.For more information about how the names and IDs provide structural information about the model, see the section, Using Node Names and IDs.

NODE_TYPENODE_TYPE
로지스틱 회귀 모델이 출력하는 노드 유형은 다음과 같습니다.A logistic regression model outputs the following node types:

노드 유형 IDNode Type ID DescriptionDescription
1.1 모델Model.
1717 하위 네트워크의 구성 도우미 노드Organizer node for the subnetwork.
1818 입력 계층의 구성 도우미 노드Organizer node for the input layer.
1919 숨겨진 계층의 구성 도우미 노드.Organizer node for the hidden layer. 숨겨진 계층은 비어 있습니다.The hidden layer is empty.
2020 출력 계층의 구성 도우미 노드Organizer node for the output layer.
2121 입력 특성 노드Input attribute node.
2323 출력 특성 노드Output attribute node.
2424 한계 통계 노드Marginal statistics node.

NODE_CAPTIONNODE_CAPTION
노드와 연결된 레이블 또는 캡션입니다.A label or a caption associated with the node. 로지스틱 회귀 모델에서는 항상 비어 있습니다.In logistic regression models, always blank.

CHILDREN_CARDINALITYCHILDREN_CARDINALITY
노드에 있는 예상 자식 수입니다.An estimate of the number of children that the node has.

노드Node 콘텐츠Content
모델 루트Model root 한 개 이상의 네트워크, 한 개의 필수 한계 노드 및 한 개의 필수 입력 계층을 포함하는 자식 노드의 수를 나타냅니다.Indicates the count of child nodes, which includes at least 1 network, 1 required marginal node, and 1 required input layer. 예를 들어 값이 5인 경우 3개의 하위 네트워크가 있습니다.For example, if the value is 5, there are 3 subnetworks.
한계 통계Marginal statistics 항상 0입니다.Always 0.
입력 계층Input layer 모델에 사용된 입력 특성-값 쌍의 수를 나타냅니다.Indicates the number of input attribute-values pairs that were used by the model.
입력 노드Input node 항상 0입니다.Always 0.
숨겨진 계층Hidden layer 로지스틱 회귀 모델에서는 항상 0입니다.In a logistic regression model, always 0.
출력 계층Output layer 출력 값의 수를 나타냅니다.Indicates the number of output values.
출력 노드Output node 항상 0입니다.Always 0.

PARENT_UNIQUE_NAMEPARENT_UNIQUE_NAME
노드 부모의 고유한 이름입니다.The unique name of the node's parent. 루트 수준의 모든 노드에 대해서 NULL이 반환됩니다.NULL is returned for any nodes at the root level.

이름과 ID가 모델에 대한 구조 정보를 반영하는 방식에 대한 자세한 내용은 노드 이름 및 ID 사용섹션을 참조하세요.For more information about how the names and IDs provide structural information about the model, see the section, Using Node Names and IDs.

NODE_DESCRIPTIONNODE_DESCRIPTION
노드에 대한 알기 쉬운 설명입니다.A user-friendly description of the node.

노드Node 콘텐츠Content
모델 루트Model root 비어 있음Blank
한계 통계Marginal statistics 비어 있음Blank
입력 계층Input layer 비어 있음Blank
입력 노드Input node 입력 특성 이름Input attribute name
숨겨진 계층Hidden layer 비어 있음Blank
출력 계층Output layer 비어 있음Blank
출력 노드Output node 출력 특성이 연속 특성인 경우 출력 특성의 이름을 포함합니다.If the output attribute is continuous, contains the name of the output attribute.

출력 특성이 불연속 또는 불연속화된 특성인 경우 특성 이름 및 값을 포함합니다.If the output attribute is discrete or discretized, contains the name of the attribute and the value.

NODE_RULENODE_RULE
노드에 포함된 규칙에 대한 XML 설명입니다.An XML description of the rule that is embedded in the node.

노드Node 콘텐츠Content
모델 루트Model root 비어 있음Blank
한계 통계Marginal statistics 비어 있음Blank
입력 계층Input layer 비어 있음Blank
입력 노드Input node NODE_DESCRIPTION 열과 동일한 정보가 들어 있는 XML 조각입니다.An XML fragment containing the same information as the NODE_DESCRIPTION column.
숨겨진 계층Hidden layer 비어 있음Blank
출력 계층Output layer 비어 있음Blank
출력 노드Output node NODE_DESCRIPTION 열과 동일한 정보가 들어 있는 XML 조각입니다.An XML fragment containing the same information as the NODE_DESCRIPTION column.

MARGINAL_RULEMARGINAL_RULE
로지스틱 회귀 모델의 경우 항상 비어 있습니다.For logistic regression models, always blank.

NODE_PROBABILITYNODE_PROBABILITY
이 노드와 관련된 확률입니다.The probability associated with this node. 로지스틱 회귀 모델의 경우 항상 0입니다.For logistic regression models, always 0.

MARGINAL_PROBABILITYMARGINAL_PROBABILITY
부모 노드에서 해당 노드에 도달할 확률입니다.The probability of reaching the node from the parent node. 로지스틱 회귀 모델의 경우 항상 0입니다.For logistic regression models, always 0.

NODE_DISTRIBUTIONNODE_DISTRIBUTION
노드에 대한 통계 정보가 들어 있는 중첩 테이블입니다.A nested table that contains statistical information for the node. 각 노드 유형과 관련해서 이 테이블에 포함되는 내용에 대한 자세한 내용은 신경망 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)를 참조하세요.For detailed information about the contents of this table for each node type, see the section, Understanding the NODE_DISTRIBUTION Table, in Mining Model Content for Neural Network Models (Analysis Services - Data Mining).

NODE_SUPPORTNODE_SUPPORT
로지스틱 회귀 모델의 경우 항상 0입니다.For logistic regression models, always 0.

참고

이 모델 유형의 출력은 확률적이 아니므로 지지도 확률은 항상 0입니다.Support probabilities are always 0 because the output of this model type is not probabilistic. 이 알고리즘에 의미 있는 유일한 항목은 가중치이므로 이 알고리즘은 확률, 지지도 또는 분산을 계산하지 않습니다.The only thing that is meaningful for the algorithm is the weights; therefore, the algorithm does not compute probability, support, or variance.

특정 값에 대한 학습 사례의 지지도에 관한 정보를 보려면 한계 통계 노드를 참조하세요.To get information about the support in the training cases for specific values, see the marginal statistics node.

MSOLAP_MODEL_COLUMNMSOLAP_MODEL_COLUMN

노드Node 콘텐츠Content
모델 루트Model root 비어 있음Blank
한계 통계Marginal statistics 비어 있음Blank
입력 계층Input layer 비어 있음Blank
입력 노드Input node 입력 특성 이름Input attribute name.
숨겨진 계층Hidden layer 비어 있음Blank
출력 계층Output layer 비어 있음Blank
출력 노드Output node 입력 특성 이름Input attribute name.

MSOLAP_NODE_SCOREMSOLAP_NODE_SCORE
로지스틱 회귀 모델에서는 항상 0입니다.In logistic regression models, always 0.

MSOLAP_NODE_SHORT_CAPTIONMSOLAP_NODE_SHORT_CAPTION
로지스틱 회귀 모델에서는 항상 비어 있습니다.In logistic regression models, always blank.

노드 이름 및 ID 사용Using Node Names and IDs

로지스틱 회귀 모델의 노드 이름은 모델에 있는 노드 간의 관계에 대한 추가 정보를 제공합니다.The naming of the nodes in a logistic regression model provides additional information about the relationships between nodes in the model. 다음 표에서는 각 계층의 노드에 할당되는 ID의 규칙을 보여 줍니다.The following table shows the conventions for the IDs that are assigned to nodes in each layer.

노드 유형Node Type 노드 ID의 규칙Convention for node ID
모델 루트(1)Model root (1) 00000000000000000.00000000000000000.
한계 통계 노드(24)Marginal statistics node (24) 1000000000000000010000000000000000
입력 계층(18)Input layer (18) 3000000000000000030000000000000000
입력 노드(21)Input node (21) 60000000000000000에서 시작Starts at 60000000000000000
하위 네트워크(17)Subnetwork (17) 2000000000000000020000000000000000
숨겨진 계층(19)Hidden layer (19) 4000000000000000040000000000000000
출력 계층(20)Output layer (20) 5000000000000000050000000000000000
출력 노드(23)Output node (23) 80000000000000000에서 시작Starts at 80000000000000000

이러한 ID를 통해 출력 노드의 NODE_DISTRIBUTION 테이블을 보고 출력 특성과 특정 입력 계층 특성 간의 관계를 파악할 수 있습니다.You can use these IDs to determine how output attributes are related to specific input layer attributes, by viewing the NODE_DISTRIBUTION table of the output node. 해당 테이블의 각 행에는 다시 특정 입력 특성 노드를 가리키는 ID가 들어 있습니다.Each row in that table contains an ID that points back to a specific input attribute node. NODE_DISTRIBUTION 테이블에는 해당 입력-출력 쌍에 대한 계수도 들어 있습니다.The NODE_DISTRIBUTION table also contains the coefficient for that input-output pair.

관련 항목:See Also

Microsoft 로지스틱 회귀 알고리즘 Microsoft Logistic Regression Algorithm
신경망 모델 (에 대 한 마이닝 모델 콘텐츠 Analysis Services-데이터 마이닝 ) Mining Model Content for Neural Network Models (Analysis Services - Data Mining)
로지스틱 회귀 모델 쿼리 예제 Logistic Regression Model Query Examples
Microsoft 로지스틱 회귀 알고리즘 기술 참조Microsoft Logistic Regression Algorithm Technical Reference