ClusterDistance(DMX)ClusterDistance (DMX)

적용 대상:예SQL Server Analysis Services아니요Azure Analysis ServicesAPPLIES TO:yesSQL Server Analysis ServicesnoAzure Analysis Services

ClusterDistance 함수 지정 된 클러스터에서는 입력 사례 사이의 거리를 반환 하거나 입력된 사례와 가장 가능성 있는 클러스터에서 사용 가능한 클러스터 지정 합니다.The ClusterDistance function returns the distance of the input case from the specified cluster, or if no cluster is specified, the distance of the input case from the most likely cluster.

구문Syntax


ClusterDistance([<ClusterID expression>])  

적용 대상Applies To

이 함수는 기본 데이터 마이닝 모델이 클러스터링을 지원할 때만 사용할 수 있습니다.This function can be used only if the underlying data mining model supports clustering. 이 함수는 EM과 K-Means를 비롯한 모든 종류의 클러스터링 모델과 함께 사용할 수 있지만 알고리즘에 따라 결과가 달라집니다.The function can be used with any kind of clustering model (EM, K-Means, etc.), but the results differ depending on the algorithm.

반환 형식Return Type

스칼라 값A scalar value.

주의Remarks

ClusterDistance 함수는 입력된 사례와 입력 사례에 대 한 확률이 가장 높은 클러스터 사이의 거리를 반환 합니다.The ClusterDistance function returns the distance between the input case and the cluster that has the highest probability for that input case.

K-Means 클러스터링의 경우 모든 사례는 멤버 자격 가중치가 1.0인 하나의 클러스터에만 속할 수 있으므로 클러스터 거리는 항상 0입니다.In case of K-Means clustering, since any case can belong to only one cluster, with a membership weight of 1.0, the cluster distance is always 0. 그러나 K-Means에서는 각 클러스터에 중심이 있는 것으로 간주됩니다.However, in K-Means, each cluster is assumed to have a centroid. 마이닝 모델 콘텐츠에서 NODE_DISTRIBUTION 중첩 테이블을 쿼리하거나 탐색하면 중심 값을 가져올 수 있습니다.You can obtain the value of the centroid by querying or browsing the NODE_DISTRIBUTION nested table in the mining model content. 자세한 내용은 클러스터링 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)를 참조하세요.For more information, see Mining Model Content for Clustering Models (Analysis Services - Data Mining).

기본 EM 클러스터링 모델의 경우 클러스터 내부에 있는 모든 점의 확률이 같은 것으로 간주되므로 클러스터에 중심이 없습니다.In the case of the default EM clustering method, all the points inside the cluster are considered equally likely; therefore, by design there is no centroid for the cluster. ClusterDistance 특정 사례와 특정 클러스터 간의 N 다음과 같이 계산 됩니다.The value of ClusterDistance between a particular case and a particular cluster N is calculated as follows:

ClusterDistance(N) =1–(membershipWeight(N))ClusterDistance(N) =1–(membershipWeight(N))

또는Or:

ClusterDistance(N) = 1 – ClusterProbability (N))ClusterDistance(N) =1–ClusterProbability (N))

Analysis ServicesAnalysis Services에서는 클러스터링 모델을 쿼리하는 다음과 같은 함수를 추가로 제공합니다. provides the following additional functions for querying clustering models:

  • 사용 하 여는 클러스터 ( DMX ) 가장 가능성이 높은 클러스터를 반환 하는 함수입니다.Use the Cluster (DMX) function to return the most likely cluster.

  • 사용 하 여는 ClusterProbability ( DMX ) 사례가 특정 클러스터에 속할 확률을 가져오는 함수를 합니다.Use the ClusterProbability (DMX) function to get the probability that a case belongs to a particular cluster. 이 값은 클러스터 거리의 역수가 됩니다.This value serves as the inverse of the cluster distance.

  • 사용 하 여는 PredictHistogram ( DMX ) 함수를 모델의 클러스터의 각 입력 사례 기존 가능성의 히스토그램을 반환 합니다.Use the PredictHistogram (DMX) function to return a histogram of the likelihood of the input case existing in each of the model’s clusters.

  • 사용 하 여는 PredictCaseLikelihood ( DMX ) 알고리즘에서 학습 된 모델을 고려할 때 존재 한 가능성 입력된 사례를 나타내는 1로 0에서 측정값은 반환 하는 함수입니다.Use the PredictCaseLikelihood (DMX) function to return a measure from 0 to 1 that indicates how likely an input case is to exist considering the model learned by the algorithm.

예제 1: 가장 가능성이 높은 클러스터 클러스터 거리 가져오기Example1: Obtaining Cluster Distance to the Most Likely Cluster

다음 예에서는 지정된 사례와 해당 사례가 속할 가능성이 가장 높은 클러스터 사이의 거리를 반환합니다.The following example returns the distance from the specified case to the cluster that the case most likely belongs to.

SELECT  
    ClusterDistance()  
FROM  
    [TM Clustering]  
NATURAL PREDICTION JOIN  
(SELECT 28 AS [Age],  
    '2-5 Miles' AS [Commute Distance],  
    'Graduate Degree' AS [Education],  
    0 AS [Number Cars Owned],  
    0 AS [Number Children At Home]) AS t  

예제 결과:Example results:

Expression
0.04773909307051450.0477390930705145

가장 가능성 있는 클러스터를 확인하려면 위 예제에서 ClusterClusterDistance로 바꿉니다.To find out which cluster this is, you can substitute Cluster for ClusterDistance in the preceding sample.

예제 결과:Example results:

$CLUSTER$CLUSTER
클러스터 6Cluster 6

Example2: 지정된 된 클러스터 까지의 거리 가져오기Example2: Obtaining Distance to a Specified Cluster

다음 구문은 마이닝 모델 콘텐츠 스키마 행 집합을 사용하여 마이닝 모델의 클러스터에 대한 노드 ID 및 노드 캡션의 목록을 반환합니다.The following syntax uses the mining model content schema rowset to return the list of node IDs and node captions for the clusters in the mining model. 노드 캡션의 클러스터 식별자 인수로 사용할 수 있습니다는 ClusterDistance 함수입니다.You can then use the node caption as the cluster identifier argument in the ClusterDistance function.

SELECT NODE_UNIQUE_NAME, NODE_CAPTION   
FROM <model>.CONTENT   
WHERE NODE_TYPE = 5  

예제 결과:Example results:

NODE_UNIQUE_NAMENODE_UNIQUE_NAME NODE_CAPTIONNODE_CAPTION
001001 클러스터 1Cluster 1
002002 클러스터 2Cluster 2

다음 구문 예에서는 지정된 사례와 Cluster 2라는 클러스터 사이의 거리를 반환합니다.The following syntax example returns the distance of the specified case from the cluster labeled Cluster 2.

SELECT  
    ClusterDistance('Cluster 2')  
AS [Cluster 2 Distance]  
FROM [TM Clustering]  
NATURAL PREDICTION JOIN  
(SELECT 28 AS [Age],  
    '2-5 Miles' AS [Commute Distance],  
    'Graduate Degree' AS [Education],  
    0 AS [Number Cars Owned],  
    0 AS [Number Children At Home]) AS t  

예제 결과:Example results:

Cluster 2 DistanceCluster 2 Distance
0.970082092363940.97008209236394

관련 항목:See Also

클러스터 ( DMX ) Cluster (DMX)
Data Mining Extensions ( DMX ) 함수 참조 Data Mining Extensions (DMX) Function Reference
함수 ( DMX ) Functions (DMX)
클러스터링 모델 (에 대 한 마이닝 모델 콘텐츠 Analysis Services-데이터 마이닝 )Mining Model Content for Clustering Models (Analysis Services - Data Mining)