PredictCaseLikelihood(DMX)PredictCaseLikelihood (DMX)

이 항목은 다음에 적용됩니다.예SQL Server(2008부터)아니요Azure SQL Database아니요Azure SQL Data Warehouse 아니요병렬 데이터 웨어하우스 THIS TOPIC APPLIES TO:yesSQL Server (starting with 2008)noAzure SQL DatabasenoAzure SQL Data Warehouse noParallel Data Warehouse

이 함수는 입력 사례가 기존 모델에 적합할 가능성을 반환합니다.This function returns the likelihood that an input case will fit in the existing model. 클러스터링 모델에서만 사용합니다.Used only with clustering models.

구문Syntax


PredictCaseLikelihood([NORMALIZED|NONNORMALIZED])  

인수Arguments

NORMALIZEDNORMALIZED
모델에 있는 사례의 확률을 모델이 없는 사례의 확률로 나눈 값이 반환됩니다.Return value contains the probability of the case within the model divided by the probability of the case without the model.

NONNORMALIZEDNONNORMALIZED
사례 특성의 확률을 곱한 값인 사례의 원시 확률이 반환됩니다.Return value contains the raw probability of the case, which is the product of the probabilities of the case attributes.

적용 대상Applies To

사용 하 여 작성 된 모델에는 MicrosoftMicrosoft 클러스터링 및 MicrosoftMicrosoft 시퀀스 클러스터링 알고리즘입니다.Models that are built by using the MicrosoftMicrosoft Clustering and MicrosoftMicrosoft Sequence Clustering algorithms.

반환 형식Return Type

0에서 1 사이의 배정밀도 부동 소수점 숫자입니다.Double-precision floating point number between 0 and 1. 1에 가까울수록 이 모델에 사례가 나타날 확률이 높음을 나타내고A number closer to 1 indicates that the case has a higher probability of occurring in this model. 0에 가까울수록 이 모델에 사례가 나타날 가능성이 낮음을 나타냅니다.A number closer to 0 indicates that the case is less likely to occur in this model.

주의Remarks

기본적으로의 결과 PredictCaseLikelihood 함수 정규화 됩니다.By default, the result of the PredictCaseLikelihood function is normalized. 일반적으로 정규화된 값은 사례 증가에 있는 특성 수와 두 사례의 원시 확률 간 차이가 작을수록 더 유용합니다.Normalized values are typically more useful as the number of attributes in a case increase and the differences between the raw probabilities of any two cases become much smaller.

다음 수식은 x와 y가 제공될 경우 정규화된 값을 계산하는 데 사용됩니다.The following equation is used to calculate the normalized values, given x and y:

  • x = 클러스터링 모델을 기반으로 하는 사례가 나타날 가능성x = likelihood of the case based on the clustering model

  • y = 학습 사례 수를 기반으로 하는 사례의 로그 유사도로 계산되는 한계 사례가 나타날 가능성y = Marginal case likelihood, calculated as the log likelihood of the case based on counting the training cases

  • Z = Exp( log(x) – Log(Y))Z = Exp( log(x) – Log(Y))

    정규화 된 = (z / (1 + z))Normalized = (z/ (1+z))

Examples

다음 예에서는 Adventure WorksAdventure Works DW 데이터베이스를 기반으로 하는 클러스터링 모델에 지정한 사례가 나타날 가능성을 반환합니다.The following example returns the likelihood that the specified case will occur within the clustering model, which is based on the Adventure WorksAdventure Works DW database.

SELECT  
  PredictCaseLikelihood() AS Default_Likelihood,  
  PredictCaseLikelihood(NORMALIZED) AS Normalized_Likelihood,  
  PredictCaseLikelihood(NONNORMALIZED) AS Raw_Likelihood,  
FROM  
  [TM Clustering]  
NATURAL PREDICTION JOIN  
(SELECT 28 AS [Age],  
  '2-5 Miles' AS [Commute Distance],  
  'Graduate Degree' AS [Education],  
  0 AS [Number Cars Owned],  
  0 AS [Number Children At Home]) AS t  

예상 결과:Expected results:

Default_LikelihoodDefault_Likelihood Normalized_LikelihoodNormalized_Likelihood Raw_LikelihoodRaw_Likelihood
6.30672792729321E-086.30672792729321E-08 6.30672792729321E-086.30672792729321E-08 9.5824454056846E-489.5824454056846E-48

이러한 결과 간의 차이는 정규화의 효과를 보여 줍니다.The difference between these results demonstrates the effect of normalization. 에 대 한 원시 값 CaseLikelihood 제안 사례의 확률은 약 20%; 그러나 결과 정규화 됩니다는 사례가 나타날 가능성은 거의 분명 합니다.The raw value for CaseLikelihood suggests that the probability of the case is about 20 percent; however, when you normalize the results, it becomes apparent that the likelihood of the case is very low.

관련 항목:See Also

데이터 마이닝 알고리즘(Analysis Services - 데이터 마이닝) Data Mining Algorithms (Analysis Services - Data Mining)
Data Mining Extensions ( DMX ) 함수 참조 Data Mining Extensions (DMX) Function Reference
함수 ( DMX ) Functions (DMX)
일반 예측 함수 ( DMX )General Prediction Functions (DMX)