데이터 마이닝 알고리즘(Analysis Services - 데이터 마이닝)Data Mining Algorithms (Analysis Services - Data Mining)

데이터 마이닝 알고리즘 (또는 기계 학습)은 데이터로부터 모델을 만드는 추론 및 계산 집합입니다.An algorithm in data mining (or machine learning) is a set of heuristics and calculations that creates a model from data. 모델을 만들기 위해 알고리즘은 제공된 데이터를 분석하여 특정 유형의 패턴 또는 추세를 찾습니다.To create a model, the algorithm first analyzes the data you provide, looking for specific types of patterns or trends. 알고리즘은 많은 반복을 통해 이 분석 결과를 사용하여 마이닝 모델을 만들기 위한 최적의 매개 변수를 찾습니다.The algorithm uses the results of this analysis over many iterations to find the optimal parameters for creating the mining model. 그런 다음 이러한 매개 변수를 전체 데이터 집합에 적용하여 동작 가능한 패턴과 자세한 통계를 추출합니다.These parameters are then applied across the entire data set to extract actionable patterns and detailed statistics.

알고리즘이 데이터로부터 만드는 마이닝 모델은 다음과 같은 다양한 형태가 될 수 있습니다.The mining model that an algorithm creates from your data can take various forms, including:

  • 데이터 집합의 사례 간 관계를 설명하는 일련의 클러스터A set of clusters that describe how the cases in a dataset are related.

  • 결과를 예측하고 각 조건이 결과에 미치는 영향을 설명하는 의사 결정 트리A decision tree that predicts an outcome, and describes how different criteria affect that outcome.

  • 판매를 예측하는 수학적 모델A mathematical model that forecasts sales.

  • 트랜잭션에서 제품이 그룹화되는 방법과 제품을 함께 구입할 확률을 설명하는 일련의 규칙A set of rules that describe how products are grouped together in a transaction, and the probabilities that products are purchased together.

    SQL ServerSQL Server 데이터 마이닝에 제공된 알고리즘은 데이터의 패턴을 파생하는, 가장 널리 사용되며 적절한 연구를 거친 메서드입니다.The algorithms provided in SQL ServerSQL Server Data Mining are the most popular, well-researched methods of deriving patterns from data. 한 가지 예를 들면 K-means 클러스터링은 가장 오래된 클러스터링 알고리즘 중 하나이며 다양한 구현 및 옵션과 함께 다양한 도구에서 광범위하게 사용할 수 있습니다.To take one example, K-means clustering is one of the oldest clustering algorithms and is available widely in many different tools and with many different implementations and options. 반면 SQL ServerSQL Server 데이터 마이닝에 사용되는 K-means 클러스터링의 특정 구현은 Microsoft Research에서 개발되어 Analysis ServicesAnalysis Services에서 성능이 최적화되었습니다.However, the particular implementation of K-means clustering used in SQL ServerSQL Server Data Mining was developed by Microsoft Research and then optimized for performance with Analysis ServicesAnalysis Services. 모든 Microsoft 데이터 마이닝 알고리즘은 제공된 API를 사용하여 광범위하게 사용자 지정하고 완전히 프로그래밍할 수 있습니다.All of the Microsoft data mining algorithms can be extensively customized and are fully programmable, using the provided APIs. Integration ServicesIntegration Services의 데이터 마이닝 구성 요소를 사용하여 모델 만들기, 교육 및 재학습을 자동화할 수도 있습니다.You can also automate the creation, training, and retraining of models by using the data mining components in Integration ServicesIntegration Services.

    OLE DB for Data Mining 사양을 준수하는 타사 알고리즘을 사용하거나 서비스로 등록한 다음 SQL ServerSQL Server 데이터 마이닝 프레임워크에서 사용할 수 있는 사용자 지정 알고리즘을 개발할 수도 있습니다.You can also use third-party algorithms that comply with the OLE DB for Data Mining specification, or develop custom algorithms that can be registered as services and then used within the SQL ServerSQL Server Data Mining framework.

알고리즘 선택Choosing the Right Algorithm

특정 분석 태스크에 적합한 알고리즘을 선택하는 것은 결코 쉽지 않습니다.Choosing the best algorithm to use for a specific analytical task can be a challenge. 동일한 비즈니스 태스크를 수행하기 위해 여러 알고리즘을 사용할 수 있지만 이렇게 하면 각 알고리즘에서 다른 결과를 생성하며 일부 알고리즘에서는 두 개 이상의 결과 유형을 생성할 수 있습니다.While you can use different algorithms to perform the same business task, each algorithm produces a different result, and some algorithms can produce more than one type of result. 예를 들어 의사 결정 트리가 최종 마이닝 모델에 영향을 미치지 않는 열을 식별할 수 있기 때문에 예측하거나 데이터 집합의 열 수를 줄이는 데 MicrosoftMicrosoft 의사 결정 트리 알고리즘을 사용할 수 있습니다.For example, you can use the MicrosoftMicrosoft Decision Trees algorithm not only for prediction, but also as a way to reduce the number of columns in a dataset, because the decision tree can identify columns that do not affect the final mining model.

유형별 알고리즘 선택Choosing an Algorithm by Type

SQL ServerSQL Server 데이터 마이닝에는 다음과 같은 알고리즘 유형이 포함되어 있습니다. Data Mining includes the following algorithm types:

  • 데이터 집합의 다른 특성을 기반으로 하나 이상의 불연속 변수를 예측하는분류 알고리즘 .Classification algorithms predict one or more discrete variables, based on the other attributes in the dataset.

  • 데이터 집합의 다른 특성을 기반으로 수익 또는 손실과 같은 하나 이상의 연속 변수를 예측하는회귀 알고리즘 .Regression algorithms predict one or more continuous numeric variables, such as profit or loss, based on other attributes in the dataset.

  • 데이터를 속성이 유사한 항목의 그룹 또는 클러스터로 나누는세그먼트화 알고리즘 .Segmentation algorithms divide data into groups, or clusters, of items that have similar properties.

  • 데이터 집합에 있는 여러 특성 사이의 상관 관계를 찾는연결 알고리즘 .Association algorithms find correlations between different attributes in a dataset. 이러한 종류의 알고리즘은 시장 바구니 분석에 사용할 수 있는 연결 규칙을 만드는 데 가장 일반적으로 적용됩니다.The most common application of this kind of algorithm is for creating association rules, which can be used in a market basket analysis.

  • 시퀀스 분석 알고리즘 은 웹 사이트에서 일련의 클릭 또는 컴퓨터 유지 관리 앞의 일련의 로그 이벤트와 같이 데이터에서 빈번한 시퀀스 또는 에피소드를 요약합니다.Sequence analysis algorithms summarize frequent sequences or episodes in data, such as a series of clicks in a web site, or a series of log events preceding machine maintenance.

    솔루션에서 알고리즘을 하나로 제한해야 할 이유는 없습니다.However, there is no reason that you should be limited to one algorithm in your solutions. 경험이 많은 분석가는 경우에 따라 하나의 알고리즘을 사용하여 가장 효율적인 입력(즉, 변수)을 결정하고, 다른 알고리즘을 적용하여 해당 데이터를 기반으로 특정 결과를 예측하기도 합니다.Experienced analysts will sometimes use one algorithm to determine the most effective inputs (that is, variables), and then apply a different algorithm to predict a specific outcome based on that data. SQL ServerSQL Server 데이터 마이닝을 사용하여 단일의 마이닝 구조에서 여러 모델을 작성할 수 있으므로, 단일 데이터 마이닝 솔루션에서 클러스터링 알고리즘, 의사 결정 트리 모델 및 Naïve Bayes 모델을 사용하여 데이터를 다양하게 표시할 수 있습니다. Data Mining lets you build multiple models on a single mining structure, so within a single data mining solution you could use a clustering algorithm, a decision trees model, and a Naïve Bayes model to get different views on your data. 또한 단일 솔루션 내에서 여러 알고리즘을 사용하여 별도 태스크를 수행할 수도 있습니다. 예를 들어 회귀를 사용하여 재무 예측을 가져오고, 신경망 알고리즘을 사용하여 예측에 영향을 주는 요소를 분석할 수 있습니다.You might also use multiple algorithms within a single solution to perform separate tasks: for example, you could use regression to obtain financial forecasts, and use a neural network algorithm to perform an analysis of factors that influence forecasts.

태스크별 알고리즘 선택Choosing an Algorithm by Task

특정 태스크에서 사용할 알고리즘을 선택하는 데 도움이 되도록 다음 표에서는 각 알고리즘이 일반적으로 사용되는 태스크 유형을 제안합니다.To help you select an algorithm for use with a specific task, the following table provides suggestions for the types of tasks for which each algorithm is traditionally used.

태스크 예Examples of tasks 사용할 Microsoft 알고리즘Microsoft algorithms to use
불연속 특성 예측:Predicting a discrete attribute:

잠재 구매자 목록에서 잠재 고객을 좋음 또는 나쁨 플래그로 지정합니다.Flag the customers in a prospective buyers list as good or poor prospects.

다음 6개월 이내에 서버가 실패할 확률을 계산합니다.Calculate the probability that a server will fail within the next 6 months.

환자 결과를 분류하고 관련 요인을 탐색합니다.Categorize patient outcomes and explore related factors.
Microsoft 의사 결정 트리 알고리즘Microsoft Decision Trees Algorithm

Microsoft Naive Bayes 알고리즘Microsoft Naive Bayes Algorithm

Microsoft 클러스터링 알고리즘Microsoft Clustering Algorithm

Microsoft 신경망 알고리즘Microsoft Neural Network Algorithm
연속 특성 예측:Predicting a continuous attribute:

내년 매출을 예측합니다.Forecast next year's sales.

과거 기록 및 계절별 추세를 고려하여 사이트 방문자를 예측합니다.Predict site visitors given past historical and seasonal trends.

인구 통계를 고려하여 위험 점수를 생성합니다.Generate a risk score given demographics.
Microsoft 의사 결정 트리 알고리즘Microsoft Decision Trees Algorithm

Microsoft 시계열 알고리즘Microsoft Time Series Algorithm

Microsoft 선형 회귀 알고리즘Microsoft Linear Regression Algorithm
시퀀스 예측:Predicting a sequence:

회사 웹 사이트의 클릭 동향 분석을 수행합니다.Perform clickstream analysis of a company's Web site.

서버 장애를 일으키는 요인을 분석합니다.Analyze the factors leading to server failure.

외래 환자가 내원 중에 수행하는 일련의 활동을 캡처한 후 분석하여 일반 활동에 대한 모범 사례를 공식화합니다.Capture and analyze sequences of activities during outpatient visits, to formulate best practices around common activities.
Microsoft 시퀀스 클러스터링 알고리즘Microsoft Sequence Clustering Algorithm
트랜잭션에서 공통 항목 그룹 찾기:Finding groups of common items in transactions:

시장 바구니 분석을 사용하여 제품 배치를 결정할 수 있습니다.Use market basket analysis to determine product placement.

구매 고객에게 추가 제품을 제안합니다.Suggest additional products to a customer for purchase.

이벤트에 대한 방문자의 설문 조사 데이터를 분석하여 상호 관련된 활동 또는 부스를 찾고 미래 활동을 계획합니다.Analyze survey data from visitors to an event, to find which activities or booths were correlated, to plan future activities.
Microsoft 연결 알고리즘Microsoft Association Algorithm

Microsoft 의사 결정 트리 알고리즘Microsoft Decision Trees Algorithm
유사 항목 그룹 찾기:Finding groups of similar items:

인구 통계, 동작 등과 같은 특성을 기반으로 환자 위험 프로필 그룹을 만듭니다.Create patient risk profiles groups based on attributes such as demographics and behaviors.

검색 및 구매 패턴별로 사용자를 분석합니다.Analyze users by browsing and buying patterns.

사용 특징이 유사한 서버를 식별합니다.Identify servers that have similar usage characteristics.
Microsoft 클러스터링 알고리즘Microsoft Clustering Algorithm

Microsoft 시퀀스 클러스터링 알고리즘Microsoft Sequence Clustering Algorithm

다음 표에서는 SQL ServerSQL Server 데이터 마이닝에 제공되는 각 데이터 마이닝 알고리즘에 대한 학습 리소스를 연결하는 링크를 제공합니다.The following table provides links to learning resources for each of the data mining algorithms that are provided in SQL ServerSQL Server Data Mining:

알고리즘 기본 사항 설명Basic algorithm description 알고리즘에서 수행하는 작업과 작업 방법을 설명하고 알고리즘이 유용할 수 있는 비즈니스 시나리오를 간략하게 설명합니다.Explains what the algorithm does and how it works, and outlines possible business scenarios where the algorithm might be useful.
Microsoft 연결 알고리즘Microsoft Association Algorithm

Microsoft 클러스터링 알고리즘Microsoft Clustering Algorithm

Microsoft 의사 결정 트리 알고리즘Microsoft Decision Trees Algorithm

Microsoft 선형 회귀 알고리즘Microsoft Linear Regression Algorithm

Microsoft 로지스틱 회귀 알고리즘Microsoft Logistic Regression Algorithm

Microsoft Naive Bayes 알고리즘Microsoft Naive Bayes Algorithm

Microsoft 신경망 알고리즘Microsoft Neural Network Algorithm

Microsoft 시퀀스 클러스터링 알고리즘Microsoft Sequence Clustering Algorithm

Microsoft 시계열 알고리즘Microsoft Time Series Algorithm
기술 참조Technical reference 알고리즘 구현에 대한 기술 정보를 제공하고 필요한 경우 학술 참조를 제공합니다.Provides technical detail about the implementation of the algorithm, with academic references as necessary. 알고리즘의 동작을 제어하고 모델 결과를 사용자 지정하기 위해 설정할 수 있는 매개 변수를 나열합니다.Lists the parameters that you can set to control the behavior of the algorithm and customize the results in the model. 데이터 요구 사항에 설명하고 가능한 경우 성능 팁을 제공합니다.Describes data requirements and provides performance tips if possible.
Microsoft 연결 알고리즘 기술 참조Microsoft Association Algorithm Technical Reference

Microsoft 클러스터링 알고리즘 기술 참조Microsoft Clustering Algorithm Technical Reference

Microsoft 의사 결정 트리 알고리즘 기술 참조Microsoft Decision Trees Algorithm Technical Reference

Microsoft 선형 회귀 알고리즘 기술 참조Microsoft Linear Regression Algorithm Technical Reference

Microsoft 로지스틱 회귀 알고리즘 기술 참조Microsoft Logistic Regression Algorithm Technical Reference

Microsoft Naive Bayes 알고리즘 기술 참조Microsoft Naive Bayes Algorithm Technical Reference

Microsoft 신경망 알고리즘 기술 참조Microsoft Neural Network Algorithm Technical Reference

Microsoft 시퀀스 클러스터링 알고리즘 기술 참조Microsoft Sequence Clustering Algorithm Technical Reference

Microsoft 시계열 알고리즘 기술 참조Microsoft Time Series Algorithm Technical Reference
모델 콘텐츠Model content 각 데이터 마이닝 모델 유형에서 정보가 구성되는 방법과 각 노드에 저장된 정보를 해석하는 방법을 설명합니다.Explains how information is structured within each type of data mining model, and explains how to interpret the information stored in each of the nodes.
연결 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)Mining Model Content for Association Models (Analysis Services - Data Mining)

클러스터링 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)Mining Model Content for Clustering Models (Analysis Services - Data Mining)

의사 결정 트리 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)Mining Model Content for Decision Tree Models (Analysis Services - Data Mining)

선형 회귀 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)Mining Model Content for Linear Regression Models (Analysis Services - Data Mining)

로지스틱 회귀 분석 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)Mining Model Content for Logistic Regression Models (Analysis Services - Data Mining)

Naive Bayes 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)Mining Model Content for Naive Bayes Models (Analysis Services - Data Mining)

신경망 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)Mining Model Content for Neural Network Models (Analysis Services - Data Mining)

시퀀스 클러스터링 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)Mining Model Content for Sequence Clustering Models (Analysis Services - Data Mining)

시계열 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)Mining Model Content for Time Series Models (Analysis Services - Data Mining)
데이터 마이닝 쿼리Data mining queries 각 모델 유형과 함께 사용할 수 있는 여러 쿼리를 제공합니다.Provides multiple queries that you can use with each model type. 모델의 패턴에 대해 알아 볼 수 있는 내용 쿼리 및 패턴을 기반으로 예측을 작성하는 데 도움이 되는 예측 쿼리 등을 예로 들 수 있습니다.Examples include content queries that let you learn more about the patterns in the model, and prediction queries to help you build predictions based on those patterns.
연결 모델 쿼리 예제Association Model Query Examples

클러스터링 모델 쿼리 예제Clustering Model Query Examples

의사 결정 트리 모델 쿼리 예제Decision Trees Model Query Examples

선형 회귀 모델 쿼리 예제Linear Regression Model Query Examples

로지스틱 회귀 모델 쿼리 예제Logistic Regression Model Query Examples

Naive Bayes 모델 쿼리 예제Naive Bayes Model Query Examples

신경망 모델 쿼리 예제Neural Network Model Query Examples

시퀀스 클러스터링 모델 쿼리 예제Sequence Clustering Model Query Examples

시계열 모델 쿼리 예제Time Series Model Query Examples
항목Topic DescriptionDescription
데이터 마이닝 모델에 사용되는 알고리즘 결정Determine the algorithm used by a data mining model 마이닝 모델을 만드는 데 사용한 매개 변수 쿼리Query the Parameters Used to Create a Mining Model
사용자 지정 플러그 인 알고리즘 만들기Create a Custom Plug-In Algorithm 플러그 인 알고리즘Plugin Algorithms
알고리즘별 뷰어를 사용하여 모델 탐색Explore a model using an algorithm-specific viewer 데이터 마이닝 모델 뷰어Data Mining Model Viewers
일반 테이블 형식을 사용하여 모델 내용 보기View the content of a model using a generic table format Microsoft 일반 콘텐츠 트리 뷰어를 사용하여 모델 찾아보기Browse a Model Using the Microsoft Generic Content Tree Viewer
데이터를 설정하고 알고리즘을 사용하여 모델을 만드는 방법에 대해 알아봅니다Learn about how to set up your data and use algorithms to create models 마이닝 구조(Analysis Services - 데이터 마이닝)Mining Structures (Analysis Services - Data Mining)

마이닝 모델(Analysis Services - 데이터 마이닝)Mining Models (Analysis Services - Data Mining)

관련 항목:See Also

데이터 마이닝 도구Data Mining Tools