데이터 마이닝 프로젝트Data Mining Projects

적용 대상:예SQL Server Analysis Services아니요Azure Analysis ServicesAPPLIES TO:yesSQL Server Analysis ServicesnoAzure Analysis Services데이터 마이닝 프로젝트의 일부인는 Analysis ServicesAnalysis Services 솔루션입니다. A data mining project is part of an Analysis ServicesAnalysis Services solution. 디자인 프로세스 중에 이 프로젝트에서 만든 개체를 작업 영역 데이터베이스의 일부로 테스트 및 쿼리할 수 있습니다.During the design process, the objects that you create in this project are available for testing and querying as part of a workspace database. 사용자가 프로젝트에서 개체를 쿼리하거나 찾아볼 수 있도록 하려면 다차원 모드로 실행되는 Analysis ServicesAnalysis Services 인스턴스에 프로젝트를 배포해야 합니다.When you want users to be able to query or browse the objects in the project, you must deploy the project to an instance of Analysis ServicesAnalysis Services running in multidimensional mode.

이 항목에서는 데이터 마이닝 프로젝트를 이해하고 만드는 데 필요한 기본 정보를 제공합니다.This topic provides you with the basic information needed to understand and create data mining projects.

데이터 마이닝 프로젝트 만들기Creating Data Mining Projects

데이터 마이닝 프로젝트의 개체Objects in Data Mining Projects

데이터 마이닝 프로젝트 만들기Creating Data Mining Projects

SQL Server Data Tools(SSDT)SQL Server Data Tools (SSDT)에서 OLAP 및 데이터 마이닝 프로젝트템플릿을 사용하여 데이터 마이닝 프로젝트를 작성할 수 있습니다.In SQL Server Data Tools(SSDT)SQL Server Data Tools (SSDT), you build data mining projects using the template, OLAP and Data Mining Project. 또한 AMO를 사용하여 프로그래밍 방식으로 데이터 마이닝 프로젝트를 만들 수 있습니다.You can also create data mining projects programmatically, by using AMO. ASSL(Analysis Services Scripting Language)을 사용하여 개별 데이터 마이닝 개체를 스크립팅할 수 있습니다.Individual data mining objects can be scripted using the Analysis Services Scripting language (ASSL). 자세한 내용은 다차원 모델 데이터 액세스(Analysis Services - 다차원 데이터)를 참조하세요.For more information, see Multidimensional Model Data Access (Analysis Services - Multidimensional Data).

기존 솔루션 내에 데이터 마이닝 개체를 만든 경우 해당 데이터 마이닝 개체는 기본적으로 솔루션 파일과 동일한 이름으로 Analysis ServicesAnalysis Services 데이터베이스에 배포됩니다.If you create a data mining project within an existing solution, by default the data mining objects will be deployed to an Analysis ServicesAnalysis Services database with the same name as the solution file. 보고서 속성 대화 상자를 사용하여 이 이름 및 대상 서버를 변경할 수 있습니다.You can change this name and the target server by using the Project Properties dialog box. 자세한 내용은 Analysis Services 프로젝트 속성 구성(SSDT)을 참조하세요.For more information, see Configure Analysis Services Project Properties (SSDT).

경고

프로젝트를 성공적으로 작성하고 배포하려면 OLAP/데이터 마이닝 모드로 실행되는 Analysis ServicesAnalysis Services 인스턴스에 대한 액세스 권한이 있어야 합니다.To successfully build and deploy your project, you must have access to an instance of Analysis ServicesAnalysis Services that is running in OLAP/Data Mining mode. 테이블 형식 모델을 지원하는 Analysis ServicesAnalysis Services 인스턴스에서는 데이터 마이닝 솔루션을 개발하거나 배포할 수 없으며, Power PivotPower Pivot 통합 문서 또는 메모리 내 데이터 저장소를 사용하는 테이블 형식 모델에서 직접 데이터를 사용할 수 없습니다.You cannot develop or deploy data mining solutions on an instance of Analysis ServicesAnalysis Services that supports tabular models, nor can you use data directly from a Power PivotPower Pivot workbook or from a tabular model that uses the in-memory data store. 사용 중인 Analysis ServicesAnalysis Services 인스턴스에서 데이터 마이닝을 지원할 수 있는지 확인하려면 Analysis Services 인스턴스의 서버 모드 확인을 참조하세요.To determine whether the instance of Analysis ServicesAnalysis Services that you have can support data mining, see Determine the Server Mode of an Analysis Services Instance.

만든 각 데이터 마이닝 프로젝트 내에서 다음 단계를 수행합니다.Within each data mining project that you create, you will follow these steps:

  1. 큐브, 데이터베이스 또는 Excel/텍스트 파일 등 모델을 작성하는 데 사용할 원시 데이터가 포함된 데이터 원본을 선택합니다.Choose a data source, such as a cube, database, or even Excel or text files, which contains the raw data you will use for building models.

  2. 데이터 원본에서 분석에 사용할 데이터 하위 집합을 정의하고 이를 데이터 원본 뷰로 저장합니다.Define a subset of the data in the data source to use for analysis, and save it as a data source view.

  3. 모델링을 지원할 마이닝 구조 를 정의합니다.Define a mining structure to support modeling.

  4. 알고리즘 을 선택하고 알고리즘에서 데이터를 처리하는 방법을 지정하여 마이닝 구조에 마이닝 모델 을 추가합니다.Add mining models to the mining structure, by choosing an algorithm and specifying how the algorithm will handle the data.

  5. 모델을 선택한 데이터 또는 필터링된 데이터 하위 집합으로 채워 모델을 학습합니다.Train models by populating them with the selected data, or a filtered subset of the data.

  6. 모델을 탐색하고 테스트하고 다시 작성합니다.Explore, test, and rebuild models.

    프로젝트가 완료되면 사용자가 찾아보거나 쿼리하도록 프로젝트를 배포하거나 응용 프로그램의 마이닝 모델에 대한 프로그래밍 방식의 액세스를 제공하여 예측 및 분석을 지원할 수 있습니다.When the project is complete, you can deploy it for users to browse or query, or provide programmatic access to the mining models in an application, to support predictions and analysis.

데이터 마이닝 프로젝트의 개체Objects in Data Mining Projects

모든 데이터 마이닝 프로젝트는 다음 네 가지 유형의 개체를 포함합니다.All data mining projects contain the following four types of objects. 모든 유형의 개체를 여러 개 유지할 수 있습니다.You can have multiple objects of all types.

  • 데이터 원본Data sources

  • 데이터 원본 뷰Data source views

  • 마이닝 구조Mining structures

  • 마이닝 모델Mining models

    예를 들어 단일 데이터 마이닝 프로젝트에서 각각 여러 데이터 원본 뷰를 지원하는 여러 데이터 원본에 대한 참조를 포함할 수 있습니다.For example, a single data mining project can contain a reference to multiple data sources, with each data source supporting multiple data source views. 또한 각 데이터 원본 뷰는 각각 여러 마이닝 모델과 관련된 여러 개의 마이닝 구조를 지원할 수 있습니다.In turn, each data source view can support multiple mining structures, each with many related mining models.

    그 밖에도 프로젝트는 플러그 인 알고리즘, 사용자 지정 어셈블리 또는 사용자 지정 저장 프로시저를 포함할 수 있지만 여기에서는 이러한 개체에 대해 설명하지 않습니다.Additionally, your project might include plug-in algorithms, custom assemblies, or custom stored procedures; however, these objects are not described here. 자세한 내용은 Analysis Services 개발자 설명서를 참조하세요.For more information, see Analysis Services Developer Documentation.

Data SourcesData Sources

데이터 원본은 Analysis ServicesAnalysis Services 서버에서 데이터 원본에 연결하는 데 사용할 연결 문자열 및 인증 정보를 정의합니다.The data source defines the connection string and authentication information that the Analysis ServicesAnalysis Services server will use to connect to the data source. 데이터 원본은 여러 개의 테이블 또는 뷰를 포함할 수 있으며, 단일 Excel 통합 문서 또는 텍스트 파일처럼 단순하거나 OLAP(온라인 분석 처리) 데이터베이스 또는 큰 관계형 데이터베이스처럼 복잡할 수 있습니다.The data source can contain multiple tables or views; it can be as simple as a single Excel workbook or text file, or as complex as an Online Analytical Processing (OLAP) database or large relational database.

단일 데이터 마이닝 프로젝트에서 여러 데이터 원본을 참조할 수 있습니다.A single data mining project can reference multiple data sources. 마이닝 모델은 한 번에 하나의 데이터 원본만 사용할 수 있지만 프로젝트에는 데이터 원본이 서로 다른 여러 개의 모델 드로잉이 있을 수 있습니다.Even though a mining model can use only one data source at a time, the project could have multiple models drawing on different data sources.

Analysis ServicesAnalysis Services 는 많은 외부 공급자의 데이터를 지원하며, SQL Server 데이터 마이닝에서는 관계형 데이터와 큐브 데이터 둘 다를 데이터 원본으로 사용할 수 있습니다. supports data from many external providers, and SQL Server Data Mining can use both relational and cube data as a data source. 그러나 두 유형의 프로젝트(관계형 원본 기반의 모델과 OLAP 큐브 기반의 모델)를 모두 개발할 경우 별도의 프로젝트에서 개발하고 관리할 수 있습니다.However, if you develop both types of projects—models based on relational sources and models based on OLAP cubes—you might wish to develop and manage these in separate projects.

  • 일반적으로 OLAP 큐브를 기반으로 하는 모델은 OLAP 디자인 솔루션 내에서 개발해야 합니다.Typically models that are based on an OLAP cube should be developed within the OLAP design solution. 그 이유 중 하나는 큐브를 기반으로 하는 모델은 큐브를 처리하여 데이터를 업데이트해야 하기 때문입니다.One reason is that models based on a cube must process the cube to update data. 일반적으로 큐브 데이터는 기본적인 데이터 저장 및 액세스 방법으로 사용되거나 다차원 프로젝트에서 만든 집계, 차원 및 특성이 필요한 경우에만 사용해야 합니다.Generally, you should use cube data only when that is the principal means of data storage and access, or when you require the aggregations, dimensions, and attributes created by the multidimensional project.

  • 프로젝트에서 관계형 데이터만 사용하는 경우에는 불필요하게 다른 개체를 다시 처리하지 않도록 별도의 프로젝트에서 관계형 모델을 만들어야 합니다.If your project uses relational data only, you should create the relational models within a separate project, so that you do not unnecessarily reprocess other objects. 대부분의 경우 큐브 만들기를 지원하는 데 사용되는 준비 데이터베이스 또는 데이터 웨어하우스에는 데이터 마이닝을 수행하는 데 필요한 뷰가 포함되어 있으므로 큐브의 집계 및 차원 대신 이러한 뷰를 데이터 마이닝에 사용할 수 있습니다.In many cases, the staging database or the data warehouse used to support cube creation already contains the views that are needed to perform data mining, and you can use those views for data mining rather than use the aggregations and dimensions in the cube.

  • 메모리 내 또는 Power PivotPower Pivot 데이터를 직접 사용하여 데이터 마이닝 모델을 작성할 수 없습니다.You cannot use in-memory or Power PivotPower Pivot data directly to build data mining models.

    데이터 원본은 서버 또는 공급자와 일반적인 유형의 데이터만 식별합니다.The data source only identifies the server or provider and the general type of data. 데이터 서식 및 집계를 변경하려면 데이터 원본 뷰 개체를 사용합니다.If you need to change data formatting and aggregations, use the data source view object.

    데이터 원본의 데이터를 처리하는 방식을 제어하려면 파생 열 또는 계산을 추가하거나, 집계를 수정하거나, 데이터 원본 뷰의 데이터에 있는 열 이름을 바꾸면 됩니다.To control the way that data from the data source is handled, you can add derived columns or calculation, modify aggregates, or rename columns in the data in the data source view. 마이닝 구조 열을 수정하거나 마이닝 모델 열의 수준에서 모델링 플래그 및 필터를 사용하여 데이터 다운스트림 작업을 수행할 수도 있습니다.(You can also work with data downstream, by modifying mining structure columns, or by using modeling flags and filters at the level of the mining model column.)

    데이터 정리가 필요한 경우 또는 추가 변수를 만들거나 데이터 형식을 변경하거나 대체 집계를 만들기 위해 데이터 웨어하우스의 데이터를 수정해야 하는 경우 데이터 마이닝을 지원하는 추가 프로젝트 유형을 만들어야 할 수 있습니다.If data cleansing is required, or the data in the data warehouse must be modified to create additional variables, change data types, or create alternate aggregation, you might need to create additional project types in support of data mining. 관련 프로젝트에 대한 자세한 내용은 데이터 마이닝 솔루션 관련 프로젝트를 참조하세요.For more information about these related projects, see Related Projects for Data Mining Solutions.

Data Source ViewsData Source Views

데이터 원본에 대한 연결을 정의한 후에는 모델과 관련된 특정 데이터를 식별하는 뷰를 만듭니다.After you have defined this connection to a data source, you create a view that identifies the specific data that is relevant to your model.

데이터 원본 뷰를 사용하면 데이터 원본의 데이터가 마이닝 모델에 제공되는 방식을 사용자 지정할 수도 있습니다.The data source view also enables you to customize the way that the data in the data source is supplied to the mining model. 데이터의 구조를 수정하여 프로젝트에 보다 적절하게 만들거나 특정 종류의 데이터만 선택할 수 있습니다.You can modify the structure of the data to make it more relevant to your project, or choose only certain kinds of data.

예를 들어 데이터 원본 뷰 편집기를 사용하여 다음을 수행할 수 있습니다.For example, by using the Data Source View editor, you can:

  • 날짜 부분, 부분 문자열 등의 파생 열 만들기Create derived columns, such as dateparts, substrings, etc.

  • GROUP BY와 같은 Transact-SQLTransact-SQL 문을 사용하여 값 집계Aggregate values using Transact-SQLTransact-SQL statements such as GROUP BY

  • 일시적으로 데이터를 제한하거나 데이터 샘플링Restrict data temporarily, or sample data

    데이터 원본 뷰 내에서 데이터를 수정하는 방법에 대한 자세한 내용은 다차원 모델의 데이터 원본 뷰를 참조하세요.For more information about how you can modify data within a data source view, see Data Source Views in Multidimensional Models.

경고

데이터를 필터링하려는 경우 데이터 원본 뷰에서 작업을 수행할 수 있지만 마이닝 모델 수준에서 데이터에 대한 필터를 만들 수도 있습니다.If you want to filter the data, you can do so in the data source view, but you can also create filters on the data at the level of the mining model. 필터 정의는 마이닝 모델과 함께 저장되므로 모델 필터를 사용하면 모델 학습에 사용된 데이터를 보다 쉽게 확인할 수 있습니다.Because the filter definition is stored with the mining model, using model filters makes it easier to determine the data that was used for training the model. 또한 여러 가지 필터 조건을 사용하여 여러 개의 관련 모델을 만들 수 있습니다.Moreover, you can create multiple related models, with different filter criteria. 자세한 내용은 마이닝 모델에 대한 필터(Analysis Services - 데이터 마이닝)를 참조하세요.For more information, see Filters for Mining Models (Analysis Services - Data Mining).

사용자가 만든 데이터 원본 뷰는 분석에 직접 사용되지 않는 추가 데이터를 포함할 수 있습니다.Note that the data source view that you create can contain additional data that is not directly used for analysis. 예를 들어 테스트, 예측 또는 드릴스루에 사용되는 데이터 원본 뷰 데이터에 추가할 수 있습니다.For example, you might add to your data source view data that is used for testing, predictions, or for drillthrough. 이러한 용도에 대한 자세한 내용은 테스트 및 유효성 검사(데이터 마이닝)드릴스루템플릿을 사용하여 데이터 마이닝 프로젝트를 작성할 수 있습니다.For more information about these uses, see Testing and Validation (Data Mining) and Drillthrough.

Mining StructuresMining Structures

데이터 원본 및 데이터 원본 뷰를 만든 경우 프로젝트 내에서 마이닝 구조 를 정의하여 비즈니스 문제와 가장 관련이 있는 데이터 열을 선택해야 합니다.Once you have created your data source and data source view, you must select the columns of data that are most relevant to your business problem, by defining mining structures within the project. 마이닝 구조는 프로젝트에 실제로 모델링, 학습 및 테스트에 사용해야 하는 데이터 원본 뷰의 데이터 열을 알려 줍니다.A mining structure tells the project which columns of data from the data source view should actually be used in modeling, training, and testing.

새 마이닝 구조를 추가하려면 데이터 마이닝 마법사를 시작합니다.To add a new mining structure, you start the Data Mining Wizard. 이 마법사는 마이닝 구조를 자동으로 정의하고 데이터 선택 과정을 안내하며 선택적으로 초기 마이닝 모델을 구조에 추가할 수 있도록 합니다.The wizard automatically defines a mining structure, walks you through the process of choosing the data, and optionally lets you add an initial mining model to the structure. 마이닝 구조 내에서 데이터 원본 뷰 또는 OLAP 큐브의 테이블 및 열을 선택하고 테이블 간의 관계를 정의합니다(데이터에 중첩 테이블이 있는 경우).Within the mining structure, you choose tables and columns from the data source view or from an OLAP cube, and define relationships among tables, if your data includes nested tables.

선택한 데이터는 관계형 데이터 원본을 사용하는지 또는 OLAP(온라인 분석 처리) 데이터 원본을 사용하는지에 따라 데이터 마이닝 마법사에서 아주 다르게 표시됩니다.Your choice of data will look very different in the Data Mining Wizard, depending on whether you use relational or online analytical processing (OLAP) data sources.

  • 관계형 데이터 원본에서 데이터를 선택한 경우에는 마이닝 구조를 쉽게 설정할 수 있습니다. 데이터 원본 뷰의 데이터에서 열을 선택하고 별칭과 같은 추가 사용자 지정 항목을 설정하거나 열의 값을 그룹화 또는 범주화할 방법을 정의하면 됩니다.When you choose data from a relational data source, setting up a mining structure is easy: you choose columns from the data in the data source view, and set additional customizations such as aliases, or define how values in the column should be grouped or binned. 자세한 내용은 관계형 마이닝 구조 만들기를 참조하세요.For more information, see Create a Relational Mining Structure.

  • OLAP 큐브의 데이터를 사용하려면 마이닝 구조가 OLAP 솔루션과 동일한 데이터베이스에 있어야 합니다.When you use data from an OLAP cube, the mining structure must be in the same database as the OLAP solution. 마이닝 구조를 만들려면 OLAP 솔루션의 차원 및 관련 측정값에서 특성을 선택합니다.To create a mining structure, you select attributes from the dimensions and related measures in your OLAP solution. 일반적으로 숫자 값은 측정값에 있고 범주 변수는 차원에 있습니다.Numeric values are typically found in measures, and categorical variables in dimensions. 자세한 내용은 OLAP 마이닝 구조 만들기를 참조하세요.For more information, see Create an OLAP Mining Structure.

  • DMX를 사용하여 마이닝 구조를 정의할 수도 있습니다.You can also define mining structures by using DMX. 자세한 내용은 DMX(Data Mining Extensions) 데이터 정의 문을 참조하세요.For more information, see Data Mining Extensions (DMX) Data Definition Statements.

    초기 마이닝 구조를 만든 후에는 구조 열을 복사하거나 수정하거나 별칭을 지정할 수 있습니다.After you have created the initial mining structure, you can copy, modify, and alias the structure columns.

    각 마이닝 구조는 여러 마이닝 모델을 포함할 수 있습니다.Each mining structure can contain multiple mining models. 따라서 작업을 완료한 후 마이닝 구조를 다시 열고 Data Mining Designer 를 사용하여 구조에 다른 마이닝 모델을 추가할 수 있습니다.Therefore, after you are done, you can open the mining structure again, and use Data Mining Designer to add more mining models to the structure.

    또한 데이터를 모델 작성에 사용되는 학습 데이터 집합과 마이닝 모델의 테스트 또는 유효성 검사에 사용할 홀드아웃 데이터 집합으로 구분할 수 있습니다.You also have the option to separate your data into a training data set, used for building models, and a holdout data set to use in testing or validating your mining models.

경고

시계열 모델과 같은 일부 모델 유형은 학습에 연속된 일련의 데이터가 필요하기 때문에 홀드아웃 데이터 집합 만들기를 지원하지 않습니다.Some model types, such as time series models, do not support the creation of holdout data sets because they require a continuous series of data for training. 자세한 내용은 Training and Testing Data Sets을 참조하세요.For more information, see Training and Testing Data Sets.

Mining ModelsMining Models

마이닝 모델은 데이터에 사용할 분석 방법이나 알고리즘을 정의합니다.The mining model defines the algorithm, or the method of analysis that you will use on the data. 각 마이닝 구조에는 하나 이상의 마이닝 모델을 추가할 수 있습니다.To each mining structure, you add one or more mining models.

요구 사항에 따라 많은 모델을 단일 프로젝트에 통합하거나 각 유형의 모델 또는 분석 태스크에 대한 별도의 프로젝트를 만들 수 있습니다.Depending on your needs, you can combine many models in a single project, or create separate projects for each type of model or analytical task.

구조 및 모델을 만든 후에는 데이터 원본 뷰에서 데이터의 수학적 모델을 생성하는 알고리즘을 통해 데이터를 실행하여 각 모델을 처리 합니다.After you have created a structure and model, you process each model by running the data from the data source view through the algorithm, which generates a mathematical model of the data. 이 프로세스를 모델 학습이라고도 합니다.This process is also known as training the model. 자세한 내용은 처리 요구 사항 및 고려 사항(데이터 마이닝)을 참조하세요.For more information, see Processing Requirements and Considerations (Data Mining).

모델을 처리한 후에는 마이닝 모델을 시각적으로 탐색하고 모델에 대한 예측 쿼리를 만들 수 있습니다.After the model has been processed, you can then visually explore the mining model and create prediction queries against it. 학습 프로세스에서 데이터가 캐시된 경우 드릴스루 쿼리를 사용하여 모델에 사용된 사례에 대한 세부 정보를 반환할 수 있습니다.If the data from the training process has been cached, you can use drillthrough queries to return detailed information about the cases used in the model.

프로덕션에 모델을 사용하려는 경우(예: 예측하는 데 사용하거나 일반 사용자의 탐색에 사용하려는 경우) 모델을 다른 서버에 배포할 수 있습니다.When you want to use a model for production (for example, for use in making predictions, or for exploration by general users) you can deploy the model to a different server. 나중에 모델을 다시 처리해야 하는 경우 기본 마이닝 구조의 정의와 데이터 원본 및 데이터 원본 뷰의 정의를 동시에 내보내야 합니다.If you need to reprocess the model in future, you must also export the definition of the underlying mining structure (and, necessarily, the definition of the data source and data source view) at the same time.

또한 모델을 배포할 때 구조 및 모델에 올바른 처리 옵션이 설정되었는지, 그리고 잠재적 사용자에게 쿼리를 수행하거나 모델을 보거나 구조 또는 모델 데이터로 드릴스루하는 데 필요한 권한이 있는지 확인해야 합니다.When you deploy a model, you must also ensure that the correct processing options are set on the structure and model, and that potential users have the permissions they need to perform queries, view models, or drillthrough to structure o model data. 자세한 내용은 보안 개요(데이터 마이닝)를 참조하세요.For more information, see Security Overview (Data Mining).

완료된 데이터 마이닝 프로젝트 사용Using the Completed Data Mining Project

이 섹션에서는 완료된 데이터 마이닝 프로젝트를 사용하는 방법을 요약하여 설명합니다.This section summarizes the ways that you can use the completed data mining project. 정확도 차트를 만들고, 데이터에 대해 탐색 및 유효성 검사를 수행하고, 사용자가 데이터 마이닝 패턴을 사용할 수 있도록 할 수 있습니다.You can create accuracy charts, explore and validate the data, and make the data mining patterns available to users.

경고

데이터 마이닝 모델에 사용하는 차트, 쿼리 및 시각화 요소는 데이터 마이닝 프로젝트의 일부로 저장되지 않으며 배포할 수 없습니다.The charts, queries, and visualizations that you use with data mining models are not saved as part of the data mining project, and cannot be deployed. 이러한 개체를 유지해야 하는 경우 제공된 콘텐츠를 저장하거나 각 개체에 대해 설명된 대로 스크립팅해야 합니다.If you need to persist these objects, you must either save the content that is presented or script it as described for each object.

View and Explore ModelsView and Explore Models

모델을 만든 후에는 시각적 도구와 쿼리를 사용하여 모델에서 패턴을 탐색하고 기본 패턴 및 통계에 대한 자세한 정보를 확인할 수 있습니다.After you have created a model, you can use visual tools and queries to explore the patterns in the model and learn more about the underlying patterns and statistics. 의 데이터 마이닝 디자이너에 있는 마이닝 모델 뷰어 Analysis ServicesAnalysis Services 탭에서는 각 마이닝 모델 유형에 대해 마이닝 모델을 탐색하는 데 사용할 수 있는 뷰어를 제공합니다.On the Mining Model Viewer tab in Data Mining Designer, Analysis ServicesAnalysis Services provides viewers for each mining model type, which you can use to explore the mining models.

이러한 시각화 요소는 일시적이므로 Analysis ServicesAnalysis Services에서 세션을 종료할 때 저장하지 않고 닫힙니다.These visualizations are temporary, and are closed without saving when you exit the session with Analysis ServicesAnalysis Services. 따라서 이러한 시각화 요소를 프레젠테이션이나 이후의 분석에 사용하기 위해 다른 응용 프로그램으로 내보내야 하는 경우 뷰어 인터페이스의 각 탭이나 창에 제공된 복사 명령을 사용합니다.Therefore, if you need to export these visualizations to another application for presentation or further analysis, use the Copy commands provided in each tab or pane of the viewer interface.

Excel용 데이터 마이닝 추가 기능에서도 모델을 Visio 다이어그램으로 표시하고 Visio 도구를 사용하여 주석을 달거나 다이어그램을 수정하는 데 사용할 수 있는 Visio 템플릿을 제공합니다.The Data Mining Add-ins for Excel also provides a Visio template that you can use to represent your models in a Visio diagram and annotate and modify the diagram using Visio tools. 자세한 내용은 Microsoft Office 2007용 Microsoft SQL Server 2008 SP2 데이터 마이닝 추가 기능을 참조하세요.For more information, see Microsoft SQL Server 2008 SP2 Data Mining Add-ins for Microsoft Office 2007.

Test and Validate ModelsTest and Validate Models

모델을 만든 후 결과를 조사하여 가장 적합한 모델을 결정할 수 있습니다.After you have created a model, you can investigate the results and make decisions about which models perform the best.

Analysis ServicesAnalysis Services 에서는 마이닝 모델을 직접 비교하고 가장 정확하거나 유용한 마이닝 모델을 선택하는 데 사용할 수 있는 도구를 제공하는 데 사용되는 여러 차트를 제공합니다. provides several charts that you can use to provides tools that you can use to directly compare mining models and choose the most accurate or useful mining model. 이러한 도구에는 리프트 차트, 수익 차트 및 분류 행렬이 포함됩니다.These tools include a lift chart, profit chart, and a classification matrix. 데이터 마이닝 디자이너의 마이닝 정확도 차트 를 사용하여 이 차트를 생성할 수 있습니다.You can generate these charts by using the Mining Accuracy Chart tab of Data Mining Designer.

교차 유효성 검사 보고서를 통해 데이터를 반복적으로 서브샘플링하여 모델이 특정 데이터 집합에 편향되어 있는지 확인할 수도 있습니다.You can also use the cross-validation report to perform iterative subsampling of your data to determine whether the model is biased to a particular set of data. 또한 보고서에서 제공되는 통계를 사용하여 모델을 객관적으로 비교하고 학습 데이터의 품질을 평가할 수 있습니다.The statistics that the report provides can be used to objectively compare models and assess the quality of your training data.

이러한 보고서 및 차트는 프로젝트와 함께 저장되거나 ssASnoversion 데이터베이스에 저장되지 않으므로 결과를 유지하거나 복제하려면 결과를 저장하거나 DMX 또는 AMO를 사용하여 개체를 스크립팅해야 합니다.Note that these reports and charts are not stored with the project or in the ssASnoversion database, so if you need to preserve or duplicate the results, you should either save the results, or script the objects by using DMX or AMO. 교차 유효성 검사에 저장 프로시저를 사용할 수도 있습니다.You can also use stored procedures for cross-validation.

자세한 내용은 테스트 및 유효성 검사(데이터 마이닝)템플릿을 사용하여 데이터 마이닝 프로젝트를 작성할 수 있습니다.For more information, see Testing and Validation (Data Mining).

Create PredictionsCreate Predictions

Analysis ServicesAnalysis Services 예측을 만드는 데 기본적으로 사용되고 쉽게 스크립팅할 수 있는 DMX(Data Mining Extensions)라는 쿼리 언어를 제공합니다. provides a query language called Data Mining Extensions (DMX) that is the basis for creating predictions and is easily scriptable. DMX 예측 쿼리를 쉽게 작성할 수 있도록 SQL ServerSQL Server 에서는 SQL Server Management StudioSQL Server Management Studio에서 사용할 수 있는 쿼리 작성기를 제공합니다.To help you build DMX prediction queries, SQL ServerSQL Server provides a query builder, available in SQL Server Management StudioSQL Server Management Studio. SQL Server Management StudioSQL Server Management Studio에는 쿼리 편집기용 DMX 템플릿도 많이 있습니다. 예측 쿼리를 처음 사용하는 경우 데이터 마이닝 디자이너와 SQL Server Management StudioSQL Server Management Studio에서 제공되는 쿼리 작성기를 사용하는 것이 좋습니다.There are also many DMX templates for the query editor in SQL Server Management StudioSQL Server Management Studio.If you are new to prediction queries, we recommend that you use the query builder that is provided in both Data Mining Designer and SQL Server Management StudioSQL Server Management Studio. 자세한 내용은 Data Mining Tools을 참조하세요.For more information, see Data Mining Tools.

SQL Server Data Tools(SSDT)SQL Server Data Tools (SSDT) 또는 SQL Server Management StudioSQL Server Management Studio 에서 만든 예측은 유지되지 않으므로 쿼리가 복잡하거나 결과를 재현해야 하는 경우 예측 쿼리를 DMX 쿼리 파일에 저장하거나 예측 쿼리를 스크립팅하거나 쿼리를 Integration Services 패키지의 일부로 포함하는 것이 좋습니다.The predictions that you create in either SQL Server Data Tools(SSDT)SQL Server Data Tools (SSDT) or SQL Server Management StudioSQL Server Management Studio are not persisted, so if your queries are complex, or you need to reproduce the results, we recommend that you save your prediction queries to DMX query files, script them, or embed the queries as part of an Integration Services package.

데이터 마이닝 개체에 대한 프로그래밍 방식 액세스Programmatic Access to Data Mining Objects

Analysis ServicesAnalysis Services 에서는 프로그래밍 방식으로 데이터 마이닝 프로젝트 및 개체 작업을 할 때 사용할 수 있는 여러 도구를 제공합니다. provides several tools that you can use to programmatically work with data mining projects and the objects in them. DMX 언어는 데이터 원본 및 데이터 원본 뷰를 만들고 데이터 마이닝 구조 및 모델을 생성, 학습 및 사용하는 데 사용할 수 있는 문을 제공합니다.The DMX language provides statements that you can use to create data sources and data source views, and to create, train, and use data mining structure and models. 자세한 내용은 DMX(Data Mining Extensions) 참조를 참조하세요.For more information, see Data Mining Extensions (DMX) Reference.

ASSL(Analysis Services Scripting Language) 또는 AMO(Analysis Management Objects)를 사용하여 이러한 태스크를 수행할 수도 있습니다.You can also perform these tasks by using the Analysis Services Scripting Language (ASSL), or by using Analysis Management Objects (AMO). 자세한 내용은 Analysis Services에서 XMLA를 사용하여 개발을 참조하세요.For more information, see Developing with XMLA in Analysis Services.

다음 항목에서는 데이터 마이닝 마법사를 사용하여 데이터 마이닝 프로젝트와 관련 개체를 만드는 방법에 대해 설명합니다.The following topics describe use of the Data Mining Wizard to create a data mining project and associated objects.

태스크Tasks 항목Topics
마이닝 구조 열로 작업하는 방법에 대해 설명합니다.Describes how to work with mining structure columns 관계형 마이닝 구조 만들기Create a Relational Mining Structure
새 마이닝 모델을 추가하고 구조 및 모델을 처리하는 방법에 대해 자세히 설명합니다.Provides more information about how to add new mining models, and process a structure and models 구조에 마이닝 모델 추가(Analysis Services - 데이터 마이닝)Add Mining Models to a Structure (Analysis Services - Data Mining)
마이닝 모델을 작성하는 알고리즘을 사용자 지정하는 데 도움이 되는 리소스에 대한 링크를 제공합니다.Provides links to resources that help you customize the algorithms that build mining models 마이닝 모델 및 구조 사용자 지정Customize Mining Models and Structure
각 마이닝 모델 뷰어 관련 정보에 대한 링크를 제공합니다.Provides links to information about each of the mining model viewers 데이터 마이닝 모델 뷰어Data Mining Model Viewers
리프트 차트, 수익 차트 또는 분류표를 만들거나 마이닝 구조를 테스트하는 방법에 대해 설명합니다.Learn how to create a lift chart, profit chart, or classification matrix, or test a mining structure 테스트 및 유효성 검사(데이터 마이닝)Testing and Validation (Data Mining)
처리 옵션 및 사용 권한에 대해 설명합니다.Learn about processing options and permissions 데이터 마이닝 개체 처리Processing Data Mining Objects
Analysis Services에 대한 자세한 정보를 제공합니다.Provides more information about Analysis Services 다차원 model 데이터베이스(SSAS)Multidimensional Model Databases (SSAS)

관련 항목:See Also

Data Mining Designer Data Mining Designer
SSDT(SQL Server Data Tools)를 사용하여 다차원 모델 만들기 Creating Multidimensional Models Using SQL Server Data Tools (SSDT)
작업 영역 데이터베이스(SSAS 테이블 형식)Workspace Database (SSAS Tabular)