논리적 아키텍처(Analysis Services - 데이터 마이닝)Logical Architecture (Analysis Services - Data Mining)

적용 대상:예SQL Server Analysis Services아니요Azure Analysis ServicesAPPLIES TO:yesSQL Server Analysis ServicesnoAzure Analysis Services데이터 마이닝은 여러 구성 요소와의 상호 작용 수 반하는 프로세스입니다. Data mining is a process that involves the interaction of multiple components.

  • 우선 학습, 테스트 및 예측에 사용하기 위해 SQL Server 데이터베이스나 기타 데이터 원본에 있는 데이터의 원본에 액세스해야 합니다.You access sources of data in a SQL Server database or any other data source to use for training, testing, or prediction.

  • SQL Server Data Tools(SSDT)SQL Server Data Tools (SSDT) 또는 Visual Studio를 사용하여 데이터 마이닝 구조와 모델을 정의합니다.You define data mining structures and models by using SQL Server Data Tools(SSDT)SQL Server Data Tools (SSDT) or Visual Studio.

  • SQL Server Management StudioSQL Server Management Studio를 사용하여 데이터 마이닝 개체를 관리하고 예측 및 쿼리를 만듭니다.You manage data mining objects and create predictions and queries by using SQL Server Management StudioSQL Server Management Studio.

  • 솔루션이 완료되면 이를 Analysis ServicesAnalysis Services의 인스턴스에 배포합니다.When the solution is complete, you deploy it to an instance of Analysis ServicesAnalysis Services.

    이러한 솔루션 개체를 만드는 프로세스는 이미 여러 곳에 설명되어 있습니다.The process of creating these solution objects has already been described elsewhere. 자세한 내용은 데이터 마이닝 솔루션을 참조하세요.For more information, see Data Mining Solutions.

    다음 섹션에서는 데이터 마이닝 솔루션 개체의 논리 아키텍처에 대해 설명합니다.The following sections describe the logical architecture of the objects in a data mining solution.

    데이터 마이닝 원본 데이터Data Mining Source Data

    마이닝 구조Mining Structures

    마이닝 모델Mining Models

    사용자 지정 데이터 마이닝 개체Custom Data Mining Objects

데이터 마이닝 원본 데이터Data Mining Source Data

데이터 마이닝에 사용하는 데이터는 데이터 마이닝 솔루션에 저장되지 않고 바인딩만 저장됩니다.The data that you use in data mining is not stored in the data mining solution; only the bindings are stored. 데이터는 이전 버전의 SQL Server 또는 CRM 시스템에서 만들거나 플랫 파일로 만든 데이터베이스에 있을 수도 있습니다.The data might reside in a database created in a previous version of SQL Server, a CRM system, or even a flat file. 구조나 모델을 처리하여 학습하는 경우 데이터의 통계 요약이 생성됩니다. 이 통계 요약은 이후 작업에 사용하도록 유지될 수 있는 캐시에 저장되거나 처리 후 삭제됩니다.When you train the structure or model by processing, a statistical summary of the data is created and stored in a cache that can be persisted for use in later operations, or deleted after processing. 자세한 내용은 마이닝 구조(Analysis Services - 데이터 마이닝)를 참조하세요.For more information, see Mining Structures (Analysis Services - Data Mining).

데이터 원본 위에 추상화 계층을 제공하는 Analysis ServicesAnalysis Services DSV(데이터 원본 뷰) 개체 내에서 서로 다른 데이터를 조합할 수 있습니다.You combine disparate data within the Analysis ServicesAnalysis Services data source view (DSV) object, which provides an abstraction layer on top of your data source. 테이블 간의 조인을 지정하거나 다 대 일 관계를 갖는 테이블을 추가하여 중첩 테이블 열을 만들 수 있습니다.You can specify joins between tables, or add tables that have a many-to-one relationship to create nested table columns. 이러한 개체의 정의, 데이터 원본 및 데이터 원본 뷰는 *.ds 및 *.dsv 파일 이름 확장명으로 솔루션 내에 저장됩니다.The definition of these objects, the data source and the data source view, are stored within the solution with the file name extensions, *.ds and *.dsv. Analysis ServicesAnalysis Services 데이터 원본 및 데이터 원본 뷰를 만들고 사용하는 방법에 대한 자세한 내용은 지원되는 데이터 원본(SSAS - 다차원)을 참조하세요.For more information about creating and using Analysis ServicesAnalysis Services data sources and data source views, see Supported Data Sources (SSAS - Multidimensional).

AMO 또는 XMLA를 사용하여 데이터 원본 및 데이터 원본 뷰를 정의하고 변경할 수도 있습니다.You can also define and alter data sources and data source views by using AMO or XMLA. 이러한 개체를 프로그래밍 방식으로 작업하는 방법에 대한 자세한 내용은 논리 아키텍처 개요(Analysis Services - 다차원 데이터)를 참조하세요.For more information about working with these objects programmatically, see Logical Architecture Overview (Analysis Services - Multidimensional Data).

Mining StructuresMining Structures

데이터 마이닝 구조는 마이닝 모델이 생성된 데이터 도메인을 정의하는 논리적 데이터 컨테이너입니다.A data mining structure is a logical data container that defines the data domain from which mining models are built. 단일 마이닝 구조가 여러 마이닝 모델을 지원할 수 있습니다.A single mining structure can support multiple mining models.

데이터 마이닝 솔루션에서 데이터를 사용해야 할 경우 Analysis Services에서는 원본의 데이터를 읽고 집계와 그 밖의 정보에 대한 캐시를 생성합니다.When you need to use the data in the data mining solution, Analysis Services reads the data from the source and generates a cache of aggregates and other information. 기본적으로 이 캐시는 추가 모델을 지원하는 데 학습 데이터를 다시 사용할 수 있도록 유지됩니다.By default this cache is persisted so that training data can be reused to support additional models. 캐시를 삭제하려면 마이닝 구조 개체의 CacheMode 속성을 ClearAfterProcessing값으로 변경합니다.If you need to delete the cache, change the CacheMode property on the mining structure object to the value, ClearAfterProcessing. 자세한 내용은 AMO 데이터 마이닝 클래스를 참조하세요.For more information, see AMO Data Mining Classes.

또한 analysis Services 데이터의 대표, 임의로 선택 된 집합에 마이닝 모델을 테스트할 수 있도록 데이터를 학습 집합과 테스트 데이터 집합으로 분리 하는 기능을 제공 합니다.Analysis Services also provides the ability to separate your data into training and testing data sets, so that you can test your mining models on a representative, randomly selected set of data. 구조 캐시의 데이터는 실제 별도로 저장되는 것이 아니라 해당 특정 사례가 학습에 사용되는지, 테스트에 사용되는지를 나타내는 속성으로 표시됩니다.The data is not actually stored separately; rather, case data in the structure cache is marked with a property that indicates whether that particular case is used for training or for testing. 캐시를 삭제한 경우에는 해당 정보를 검색할 수 없습니다.If the cache is deleted, that information cannot be retrieved.

자세한 내용은 마이닝 구조(Analysis Services - 데이터 마이닝)를 참조하세요.For more information, see Mining Structures (Analysis Services - Data Mining).

데이터 마이닝 구조에는 중첩 테이블이 포함될 수도 있습니다.A data mining structure can contain nested tables. 중첩 테이블은 기본 데이터 테이블에서 모델링된 사례에 대한 추가 정보를 제공합니다.A nested table provides additional detail about the case that is modeled in the primary data table. 자세한 내용은 중첩 테이블(Analysis Services - 데이터 마이닝)을 참조하세요.For more information, see Nested Tables (Analysis Services - Data Mining)

Mining ModelsMining Models

처리하기 전의 데이터 마이닝 모델은 메타데이터 속성의 조합에 불과합니다.Before processing, a data mining model is only a combination of metadata properties. 이러한 속성은 마이닝 구조와 데이터 마이닝 알고리즘을 지정하며 데이터가 처리되는 방식에 영향을 주는 매개 변수 및 필터 설정의 컬렉션을 정의합니다.These properties specify a mining structure, specify a data mining algorithm, and a define collection of parameter and filter settings that affect how the data is processed. 자세한 내용은 마이닝 모델(Analysis Services - 데이터 마이닝)을 참조하세요.For more information, see Mining Models (Analysis Services - Data Mining).

모델을 처리할 때 마이닝 구조 캐시에 저장된 학습 데이터는 데이터의 통계 속성과 알고리즘 및 해당 매개 변수에 의해 정의된 추론을 기반으로 패턴을 생성하는 데 사용됩니다.When you process the model, the training data that was stored in the mining structure cache is used to generate patterns, based both on statistical properties of the data and on heuristics defined by the algorithm and its parameters. 이를 모델 학습 이라고 합니다.This is known as training the model.

학습 결과는 모델 콘텐츠내에 포함된 요약 데이터의 집합으로서, 발견된 패턴을 설명하고 예측을 생성하는 데 사용되는 규칙을 제공합니다.The result of training is a set of summary data, contained within the model content, which describes the patterns that were found and provides rules by which to generate predictions. 자세한 내용은 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)를 참조하세요.For more information, see Mining Model Content (Analysis Services - Data Mining).

일부 사례에서는 모델의 논리 구조를 PMML(Predictive Modeling Markup Language)이라는 표준 형식에 따라 모델 수식 및 데이터 바인딩을 나타내는 파일로 내보낼 수도 있습니다.In limited cases, the logical structure of the model can also be exported into a file that represents model formulas and data bindings according to a standard format, the Predictive Modeling Markup Language (PMML). 이 논리 구조를 PMML을 활용하는 다른 시스템으로 가져올 수 있으며, 그런 다음 설명된 모델을 예측에 사용할 수 있습니다.This logical structure can be imported into other systems that utilize PMML and the model so described can then be used for prediction. 자세한 내용은 DMX Select 문 이해를 참조하세요.For more information, see Understanding the DMX Select Statement.

사용자 지정 데이터 마이닝 개체Custom Data Mining Objects

데이터 마이닝 프로젝트의 컨텍스트에서 사용하는 다른 개체(예: 정확도 차트 또는 예측 쿼리)는 솔루션 내에서 유지되지 않지만 ASSL을 사용하여 스크립팅하거나 AMO를 사용하여 생성할 수 있습니다.Other objects that you use in the context of a data mining project, such as accuracy charts or prediction queries, are not persisted within the solution, but can be scripted using ASSL or built using AMO.

또한 다음과 같은 사용자 지정 개체를 추가하여 Analysis ServicesAnalysis Services 의 인스턴스에서 사용 가능한 서비스 및 기능을 확장할 수 있습니다.Additionally, you can extend the services and features available on an instance of Analysis ServicesAnalysis Services by adding these custom objects:

사용자 지정 어셈블리Custom assemblies
CLR 또는 COM 규격 언어를 사용하여 .NET 어셈블리를 정의한 다음 SQL Server 인스턴스에 등록할 수 있습니다..NET assemblies can be defined by using any CLR-or COM-complaint language, and then registered with an instance of SQL Server. 어셈블리 파일은 응용 프로그램에 의해 정의된 위치에서 로드되며 복사본이 데이터와 함께 서버에 저장됩니다.Assembly files are loaded from the location defined by the application, and a copy is saved in the server along with the data. 어셈블리 파일의 복사본은 서버가 시작될 때마다 어셈블리를 로드하는 데 사용됩니다.The copy of the assembly file is used to load the assembly every time the service is started.

자세한 내용은 다차원 모델 어셈블리 관리를 참조하세요.For more information, see Multidimensional Model Assemblies Management.

사용자 지정 저장 프로시저Custom stored procedures
Analysis ServicesAnalysis Services데이터 마이닝 데이터 마이닝 개체를 사용 하는 저장된 프로시저 사용을 지원 합니다. data mining supports the use of stored procedures to work with data mining objects. 사용자 고유의 저장 프로시저를 만들어 기능을 확장하거나 예측 쿼리 및 내용 쿼리에서 반환된 데이터를 쉽게 사용할 수 있습니다.You can create your own stored procedures to extend functionality and more easily work with data returned by prediction queries and content queries.

저장 프로시저 정의Defining Stored Procedures

교차 유효성 검사를 수행하는 데 사용할 수 있는 저장 프로시저는 다음과 같습니다.The following stored procedures are supported for use in performing cross-validation.

데이터 마이닝 저장 프로시저(Analysis Services - 데이터 마이닝)Data Mining Stored Procedures (Analysis Services - Data Mining)

또한 Analysis ServicesAnalysis Services 에는 데이터 마이닝에 내부적으로 사용되는 많은 시스템 저장 프로시저가 포함되어 있습니다.Additionally, Analysis ServicesAnalysis Services contains many system stored procedures that are used internally for data mining. 시스템 저장 프로시저는 내부적으로 사용되지만 유용한 바로 가기를 지정할 수 있습니다.Although the system stored procedures are for internal use, you might find them useful shortcuts. Microsoft는 이러한 저장 프로시저를 필요에 따라 변경할 권리가 있습니다. 따라서 프로덕션 환경에서 사용하려는 경우 DMX, AMO 또는 XMLA를 사용하여 쿼리를 만드는 것이 좋습니다.Microsoft reserves the right to change these stored procedures as needed; therefore, for production use, we recommend that you create queries by using DMX, AMO, or XMLA.

사용자 지정 플러그 인 알고리즘Custom plug-in algorithms
Analysis ServicesAnalysis Services사용자 고유의 알고리즘을 만들고 다음 서버 인스턴스에 새 데이터 마이닝 서비스 알고리즘을 추가 하기 위한 메커니즘을 제공 합니다. provides a mechanism for creating your own algorithms, and then adding the algorithms as a new data mining service to the server instance.

Analysis Services에서는 COM 인터페이스를 사용하여 플러그 인 알고리즘과 통신합니다.Analysis Services uses COM interfaces to communicate with plugin algorithms. 새 알고리즘을 구현하는 방법에 대한 자세한 내용은 Plugin Algorithms을 참조하십시오.To learn more about how to implement new algorithms, see Plugin Algorithms.

새 알고리즘을 사용하려면 먼저 각각의 새 알고리즘을 등록해야 합니다.You must register each new algorithm before you can use it. 알고리즘을 등록하려면 Analysis ServicesAnalysis Services인스턴스의 .ini 파일에 알고리즘의 필수 메타데이터를 추가하면 됩니다.To register an algorithm, you add the required metadata for the algorithms in the .ini file of the instance of Analysis ServicesAnalysis Services. 새 알고리즘을 사용할 각 인스턴스에 정보를 추가해야 합니다.You must add the information to each instance where you plan to use the new algorithm. 알고리즘을 추가한 후에는 인스턴스를 다시 시작하고 MINING_SERVICES 스키마 행 집합을 사용하여 알고리즘에서 지원하는 옵션 및 공급자를 비롯한 새 알고리즘을 볼 수 있습니다.After you have added the algorithm, you can restart the instance, and use the MINING_SERVICES schema rowset to view the new algorithm, including the options and providers that the algorithm supports.

관련 항목:See Also

다차원 모델 처리(Analysis Services) Processing a multidimensional model (Analysis Services)
DMX(Data Mining Extensions) 참조Data Mining Extensions (DMX) Reference