数据挖掘基础教程

 

适用于: SQL Server 2016 Preview

欢迎使用 Microsoft Analysis Services 数据挖掘基础教程。 Microsoft SQL Server 提供一个集成的环境,用于创建数据挖掘模型和进行预测。 在本教程中,您将完成目标邮递活动,在其中使用机器学习来分析和预测客户购买行为的一种方案。 本教程说明了如何使用三种最重要的数据挖掘算法:聚类、决策树和 Naive Bayes。 您还将了解如何分析您发现的内容使用挖掘模型查看器,以及如何创建预测和准确性图表中包含的数据挖掘工具使用 Microsoft SQL Server Analysis Services。 虚构公司 Adventure Works Cycles 用于所有的示例。

了解了如何使用数据挖掘工具后,我们建议您还要完成 数据挖掘中级教程 (Analysis Services-数据挖掘 )。 这些课演示如何使用预测、市场篮分析、时序、关联模型、嵌套表、顺序分析和聚类分析。

教程方案

在本教程中,是的一名员工 Adventure Works Cycles 谁具有已执行任务的详细了解该公司的客户根据历史购买情况,然后使用这些历史数据来进行营销的预测,可以使用。 公司以前从未进行过数据挖掘,因此您必须创建一个专门用于数据挖掘的新数据库并建立几个数据挖掘模型。

学习内容

本教程将讲述如何创建和使用数种不同类型的计算机学习方法。 您还将学习如何创建挖掘模型的副本以及如何将筛选器应用到输入数据以获得不同结果。 之后,您可以使用提升图比较两个模型的结果。 最后,您将使用钻取功能从基础挖掘结构检索其他数据。

Microsoft Analysis Services 数据挖掘包括以下功能,帮助您轻松地开发和比较多个预测模型并且然后对结果进行操作︰

  • 维持测试集-创建挖掘结构时,您现在可以将挖掘结构中的数据分为定型集和测试集。 这让您能够在类似的数据集上测试模型,以及比较相关模型的准确性。

  • 挖掘模型筛选器-现在,您可以将筛选器附加到挖掘模型,并在定型和测试期间应用筛选器。 这让您能够轻松地在不同的数据子集上生成相关模型。

  • 钻取到结构事例和结构列的 现在,你可以轻松地转从挖掘模型中的通用模式到数据源中的可行详细信息。

本教程分为以下几课:

第 1 课︰ 准备 Analysis Services 数据库 (数据挖掘基础教程 )
在本课程中,您将学习如何创建新的 Analysis Services 数据库,添加数据源和数据源视图,以及准备将用于数据挖掘的新数据库。

第 2 课︰ 生成 Targeted 的 Mailing 结构 (数据挖掘基础教程 )
在本课中,您将学习如何创建可用作目标邮寄方案一部分的挖掘模型结构。

第 3 课:添加和处理模型
在本课中,您将学习如何向结构中添加模型。 您创建的模型是用如下算法生成的:

  • Microsoft 决策树

  • Microsoft 群集

  • Microsoft Naive Bayes

第 4 课︰ 浏览 Targeted 的 Mailing 模型 (数据挖掘基础教程 )
在本课中,您将学习如何使用查看器浏览和解释在每个模型中发现的内容。

第 5 课︰ 测试模型 (数据挖掘基础教程 )
在本课中,您将创建某个 Targeted Mailing 模型的副本,添加一个挖掘模型筛选器以将定型数据限制在特定客户集,然后评估该模型的可行性。

第 6 课:创建和使用预测(数据挖掘基础教程)
在本数据挖掘基础教程的最后一课中,您将使用该模型预测哪些客户最有可能购买自行车。 随后,您将钻取到基础事例以获取联系信息。

要求

请确保已安装下列软件:

  • Microsoft SQL Server 2016

  • Microsoft SQL Server Analysis Services 在多维模式下

  • AdventureWorksDW2012 数据库。

为了增强安全性,示例数据库不随 SQL Server 一起安装。 若要安装的正式数据库 Microsoft SQL Server, ,请访问 Microsoft SQL Sample Databases 页,并选择 SQL Server 2016。

另请参阅

数据挖掘解决方案
挖掘模型任务和操作指南
使用 DMX 创建和查询数据挖掘模型:教程(Analysis Services - 数据挖掘)