市场篮 DMX 教程

在本教程中,您将学习如何使用数据挖掘扩展插件 (DMX) 查询语言来创建、定型和浏览挖掘模型。然后,您将使用这些挖掘模型创建预测,说明可能同时购买的产品。

将使用 AdventureWorksDW2008 示例数据库中所包含的数据创建挖掘模型,该数据库用于存储虚构公司 Adventure Works Cycles 的数据。Adventure Works Cycles 是一家大型跨国制造公司。公司生产金属和复合材料的自行车,产品远销北美、欧洲和亚洲市场。公司总部设在华盛顿州的伯瑟尔市,拥有 290 名雇员,而且拥有多个活跃在世界各地的地区性销售团队。

教程方案

Adventure Works Cycles 决定创建使用数据挖掘功能的自定义应用程序来预测其客户想要同时购买的产品类型。该自定义应用程序的目的是指定一组产品,并预测另外还有哪些产品将与指定的产品一同购买。然后,Adventure Works Cycles 将使用此信息在其网站中添加建议功能,并更好地组织向客户提供信息的方式。

MicrosoftSQL ServerAnalysis Services 提供了多个可用于完成此任务的工具:

数据挖掘扩展插件 (DMX) 是 Analysis Services 提供的一种查询语言,可以使用它来创建和处理挖掘模型。Microsoft 关联算法创建可以预测将同时购买的产品的模型。

本教程的目的是提供将在自定义应用程序中使用的 DMX 查询。

有关详细信息,请参阅数据挖掘项目(Analysis Services - 数据挖掘)

挖掘结构和挖掘模型

开始创建 DMX 语句之前,了解 Analysis Services 用来创建挖掘模型的主要对象十分重要。“挖掘结构”是一种数据结构,它定义生成挖掘模型的数据域。单个挖掘结构可包含多个共享同一个域的挖掘模型。挖掘模型可向挖掘结构所代表的数据应用挖掘模型算法。

挖掘结构的构造块是挖掘结构列,这些列对数据源所包含的数据进行说明。这些列包含诸如数据类型、内容类型以及数据分发方式等信息。

挖掘模型必须包含挖掘结构中所述的键列,以及其余列的子集。挖掘模型定义每个列的用法以及用于创建挖掘模型的算法。例如,在 DMX 中,您可以将一列指定为键列或 PREDICT 列。如果有一列未指定,则会将该列假定为一个输入列。

在 DMX 中,有两种创建挖掘模型的方式。您可以使用 CREATE MINING MODEL 语句同时创建挖掘结构以及关联的挖掘模型,也可以首先使用 CREATE MINING STRUCTURE 语句创建挖掘结构,然后使用 ALTER STRUCTURE 语句向结构中添加挖掘模型。下面将介绍这几种方法。

  • CREATE MINING MODEL
    使用此语句可以创建挖掘结构以及关联的同名挖掘模型。挖掘模型名称后追加有“Structure”,以便与挖掘结构区分开。

    如果要创建包含单一挖掘模型的挖掘结构,则此语句将非常有用。

    有关详细信息,请参阅 CREATE MINING MODEL (DMX)

  • CREATE MINING STRUCTURE
    使用此语句可创建不带任何模型的新挖掘结构。

    在使用 CREATE MINING STRUCTURE 时,还可以创建一个维持数据集,使用该数据集可测试任何基于相同挖掘结构的模型。

    有关详细信息,请参阅CREATE MINING STRUCTURE (DMX)

  • ALTER MINING STRUCTURE
    使用此语句可以向服务器中已存在的挖掘结构中添加挖掘模型。

    由于各种原因,您可能需要在单一挖掘结构中添加多个挖掘模型。例如,可以使用不同的算法创建多个挖掘模型以判断哪种方法效果最佳。也可以创建使用相同算法的多个挖掘模型,但将每个挖掘模型中的某个参数设置为不同的值来寻找最佳参数设置。

    有关详细信息,请参阅 ALTER MINING STRUCTURE (DMX)

因为您将创建包含多个挖掘模型的挖掘结构,因此使用本教程中的第二种方法。

有关详细信息,请参阅:

数据挖掘扩展插件 (DMX) 参考, 了解 Select 语句 (DMX), 预测查询 (DMX)

学习内容

本教程分为以下几课:

要求

执行本教程前,请确保安装了下列各项:

  • MicrosoftSQL Server

  • MicrosoftSQL ServerAnalysis Services

  • AdventureWorks 2008 数据库

为了增强安全性,默认情况下将不安装该示例数据库。若要安装 MicrosoftSQL Server 的正式示例数据库,请访问 http://www.CodePlex.com/MSFTDBProdSamples,或者在 Microsoft SQL Server Samples and Community Projects(Microsoft SQL Server 示例和社区项目)主页的 "Microsoft SQL Server Product Samples"(Microsoft SQL Server 产品示例)部分中,单击 Databases,再单击 Releases 选项卡并选择所需的数据库。

注意注意

阅读教程时,建议您将“下一个主题”按钮和“上一个主题”按钮添加到文档查看器工具栏中。有关详细信息,请参阅向帮助中添加“上一步”和“下一步”按钮