浏览预测模型(数据挖掘中级教程)

既然您已经生成了预测挖掘模型,就可以使用数据挖掘设计器的**“挖掘模型查看器”选项卡来浏览结果。 Microsoft 时序查看器包含两个选项卡:“图表”“模型”**。

您生成的预测挖掘模型描述从 2001 年至 2004 年各产品在以下三个不同区域的销售额:欧洲、北美洲和太平洋地区。 因此,Microsoft 时序算法会创建一个包含多个树的时序模型,其中每个树包含区域、产品和可预测属性的一个不同组合。

该查看器中的每个选项卡会为完成的时序模型中的信息提供不同的视图。

  • “图表”选项卡

  • “模型”选项卡

  • “一般内容”视图

“图表”选项卡

Microsoft 时序查看器的**“图表”**选项卡以图形方式显示算法创建的每一个树。 一个时序树包含产品、区域和可预测属性的一个唯一组合。

该查看器右侧的图例列出下拉列表中所选的时序,并且为每个时序包含一个复选框。 通过选中和清除图例中的复选框,您可以控制查看器中显示的时序。

还可以更改显示选项(例如用于每个时序的颜色),或者查看图表中任意点的值。

选择时序

  1. 单击**“挖掘模型查看器”选项卡的“图表”**选项卡(如果它尚未显示)。

  2. 单击图表视图右侧的下拉列表,选中所有复选框。 图表应包含 24 条不同的序列线。

  3. 单击“确定”。

  4. 在图表右侧的复选框中取消选择相应的框,以便暂时隐藏基于 Amount 的所有序列线。

  5. 然后,取消选择与 R750 和 R250 自行车有关的复选框。

    现在,图表仅包含以下 6 条序列线,因此您可以更方便地比较 M200 和 T1000 自行车的趋势。

    • M200 Europe:Quantity

    • M200 North America:Quantity

    • M200 Pacific: Quantity

    • T1000 Europe: Quantity t

    • T1000 North America:Quantity

    • T1000 Pacific: Quantity

预测 M200 和 T1000 数量的序列预测 M200 和 T1000 数量的序列

图表会同时显示历史数据和预测数据。 预测数据带有底纹,以便与历史数据区分开。 为了方便比较不同的序列,您还可以更改与图形中每条线关联的颜色。 有关详细信息,请参阅如何更改数据挖掘查看器中使用的颜色

趋势线表示所有区域的总销售额在普遍增长,并且每 12 个月(在 12 月)出现一次峰值。 预测通常将按此趋势进行。 通过观察图表,您还可以发现 T1000 自行车数据的开始时间比其他产品序列数据的开始时间晚得多。

默认情况下,Analysis Services 为每个时序显示 5 个预测步骤。 您可以更改此值以显示更多或更少的预测步骤。 还可以通过向图表添加误差线来以图形方式查看预测的标准偏差。

更改“图表”视图中的预测和显示选项

  1. 510 逐步更改**“预测步骤”**的值,然后再恢复到 6

    请注意,在历史数据具有较大波动的趋势线中,在预测过程中波动性会增强。

  2. 选中**“显示偏差”**复选框。

  3. 将鼠标停留在 M200 序列的误差线上。

  4. 将鼠标停留在 T1000 Pacific 序列的误差线上。

您将使用这些结果进行进一步调查。 稍后,您将开发一个对所有区域求平均值的模型,因此该模型的波动性不会有这么大。

返回页首

“模型”选项卡

通过数据挖掘设计器中的 Microsoft 时序查看器的**“模型”**选项卡,您可以以决策树图形的方式查看时序。 系统将为您包含在模型中的每个序列计算一个单独的树。 在时序模型中,如果时序是线性的,则决策树图形可能有一个节点;否则就像常规的决策树那样,它可能会有与每个分支关联的多个节点和条件。

时序的决策树图形中的节点包含各种类型的信息:

  • 事例集中度,表示**“背景”**控件中指定的可预测属性的状态。 **“节点图例”**窗口和将鼠标停留在树中的某个对象上时显示的工具提示都会给出精确的事例数目。

  • 节点的回归公式。 ARTXP 回归公式仅在叶节点中可用。 ARIMA 公式在树的根节点中可用。

  • 表示属性范围的菱形图。 菱形位于节点的中间,其宽度表示该节点处属性的方差。

查看时序模型的决策树

  1. 在该查看器的**“模型”选项卡的“树”**列表中,选择 M200 North America: Amount 序列。

    一个节点随即显示在图形中。

  2. 将鼠标指针停留在该节点上。

    对于**“全部”**节点,显示的工具提示包括如所有序列中事例的数目、从数据分析派生的时序公式等信息。

  3. 单击该节点并查看**“挖掘图例”**。

    **“挖掘图例”**包括的信息与工具提示中的信息类似,但前者还会提供包括值直方图在内的其他详细信息。

  4. 在该查看器的**“模型”选项卡的“树”**列表中,选择 M200 Pacific: Amount 序列。

    树图形随即包含一个**“全部”**节点和两个子节点。 子节点中的文本描述用于拆分树的条件。

  5. 将鼠标指针停留在某个子节点上,查看工具提示的内容。 或者,单击该节点,查看**“挖掘图例”**。

    对于子节点,描述包括树的每个分支中的事例计数以及导致树拆分的任何其他条件。

返回页首

一般内容树查看器

除了时序的自定义查看器外,Analysis Services 还提供了 Microsoft 一般内容树查看器。 无论您使用哪种算法,此查看器均可用于所有数据挖掘模型。 一般内容树查看器可以从**“查看器”**下拉列表中找到。

在此查看器中,无论用于分析的数据或算法是什么,每个挖掘模型都表示为一个包含一系列节点的树。 每个节点表示有关数据的特定子集的已知知识。 根据算法和可预测属性的类型的不同,节点的具体内容也会不同,但内容的通用架构是相同的。

由于您创建的数据挖掘模型是混合模型,它结合使用了 ARTXP 和 ARIMA 算法,因此,Analysis Services 使用每个算法轮流为每个时序创建单独的 ARTXP 和 ARIMA 模型。 使用 Microsoft 时序查看器浏览预测挖掘模型时,Analysis Services 会将这两种算法的结果结合起来,并将挖掘模型显示为单个树,其中树的每个节点都会包含来自这两种算法的特定内容。

但是,使用 Microsoft 一般内容树查看器时,会在预测挖掘模型中将每种算法生成的内容公开为两种不同类型的节点。 您可以深化模型的 ARTXP 版或模型的 ARIMA 版,以查看进一步的详细信息。

在一般内容查看器中查看特定数据序列的详细信息

  1. 在**“挖掘模型查看器”选项卡中,从“查看器”下拉列表中选择“Microsoft 一般内容树查看器”**。

  2. 在**“节点标题”**窗格中,单击最顶部的(“全部”)节点。

  3. 在**“节点详细信息”**窗格中,查看 ATTRIBUTE_NAME 的值。

    此值会告诉您该节点中包含哪个序列或产品和区域的哪个组合。 在 AdventureWorks 示例中,最顶部的节点是 M200 Europe 序列的节点。

  4. 在**“节点标题”**窗格中,定位到具有子节点的第一个节点上。

    如果某个序列节点有子级,则 Microsoft 时序查看器的**“模型”**选项卡上显示的树视图也将有一个分支结构。

  5. 展开该节点,然后单击某个子节点。

    架构的 NODE_DESCRIPTION 列包含导致树拆分的条件。

  6. 在**“节点标题”**窗格中,单击最顶部的 ARIMA 节点,然后展开该节点直到所有子节点全部显示。

  7. 在**“节点详细信息”**窗格中,查看 ATTRIBUTE_NAME 的值。

    此值会告诉您该节点中包含哪个时序。 ARIMA 部分中最顶部的节点应该与(“全部”)部分中最顶部的节点相匹配。 在 AdventureWorks 示例中,该节点包含序列 M200 Europe 的 ARIMA 分析。

有关详细信息,请参阅时序模型的挖掘模型内容(Analysis Services - 数据挖掘)

返回页首