将 Integration Services 与数据挖掘一起使用

数据挖掘通常被称为“从大型数据库提取有效、可行信息的过程”。换言之,数据挖掘帮助您发现数据中存在的模式和趋势。Microsoft SQL ServerAnalysis Services 为提取和分析这些模式提供了强大的数据挖掘功能和工具。Integration Services 还提供了许多组件,帮助您管理和查询这些数据挖掘模型。

有关 SQL ServerAnalysis Services 中数据挖掘功能的详细信息,请参阅概述(Analysis Services - 数据挖掘)数据挖掘项目(Analysis Services - 数据挖掘)

注意注意

本主题所介绍的部分 Integration Services 组件仅在 SQL Server 的 Enterprise Edition 和 Developer Edition 中可用。

连接管理器

连接管理器是与数据源所进行的连接的逻辑表示形式。使用 Analysis Services 连接管理器可以连接到存储挖掘结构和模型的 Analysis Services 数据库。本主题中介绍的所有任务和数据流组件都需要使用 Analysis Services 连接管理器。

Analysis Services 连接管理器

Analysis Services 连接管理器使包能够连接到运行 Analysis Services 数据库的服务器,或连接到用于访问挖掘结构和挖掘模型的 Analysis Services 项目。在 Business Intelligence Development Studio 中开发包时,仅可连接到 Analysis Services 项目。在运行时,包会连接到您已部署 Analysis Services 的服务器和数据库。

有关详细信息,请参阅 Analysis Services 连接管理器

任务

任务是一些控制流元素,它定义包中执行的工作单元。使用下列任务可以创建或修改数据挖掘结构或模型,还可以处理或查询模型。

Analysis Services 执行 DDL 任务

Analysis Services 执行 DDL 任务运行可以创建、删除或更改挖掘结构和模型的数据定义语言 (DDL) 语句。DDL 语句表示为 Analysis Services 脚本语言 (ASSL) 中的语句,并嵌入 XML for Analysis (XMLA) 命令中。

有关此任务的详细信息,请参阅 Analysis Services 执行 DDL 任务。有关使用 XMLA 创建和更改 Analysis Services 对象的详细信息,请参阅创建和更改对象 (XMLA)

Analysis Services 处理任务

Analysis Services 处理任务可使 Analysis Services 对象(如挖掘模型)的处理实现自动化。

有关此任务的详细信息,请参阅 Analysis Services 处理任务。有关处理 Analysis Services 对象的详细信息,请参阅处理 Analysis Services 对象

数据挖掘查询任务

数据挖掘查询任务根据 Analysis Services 内置的数据挖掘模型运行预测查询。预测查询通过使用挖掘模型来创建对新数据的预测,并将其输出保存到一个或多个表中。

有关此任务的详细信息,请参阅数据挖掘查询任务。有关使用 DMX 查询数据挖掘模型的详细信息,请参阅创建 DMX 预测查询

数据流转换

转换是包的数据流中对数据进行聚合、合并、分发和修改的组件。

数据挖掘查询转换

数据挖掘查询转换针对数据挖掘模型执行预测查询。此转换包含用于创建数据挖掘扩展 (DMX) 查询的查询生成器。通过查询生成器可使用 DMX 语言创建自定义语句,来针对现有挖掘模型计算转换输入数据。与将输出直接保存到一个或多个表中的数据挖掘查询任务不同,数据挖掘查询转换使其输出可供包数据流中的下游组件使用。

有关此转换的详细信息,请参阅数据挖掘查询转换。有关使用 DMX 查询数据挖掘模型的详细信息,请参阅创建 DMX 预测查询

数据流目标

目标是将数据流中的输出加载到不同类型的数据源或创建内存中数据集的数据流组件。

数据挖掘模型定型目标

数据挖掘模型定型目标将该目标接收到的数据通过数据挖掘模型算法传递,从而为数据挖掘模型定型。在定型过程中,该算法将计算数据中元素的模式及相互关系。对新挖掘模型定型后,可以使用该模型来运行预测查询。

有关详细信息,请参阅数据挖掘模型定型目标

用于数据挖掘的其他 Integration Services 组件

Integration Services 还有许多其他组件可用于数据挖掘解决方案的一部分。

  • 若要使用数据子集来定型或测试数据挖掘模型,您可以使用:

    • 行抽样转换:只根据您指定的计数复制行的子集。有关详细信息,请参阅行抽样转换

    • 百分比抽样转换:只根据您指定的百分比复制行的子集。有关详细信息,请参阅百分比抽样转换

  • 若要通过删除重复值和标准化值来清除数据,可以使用:

  • 若要执行文本挖掘,可以使用:

    • 字词提取转换:在筛选出标准干扰词和用户定义的干扰词后,为在源中发现的字词创建一个表。有关详细信息,请参阅字词提取转换

    • 字词查找转换:将输入的字词与引用表中的字词进行匹配。有关详细信息,请参阅字词查找转换

Integration Services 图标(小) 使 Integration Services 保持最新

若要从 Microsoft 获得最新的下载内容、文章、示例和视频,以及从社区获得所选解决方案,请访问 MSDN 或 TechNet 上的 Integration Services 页:

若要获得有关这些更新的自动通知,请订阅该页上提供的 RSS 源。