Hadoop Pig 任务

适用于:SQL Server Azure 数据工厂中的 SSIS Integration Runtime

使用 Hadoop Pig 任务可以在 Hadoop 群集上运行 Pig 脚本。

要添加 Hadoop Pig 任务,请将其拖放到设计器。 然后双击该任务,或右键单击,然后单击“编辑”,以打开“Hadoop Pig 任务编辑器”对话框。

Hadoop Pig 任务编辑器

选项

在“Hadoop Pig 任务编辑器”对话框 中配置下列选项。

字段 说明
Hadoop 连接 指定现有的一个 Hadoop 连接管理器,或新建一个 Hadoop 连接管理器。 此连接管理器指明 WebHCat 服务的托管位置。
SourceType 指定该查询的源类型。 可用的值为“ScriptFile” 和“DirectInput”
InlineScript 当“SourceType” 的值为“DirectInput” 时,指定 Pig 脚本。
HadoopScriptFilePath 当“SourceType” 的值为“ScriptFile” 时,在 Hadoop 上指定脚本文件路径。
TimeoutInMinutes 指定超时值(以分钟为单位)。 如果 Hadoop 作业在超时已过之前未完成,则该作业停止。 指定 0 则计划以异步方式运行 Hadoop 作业。

另请参阅

Hadoop 连接管理器