Hadoop Pig 작업Hadoop Pig Task

Hadoop Pig 태스크를 사용하여 Hadoop 클러스터에서 Pig 스크립트를 실행합니다.Use the Hadoop Pig Task to run Pig script on a Hadoop cluster.

Hadoop Pig 태스크를 추가하려면 태스크를 디자이너로 끌어서 놓습니다.To add a Hadoop Pig Task, drag and drop it to the designer. 그런 다음 태스크를 두 번 클릭하거나 마우스 오른쪽 단추를 클릭하고 편집을 클릭하여 Hadoop 피그 작업 편집기 대화 상자를 표시합니다.Then double-click on the task, or right-click and click Edit, to see the Hadoop Pig Task Editor dialog box.

Hadoop 피그 작업 편집기Hadoop Pig Task Editor

옵션Options

Hadoop Pig 태스크 편집기 대화 상자에서 다음 옵션을 구성합니다.Configure the following options in the Hadoop Pig Task Editor dialog box.

필드Field DescriptionDescription
Hadoop 연결Hadoop Connection 기존 Hadoop 연결 관리자를 지정하거나 새 연결 관리자를 만듭니다.Specify an existing Hadoop Connection Manager or create a new one. 이 연결 관리자는 WebHCat 서비스가 호스트되는 위치를 나타냅니다.This connection manager indicates where the WebHCat service is hosted.
SourceTypeSourceType 쿼리의 원본 유형을 지정합니다.Specify the source type of the query. 사용 가능한 값은 ScriptFileDirectInput입니다.Available values are ScriptFile and DirectInput.
InlineScriptInlineScript SourceType 의 값이 DirectInput일 때 Pig 스크립트를 지정합니다.When the value of SourceType is DirectInput, specify the pig script.
HadoopScriptFilePathHadoopScriptFilePath SourceType 의 값이 ScriptFile일 때 Hadoop의 스크립트 파일 경로를 지정합니다.When the value of SourceType is ScriptFile, specify the script file path on Hadoop.
TimeoutInMinutesTimeoutInMinutes 제한 시간 값을 분 단위로 지정합니다.Specify a timeout value in minutes. Hadoop 작업은 제한 시간이 경과할 때까지 완료되지 않은 경우 중지됩니다.The Hadoop job stops if it has not finished before the timeout elapses. Hadoop 작업이 비동기적으로 실행되도록 예약하려면 값으로 0을 지정합니다.Specify 0 to schedule the Hadoop job to run asynchronously.

관련 항목:See Also

Hadoop 연결 관리자Hadoop Connection Manager