Attività Pig HadoopHadoop Pig Task

Usare l'attività Pig Hadoop per eseguire script Pig in un cluster Hadoop.Use the Hadoop Pig Task to run Pig script on a Hadoop cluster.

Per aggiungere un'attività Pig Hadoop, trascinarla e rilasciarla nella finestra di progettazione.To add a Hadoop Pig Task, drag and drop it to the designer. Fare doppio clic sull'attività o fare clic con il pulsante destro del mouse e scegliere Modificaper visualizzare la finestra di dialogo Editor attività Pig Hadoop .Then double-click on the task, or right-click and click Edit, to see the Hadoop Pig Task Editor dialog box.

Editor attività Pig HadoopHadoop Pig Task Editor

OpzioniOptions

Configurare le opzioni seguenti nella finestra di dialogo Editor attività Pig Hadoop .Configure the following options in the Hadoop Pig Task Editor dialog box.

CampoField DescriptionDescription
Connessione HadoopHadoop Connection Specificare un'istanza esistente di Gestione connessione Hadoop o crearne una nuova.Specify an existing Hadoop Connection Manager or create a new one. Questa istanza di Gestione connessione indica dove è ospitato il servizio WebHCat.This connection manager indicates where the WebHCat service is hosted.
SourceTypeSourceType Specificare il tipo di origine della query.Specify the source type of the query. I valori disponibili sono ScriptFile e DirectInput.Available values are ScriptFile and DirectInput.
InlineScriptInlineScript Quando il valore di SourceType è DirectInput, specificare lo script Pig.When the value of SourceType is DirectInput, specify the pig script.
HadoopScriptFilePathHadoopScriptFilePath Quando il valore di SourceType è ScriptFile, specificare il percorso del file di script in Hadoop.When the value of SourceType is ScriptFile, specify the script file path on Hadoop.
TimeoutInMinutesTimeoutInMinutes Specificare un valore di timeout in minuti.Specify a timeout value in minutes. Il processo Hadoop viene interrotto se non è stato completato prima del timeout.The Hadoop job stops if it has not finished before the timeout elapses. Specificare 0 per pianificare il processo Hadoop in modo che sia eseguito in modo asincrono.Specify 0 to schedule the Hadoop job to run asynchronously.

Vedere ancheSee Also

Gestione connessione HadoopHadoop Connection Manager