Trasformare i dati usando l'attività Hive di Hadoop in Azure Data FactoryTransform data using Hadoop Hive activity in Azure Data Factory

L'attività Hive di HDInsight in una pipeline di Data Factory esegue query Hive sul proprio cluster HDInsight o sul cluster HDInsight on demand.The HDInsight Hive activity in a Data Factory pipeline executes Hive queries on your own or on-demand HDInsight cluster. Questo articolo si basa sull'articolo relativo alle attività di trasformazione dei dati che presenta una panoramica generale della trasformazione dei dati e le attività di trasformazione supportate.This article builds on the data transformation activities article, which presents a general overview of data transformation and the supported transformation activities.

Se non si ha familiarità con Azure Data Factory, leggere l'Introduzione ad Azure Data Factory ed eseguire l'Esercitazione: Trasformare i dati prima di leggere questo articolo.If you are new to Azure Data Factory, read through Introduction to Azure Data Factory and do the Tutorial: transform data before reading this article.

SintassiSyntax

{
    "name": "Hive Activity",
    "description": "description",
    "type": "HDInsightHive",
    "linkedServiceName": {
        "referenceName": "MyHDInsightLinkedService",
        "type": "LinkedServiceReference"
    },
    "typeProperties": {
        "scriptLinkedService": {
            "referenceName": "MyAzureStorageLinkedService",
            "type": "LinkedServiceReference"
        },
        "scriptPath": "MyAzureStorage\\HiveScripts\\MyHiveSript.hql",
        "getDebugInfo": "Failure",
        "arguments": [
            "SampleHadoopJobArgument1"
        ],
        "defines": {
            "param1": "param1Value"
        }
    }
}

Dettagli sintassiSyntax details

ProprietàProperty DescriptionDescription ObbligatoriaRequired
namename Nome dell'attivitàName of the activity Yes
descriptiondescription Testo descrittivo per lo scopo dell'attivitàText describing what the activity is used for NoNo
typetype Per l'Attività Hive, il tipo di attività è HDinsightHiveFor Hive Activity, the activity type is HDinsightHive Yes
linkedServiceNamelinkedServiceName Riferimento al cluster HDInsight registrato come servizio collegato in Data Factory.Reference to the HDInsight cluster registered as a linked service in Data Factory. Per informazioni su questo servizio collegato, vedere l'articolo Servizi collegati di calcolo.To learn about this linked service, see Compute linked services article. Yes
scriptLinkedServicescriptLinkedService Riferimento a un servizio collegato Archiviazione di Azure usato per memorizzare lo script Hive da eseguire.Reference to an Azure Storage Linked Service used to store the Hive script to be executed. Se non si specifica questo servizio collegato, viene usato il servizio collegato Archiviazione di Azure definito nel servizio collegato HDInsight.If you don't specify this Linked Service, the Azure Storage Linked Service defined in the HDInsight Linked Service is used. NoNo
scriptPathscriptPath Specificare il percorso del file di script archiviato nel servizio Archiviazione di Azure indicato da scriptLinkedService.Provide the path to the script file stored in the Azure Storage referred by scriptLinkedService. Il nome del file distingue tra maiuscole e minuscole.The file name is case-sensitive. Yes
getDebugInfogetDebugInfo Specifica quando i file di log vengono copiati nell'Archiviazione di Azure usata dal cluster HDInsight (o) indicata da scriptLinkedService.Specifies when the log files are copied to the Azure Storage used by HDInsight cluster (or) specified by scriptLinkedService. Valori consentiti: None, Always o Failure.Allowed values: None, Always, or Failure. Valore predefinito: None.Default value: None. NoNo
argumentsarguments Specifica una matrice di argomenti per un processo Hadoop.Specifies an array of arguments for a Hadoop job. Gli argomenti vengono passati a ogni attività come argomenti della riga di comando.The arguments are passed as command-line arguments to each task. NoNo
definesdefines Nei riferimenti all'interno dello script Hive, specificare i parametri come coppie chiave/valore.Specify parameters as key/value pairs for referencing within the Hive script. NoNo
queryTimeoutqueryTimeout Valore di timeout di query (in minuti).Query timeout value (in minutes). Applicabile se il cluster HDInsight è abilitato per Enterprise Security Package.Applicable when the HDInsight cluster is with Enterprise Security Package enabled. NoNo

Passaggi successiviNext steps

Vedere gli articoli seguenti che illustrano come trasformare i dati in altri modi:See the following articles that explain how to transform data in other ways: