Configure os clusters no HDInsight com o Apache Hadoop, o Apache Spark, o Apache Kafka e muito maisSet up clusters in HDInsight with Apache Hadoop, Apache Spark, Apache Kafka, and more

Saiba como instalar e configurar clusters no HDInsight com o Apache Hadoop, Apache Spark, Apache Kafka, Consulta Interativa, Apache HBase, Serviços de ML ou Apache Storm.Learn how to set up and configure clusters in HDInsight with Apache Hadoop, Apache Spark, Apache Kafka, Interactive Query, Apache HBase, ML Services, or Apache Storm. Além disso, saiba como personalizar clusters e adicionar segurança ingressando-os em um domínio.Also, learn how to customize clusters and add security by joining them to a domain.

Um cluster Hadoop é composto por várias máquinas virtuais (nós), usadas para processamento distribuído de tarefas.A Hadoop cluster consists of several virtual machines (nodes) that are used for distributed processing of tasks. O Azure HDInsight manipula os detalhes de implementação da instalação e configuração de nós individuais, portanto, você precisa fornecer apenas informações de configuração geral.Azure HDInsight handles implementation details of installation and configuration of individual nodes, so you only have to provide general configuration information.

Importante

A cobrança do cluster HDInsight começa quando um cluster é criado e para quando o cluster é excluído.HDInsight cluster billing starts once a cluster is created and stops when the cluster is deleted. A cobrança é rateada por minuto, portanto, você sempre deve excluir seu cluster quando ele não está mais em uso.Billing is pro-rated per minute, so you should always delete your cluster when it is no longer in use. Saiba como excluir um cluster.Learn how to delete a cluster.

Métodos de instalação de clusterCluster setup methods

A tabela a seguir mostra os diferentes métodos que você pode usar para configurar um cluster HDInsight.The following table shows the different methods you can use to set up an HDInsight cluster.

Clusters criados comClusters created with Navegador da WebWeb browser Linha de comandoCommand line API RESTREST API SDKSDK
Azure portalAzure portal      
Azure Data FactoryAzure Data Factory
CLI do AzureAzure CLI      
PowerShell do AzureAzure PowerShell      
CurlcURL    
Modelos do Gerenciador de Recursos do AzureAzure Resource Manager templates      

Instalação de cluster básicoBasic cluster setup

Este artigo explica a instalação no portal do Azure, onde você pode criar um cluster HDInsight usando a exibição padrão ou o clássico.This article walks you through setup in the Azure portal, where you can create an HDInsight cluster using the default view or Classic.

criação rápida personalizada das opções de criação do hdinsight

Siga as instruções na tela.Follow instructions on the screen. Os detalhes são fornecidos abaixo para:Details are provided below for:

Nome do grupo de recursosResource group name

O Azure Resource Manager ajuda você a trabalhar com os recursos de seu aplicativo como um grupo, chamado de grupo de recursos do Azure.Azure Resource Manager helps you work with the resources in your application as a group, referred to as an Azure resource group. Você pode implantar, atualizar, monitorar ou excluir todos os recursos do seu aplicativo com uma única operação coordenada.You can deploy, update, monitor, or delete all the resources for your application in a single coordinated operation.

Tipos de cluster e configuraçãoCluster types and configuration

Atualmente, o Azure HDInsight apresenta os seguintes tipos de cluster, cada um com um conjunto de componentes para fornecer determinadas funcionalidades.Azure HDInsight currently provides the following cluster types, each with a set of components to provide certain functionalities.

Importante

Clusters HDInsight estão disponíveis em vários tipos, cada um para uma carga de trabalho ou tecnologia distinta.HDInsight clusters are available in various types, each for a single workload or technology. Não há nenhum método com suporte para criar um cluster que combina vários tipos, como o Storm e HBase em um cluster.There is no supported method to create a cluster that combines multiple types, such as Storm and HBase on one cluster. Se sua solução exige tecnologias que sejam distribuídas entre vários tipos de cluster HDInsight, uma rede virtual do Azure pode conectar os tipos de cluster necessários.If your solution requires technologies that are spread across multiple HDInsight cluster types, an Azure virtual network can connect the required cluster types.

Tipo de clusterCluster type FuncionalidadeFunctionality
HadoopHadoop Consulta de Lote e a análise de dados armazenadosBatch query and analysis of stored data
HBaseHBase Processamento de grandes quantidades de dados NoSQL sem esquemaProcessing for large amounts of schemaless, NoSQL data
Consulta InterativaInteractive Query Caching na memória para consultas de Hive interativas e mais rápidasIn-memory caching for interactive and faster Hive queries
KafkaKafka Uma plataforma de streaming distribuída que pode ser usada para compilar pipelines e aplicativos de dados de streaming em tempo realA distributed streaming platform that can be used to build real-time streaming data pipelines and applications
ML ServicesML Services Uma variedade de recursos de estatísticas de Big Data, modelagem preditiva e aprendizado de máquinaVarious big data statistics, predictive modeling, and machine learning capabilities
SparkSpark Processamento na memória, consultas interativas, processamento de transmissão de microlotesIn-memory processing, interactive queries, micro-batch stream processing
StormStorm Processamento de evento em tempo realReal-time event processing

Versão do HDInsightHDInsight version

Escolha a versão do HDInsight para este cluster.Choose the version of HDInsight for this cluster. Para saber mais, confira Versões do HDInsight com suporte.For more information, see Supported HDInsight versions.

Nome do clusterCluster name

Os nomes de cluster HDInsight têm as seguintes restrições:HDInsight cluster names have the following restrictions:

  • Caracteres permitidos: a-z, 0-9, A-ZAllowed characters: a-z, 0-9, A-Z
  • Comprimento máximo: 59Max length: 59
  • Nomes reservados: aplicativosReserved names: apps
  • O escopo de nomenclatura de cluster é para todos os Azure, em todas as assinaturas.The cluster naming scope is for all Azure, across all subscriptions. Portanto, o nome do cluster deve ser exclusivo em todo o mundo.So the cluster name must be unique worldwide.
  • Os seis primeiros caracteres devem ser exclusivos em uma VNETFirst six characters must be unique within a VNET

Logon de cluster e o nome de usuário SSHCluster login and SSH username

Com os clusters HDInsight, você pode configurar duas contas de usuário durante a criação de cluster:With HDInsight clusters, you can configure two user accounts during cluster creation:

  • Usuário HTTP: o nome de usuário padrão é admin. Ele usa a configuração básica no portal do Azure.HTTP user: The default username is admin. It uses the basic configuration on the Azure portal. Às vezes, ele é chamado "Usuário de cluster".Sometimes it is called "Cluster user."
  • Usuário SSH: usado para se conectar ao cluster por meio de SSH.SSH user: Used to connect to the cluster through SSH. Para obter mais informações, confira Usar SSH com HDInsight.For more information, see Use SSH with HDInsight.

O nome de usuário HTTP tem as seguintes restrições:The HTTP username has the following restrictions:

  • Caracteres especiais permitidos: _ e @Allowed special characters: _ and @
  • Caracteres não permitidos: #;. "',/: '! *? $ (){}[] < > | &--= +% ~ ^ espaçoCharacters not allowed: #;."',/:`!*?$(){}[]<>|&--=+%~^space
  • Comprimento máximo: 20Max length: 20

O nome de usuário do SSH tem as seguintes restrições:The SSH username has the following restrictions:

  • Caracteres especiais permitidos: _ e @Allowed special characters: _ and @
  • Caracteres não permitidos: #;. "',/: '! *? $ (){}[] < > | &--= +% ~ ^ espaçoCharacters not allowed: #;."',/:`!*?$(){}[]<>|&--=+%~^space
  • Comprimento máximo: 64Max length: 64
  • Nomes reservados: Hadoop, usuários, oozie, Hive, mapred, ambari-QA, Zookeeper, tez, HDFS, sqoop, yarn, hcat, AMS, HBase, Storm, administrador, administrador, usuário, Usuário1, teste, Usuário2, Test1, usuário3, admin1, 1, 123, a, actuser, ADM, admin2, ASPNET, backup, console, David, convidado, John, proprietário, raiz, servidor, SQL, suporte, support_388945a0, sys, test2, test3, User4, User5, SparkReserved names: hadoop, users, oozie, hive, mapred, ambari-qa, zookeeper, tez, hdfs, sqoop, yarn, hcat, ams, hbase, storm, administrator, admin, user, user1, test, user2, test1, user3, admin1, 1, 123, a, actuser, adm, admin2, aspnet, backup, console, david, guest, john, owner, root, server, sql, support, support_388945a0, sys, test2, test3, user4, user5, spark

O Pacote de Segurança Empresarial permite que você integre o HDInsight com o Active Directory e o Apache Ranger.The Enterprise security package allows you to integrate HDInsight with Active Directory and Apache Ranger. Vários usuários podem ser criados usando o pacote de segurança empresarial.Multiple users can be created using the Enterprise security package.

Local (regiões) para armazenamento e clustersLocation (regions) for clusters and storage

Você não precisa especificar o local do cluster explicitamente: o cluster está no mesmo local que o armazenamento padrão.You don't need to specify the cluster location explicitly: The cluster is in the same location as the default storage. Para ver uma lista das regiões com suporte, clique na lista suspensa Região em Preços do HDInsight.For a list of supported regions, click the Region drop-down list on HDInsight pricing.

Pontos de extremidade de armazenamento para clustersStorage endpoints for clusters

Embora uma instalação local do Hadoop use o HDFS (Sistema de Arquivos Distribuído Hadoop) para armazenamento no cluster, na nuvem você usa pontos de extremidade de armazenamento conectados ao cluster.Although an on-premises installation of Hadoop uses the Hadoop Distributed File System (HDFS) for storage on the cluster, in the cloud you use storage endpoints connected to cluster. O uso do armazenamento em nuvem significa que você pode excluir com segurança os clusters HDInsight usados para computação e, ao mesmo tempo, manter seus dados.Using cloud storage means you can safely delete the HDInsight clusters used for computation while still retaining your data.

Os clusters HDInsight podem usar as seguintes opções de armazenamento:HDInsight clusters can use the following storage options:

  • Azure Data Lake Store Gen2Azure Data Lake Storage Gen2
  • Azure Data Lake Storage Gen1Azure Data Lake Storage Gen1
  • Armazenamento do Azure Uso Geral v2Azure storage General Purpose v2
  • Armazenamento do Azure Uso Geral v1Azure storage General Purpose v1
  • Blob de blocos de armazenamento do Azure (com suporte apenas como armazenamento secundário)Azure storage Block blob (only supported as secondary storage)

Para obter mais informações sobre opções de armazenamento com o HDInsight, consulte comparar as opções de armazenamento para uso com clusters do Azure HDInsight.For more information on storage options with HDInsight, see Compare storage options for use with Azure HDInsight clusters.

Aviso

Não há suporte para usar uma conta de armazenamento adicional em um local diferente do cluster HDInsight.Using an additional storage account in a different location from the HDInsight cluster is not supported.

Durante a configuração, para o ponto de extremidade de armazenamento padrão, você especifica um contêiner de blob de uma conta de Armazenamento do Azure ou um Data Lake Storage.During configuration, for the default storage endpoint you specify a blob container of an Azure Storage account or Data Lake Storage. O armazenamento padrão contém os logs de aplicativo e de sistema.The default storage contains application and system logs. Opcionalmente, você pode especificar contas adicionais do Armazenamento do Azure e do Data Lake Storage vinculadas que o cluster possa acessar.Optionally, you can specify additional linked Azure Storage accounts and Data Lake Storage accounts that the cluster can access. O cluster HDInsight e as contas de armazenamento padrão dependentes devem estar na mesma localização do Azure.The HDInsight cluster and the dependent storage accounts must be in the same Azure location.

Configurações de armazenamento de cluster: pontos de extremidade de armazenamento compatível com HDFS

Observação

O recurso que requer transferência segura impõe todas as solicitações para sua conta por meio de uma conexão segura.The feature that requires secure transfer enforces all requests to your account through a secure connection. Somente o cluster HDInsight versão 3,6 ou mais recente dá suporte a esse recurso.Only HDInsight cluster version 3.6 or newer supports this feature. Para obter mais informações, consulte criar Apache Hadoop cluster com contas de armazenamento de transferência segura no Azure HDInsight.For more information, see Create Apache Hadoop cluster with secure transfer storage accounts in Azure HDInsight.

Metastores opcionaisOptional metastores

Você pode criar metastores Hive ou Apache Oozie opcionais.You can create optional Hive or Apache Oozie metastores. No entanto, nem todos os tipos de cluster dão suporte a metastores e o SQL Data Warehouse do Azure não é compatível com metastores.However, not all cluster types support metastores, and Azure SQL Data Warehouse isn't compatible with metastores.

Para obter mais informações, consulte Usar armazenamentos de metadados externos no Azure HDInsight.For more information, see Use external metadata stores in Azure HDInsight.

Importante

Ao criar um metastore personalizado, não use traços, hifens ou espaços no nome do banco de dados.When you create a custom metastore, don't use dashes, hyphens, or spaces in the database name. Isso pode fazer com que o processo de criação de cluster falhe.This can cause the cluster creation process to fail.

Metastore do HiveHive metastore

Se você deseja reter suas tabelas Hive depois de excluir um cluster HDInsight, use uma metastore personalizada.If you want to retain your Hive tables after you delete an HDInsight cluster, use a custom metastore. Você poderá então anexar a metastore a outro cluster HDInsight.You can then attach the metastore to another HDInsight cluster.

Um metastore do HDInsight criado para uma versão de cluster do HDInsight não pode ser compartilhado entre diferentes versões de cluster do HDInsight.An HDInsight metastore that is created for one HDInsight cluster version cannot be shared across different HDInsight cluster versions. Para obter uma lista das versões do HDInsight, consulte Versões do HDInsight com suporte.For a list of HDInsight versions, see Supported HDInsight versions.

Metastore do OozieOozie metastore

Para aumentar o desempenho durante o uso do Oozie, use um metastore personalizado.To increase performance when using Oozie, use a custom metastore. Uma metastore também pode fornecer acesso a dados de trabalho do Oozie depois de você excluir o cluster.A metastore can also provide access to Oozie job data after you delete your cluster.

Importante

Não é possível reutilizar um metastore personalizado do Oozie.You cannot reuse a custom Oozie metastore. Para usar um metastore personalizado do Oozie, é necessário fornecer um Banco de Dados SQL do Azure vazio ao criar o cluster HDInsight.To use a custom Oozie metastore, you must provide an empty Azure SQL Database when creating the HDInsight cluster.

Pacote de segurança empresarialEnterprise security package

Para tipos de cluster Hadoop, HBase, Kafka, Spark e Consulta Interativa, você pode optar por habilitar o Enterprise Security Package.For Hadoop, Spark, HBase, Kafka, and Interactive Query cluster types, you can choose to enable the Enterprise Security Package. Esse pacote fornece a opção de ter uma configuração mais segura de cluster usando o Apache Ranger e integrando com o Azure Active Directory.This package provides option to have a more secure cluster setup by using Apache Ranger and integrating with Azure Active Directory. Para obter mais informações, consulte visão geral da segurança corporativa no Azure HDInsight.For more information, see Overview of enterprise security in Azure HDInsight.

opções de criação do hdinsight escolher pacote de segurança empresarial

Para obter mais informações sobre a criação de cluster HDInsight ingressado no domínio, consulte Criar ambiente de área restrita do HDInsight ingressado no domínio.For more information on creating domain-joined HDInsight cluster, see Create domain-joined HDInsight sandbox environment.

Estender clusters com uma rede virtualExtend clusters with a virtual network

Se sua solução exige tecnologias que sejam distribuídas entre vários tipos de cluster HDInsight, uma rede virtual do Azure pode conectar os tipos de cluster necessários.If your solution requires technologies that are spread across multiple HDInsight cluster types, an Azure virtual network can connect the required cluster types. Essa configuração permite que os clusters e qualquer código que você implantar neles se comuniquem diretamente uns com os outros.This configuration allows the clusters, and any code you deploy to them, to directly communicate with each other.

Para obter mais informações sobre como usar uma rede virtual do Azure com o HDInsight, consulte planejar uma rede virtual para o hdinsight.For more information on using an Azure virtual network with HDInsight, see Plan a virtual network for HDInsight.

Para obter um exemplo de como usar dois tipos de cluster em uma rede virtual do Azure, confira Usar Streaming Estruturado do Apache Spark com o Apache Kafka.For an example of using two cluster types within an Azure virtual network, see Use Apache Spark Structured Streaming with Apache Kafka. Para obter mais informações sobre como usar o HDInsight com uma rede virtual, incluindo requisitos de configuração específicos para a rede virtual, consulte planejar uma rede virtual para o HDInsight.For more information about using HDInsight with a virtual network, including specific configuration requirements for the virtual network, see Plan a virtual network for HDInsight.

Configurar o tamanho do clusterConfigure cluster size

Você é cobrado pelo uso de nó enquanto o cluster existe.You are billed for node usage for as long as the cluster exists. A cobrança é iniciada quando um cluster é criado e para quando o cluster é excluído.Billing starts when a cluster is created and stops when the cluster is deleted. Os clusters não podem ser desalocados ou colocados em espera.Clusters can’t be de-allocated or put on hold.

Número de nós para cada tipo de clusterNumber of nodes for each cluster type

Cada tipo de cluster tem seu próprio número de nós, terminologia para nós no cluster e tamanho da VM padrão.Each cluster type has its own number of nodes, terminology for nodes, and default VM size. Na tabela a seguir, o número de nós para cada tipo de nó está entre parênteses.In the following table, the number of nodes for each node type is in parentheses.

TipoType NósNodes DiagramaDiagram
HadoopHadoop Nó de cabeçalho (2), nó de trabalho (1 +)Head node (2), Worker node (1+) Nós de cluster Hadoop do HDInsight
HBaseHBase Servidor de cabeçalho (2), Servidor de região (1 +), Nó mestre/do ZooKeeper (3)Head server (2), region server (1+), master/ZooKeeper node (3) Configuração de tipo de cluster HBase do HDInsight
StormStorm Nó do Nimbus (2), Servidor do supervisor (1+), Nó do ZooKeeper (3)Nimbus node (2), supervisor server (1+), ZooKeeper node (3) Configuração de tipo de cluster do HDInsight Storm
SparkSpark Nó de cabeçalho (2), nó de trabalho (1 +), nó ZooKeeper (3) (gratuito para o tamanho de VM a1 ZooKeeper)Head node (2), Worker node (1+), ZooKeeper node (3) (free for A1 ZooKeeper VM size) Configuração de tipo de cluster HDInsight Spark

Para obter mais informações, consulte Configuração de nó padrão e tamanhos de máquina virtual para clusters em "Quais são os componentes do Hadoop e as versões no HDInsight?"For more information, see Default node configuration and virtual machine sizes for clusters in "What are the Hadoop components and versions in HDInsight?"

O custo de clusters HDInsight é determinado pelo número de nós e pelos tamanhos de máquinas virtuais para os nós.The cost of HDInsight clusters is determined by the number of nodes and the virtual machines sizes for the nodes.

Diferentes tipos de cluster têm diferentes tipos de nó, números de nós e tamanhos de nós:Different cluster types have different node types, numbers of nodes, and node sizes:

  • Padrão de tipo de cluster Hadoop:Hadoop cluster type default:
    • Dois nós de cabeçalhoTwo head nodes
    • Quatro nós de trabalhoFour Worker nodes
  • Padrão de tipo de cluster Storm:Storm cluster type default:
    • Dois nós NimbusTwo Nimbus nodes
    • Três nós ZooKeeperThree ZooKeeper nodes
    • Quatro nós supervisoresFour supervisor nodes

Se você estiver apenas experimentando o HDInsight, recomendamos usar um nó de trabalho.If you are just trying out HDInsight, we recommend you use one Worker node. Para obter mais informações sobre os preços do HDInsight, confira Preços do HDInsight.For more information about HDInsight pricing, see HDInsight pricing.

Observação

O limite de tamanho do cluster varia entre as assinaturas do Azure.The cluster size limit varies among Azure subscriptions. Contate o suporte de cobrança do Azure para aumentar o limite.Contact Azure billing support to increase the limit.

Quando você usa o portal do Azure para configurar o cluster, o tamanho do nó está disponível por meio da guia configuração + preço . No portal, você também pode ver o custo associado aos diferentes tamanhos de nó.When you use the Azure portal to configure the cluster, the node size is available through the Configuration + pricing tab. In the portal, you can also see the cost associated with the different node sizes.

HDInsight escolha o tamanho do seu nó

Tamanhos de máquinas virtuaisVirtual machine sizes

Quando você implantar clusters, escolha os recursos de computação com base na solução que você planeja implantar.When you deploy clusters, choose compute resources based on the solution you plan to deploy. As VMs a seguir são usadas para clusters HDInsight:The following VMs are used for HDInsight clusters:

Para descobrir qual valor você deve usar para especificar um tamanho de VM ao criar um cluster usando os diferentes SDKs ou ao usar o Azure PowerShell, consulte Tamanhos de VM a serem usados para clusters HDInsight.To find out what value you should use to specify a VM size while creating a cluster using the different SDKs or while using Azure PowerShell, see VM sizes to use for HDInsight clusters. Deste artigo vinculado, use o valor na coluna tamanho das tabelas.From this linked article, use the value in the Size column of the tables.

Importante

Se você precisar de mais de 32 nós de trabalho em um cluster, deverá selecionar um tamanho de nó de cabeçalho com pelo menos 8 núcleos e 14 GB de RAM.If you need more than 32 Worker nodes in a cluster, you must select a head node size with at least 8 cores and 14 GB of RAM.

Para obter mais informações, confira Tamanhos das máquinas virtuais.For more information, see Sizes for virtual machines. Para obter informações sobre os preços dos vários tamanhos, confira Preços do HDInsight.For information about pricing of the various sizes, see HDInsight pricing.

Configuração do cluster clássicoClassic cluster setup

A configuração de cluster clássico se baseia nas configurações de criação padrão e adiciona as seguintes opções:Classic cluster setup builds on the default create settings, and adds the following options:

Instalar aplicativos HDInsight em clustersInstall HDInsight applications on clusters

Um aplicativo do HDInsight é um aplicativo que os usuários podem instalar em um cluster HDInsight baseado em Linux.An HDInsight application is an application that users can install on a Linux-based HDInsight cluster. Você pode usar os aplicativos fornecidos pela Microsoft, a terceiros ou que você desenvolver por conta própria.You can use applications provided by Microsoft, third parties, or that you develop yourself. Para saber mais, confira Instalar aplicativos de terceiros do Apache Hadoop no Azure HDInsight.For more information, see Install third-party Apache Hadoop applications on Azure HDInsight.

A maioria dos aplicativos HDInsight é instalada em um nó de borda vazia.Most of the HDInsight applications are installed on an empty edge node. Um nó de borda vazio é uma máquina virtual Linux com as mesmas ferramentas de cliente instaladas e configuradas do nó principal.An empty edge node is a Linux virtual machine with the same client tools installed and configured as in the head node. Você pode usar o nó de borda para acessar o cluster, testar e hospedar seus aplicativos clientes.You can use the edge node for accessing the cluster, testing your client applications, and hosting your client applications. Para saber mais, confira Usar nós de borda vazia no HDInsight.For more information, see Use empty edge nodes in HDInsight.

Configurações avançadas: ações de ScriptAdvanced settings: Script actions

Você pode instalar componentes adicionais ou personalizar a configuração de cluster por meio de scripts durante a criação.You can install additional components or customize cluster configuration by using scripts during creation. Tais scripts são chamados usando a Ação de Script, que é uma opção de configuração que pode ser usada no portal do Azure, cmdlets do Windows PowerShell do HDInsight ou SDK do .NET do HDInsight.Such scripts are invoked via Script Action, which is a configuration option that can be used from the Azure portal, HDInsight Windows PowerShell cmdlets, or the HDInsight .NET SDK. Para obter mais informações, consulte Personalizar cluster HDInsight usando a Ação de Script.For more information, see Customize HDInsight cluster using Script Action.

Alguns componentes nativos do Java, como Apache Mahout e Cascading, podem ser executados no cluster como arquivos Java Archive (JAR).Some native Java components, like Apache Mahout and Cascading, can be run on the cluster as Java Archive (JAR) files. Esses arquivos JAR podem ser distribuídos para o Armazenamento do Azure e enviados aos clusters HDInsight por meio de mecanismos de envio de trabalho do Hadoop.These JAR files can be distributed to Azure Storage and submitted to HDInsight clusters with Hadoop job submission mechanisms. Para obter mais informações, consulte Enviar Apache trabalhos do Hadoop por meio de programação.For more information, see Submit Apache Hadoop jobs programmatically.

Observação

Se você tiver problemas para implantar arquivos JAR nos clusters do HDInsight ou ao chamar arquivos JAR nesses clusters, entre em contato com o Suporte da Microsoft.If you have issues deploying JAR files to HDInsight clusters, or calling JAR files on HDInsight clusters, contact Microsoft Support.

A cascata não tem suporte do HDInsight e não está qualificada para o Suporte da Microsoft.Cascading is not supported by HDInsight and is not eligible for Microsoft Support. Para obter as listas dos componentes suportados, confira Novidades nas versões de cluster fornecidas pelo HDInsight.For lists of supported components, see What's new in the cluster versions provided by HDInsight.

Às vezes, você deseja definir os seguintes arquivos de configuração durante o processo de criação:Sometimes, you want to configure the following configuration files during the creation process:

  • clusterIdentity.xmlclusterIdentity.xml
  • core-site.xmlcore-site.xml
  • gateway.xmlgateway.xml
  • hbase-env.xmlhbase-env.xml
  • hbase-site.xmlhbase-site.xml
  • hdfs-site.xmlhdfs-site.xml
  • hive-env.xmlhive-env.xml
  • hive-site.xmlhive-site.xml
  • mapred-sitemapred-site
  • oozie-site.xmloozie-site.xml
  • oozie-env.xmloozie-env.xml
  • storm-site.xmlstorm-site.xml
  • tez-site.xmltez-site.xml
  • webhcat-site.xmlwebhcat-site.xml
  • yarn-site.xmlyarn-site.xml

Para saber mais, confira Personalizar clusters HDInsight usando a Inicialização.For more information, see Customize HDInsight clusters using Bootstrap.

Próximos passosNext steps