Início rápido: criar Apache Hadoop cluster no Azure HDInsight usando o modelo do Resource ManagerQuickstart: Create Apache Hadoop cluster in Azure HDInsight using Resource Manager template

Neste guia de início rápido, você aprende a criar um cluster Apache Hadoop no Azure HDInsight usando um modelo do Resource Manager.In this quickstart, you learn how to create an Apache Hadoop cluster in Azure HDInsight using a Resource Manager template.

Modelos semelhantes podem ser exibidos em modelos de início rápido do Azure.Similar templates can be viewed at Azure quickstart templates. A referência de modelo pode ser encontrada aqui.The template reference can be found here. Você também pode criar um cluster usando o portal do Azure.You can also create a cluster using the Azure portal.

Atualmente, o HDInsight inclui sete tipos diferentes de cluster.Currently HDInsight comes with seven different cluster types. Cada tipo de cluster suporta um conjunto diferente de componentes.Each cluster type supports a different set of components. Todos os tipos de cluster suportam o Hive.All cluster types support Hive. Para obter uma lista dos componentes suportados no HDInsight, consulte Quais são as novidades nas versões de cluster do Hadoop fornecidas pelo HDInsight?For a list of supported components in HDInsight, see What's new in the Hadoop cluster versions provided by HDInsight?

Se não tiver uma subscrição do Azure, crie uma conta gratuita antes de começar.If you don't have an Azure subscription, create a free account before you begin.

Criar um cluster do HadoopCreate a Hadoop cluster

  1. Selecione o botão implantar no Azure abaixo para entrar no Azure e abrir o modelo do Resource Manager na portal do Azure.Select the Deploy to Azure button below to sign in to Azure and open the Resource Manager template in the Azure portal.

    Deploy to Azure button for new cluster

  2. Introduza ou selecione os seguintes valores:Enter or select the following values:

    PropriedadeProperty DescriçãoDescription
    SubscriçãoSubscription Selecione a sua subscrição do Azure.Select your Azure subscription.
    Grupo de recursosResource group Crie um grupo de recursos ou selecione crie um existente.Create a resource group or select an existing resource group. Um grupo de recursos é um contentor de componentes do Azure.A resource group is a container of Azure components. Neste caso, o grupo de recursos contém o cluster do HDInsight e a conta de armazenamento do Azure dependente.In this case, the resource group contains the HDInsight cluster and the dependent Azure Storage account.
    LocalizaçãoLocation Selecione uma localização do Azure onde quer criar o cluster.Select an Azure location where you want to create your cluster. Selecione uma localização mais próxima de si para obter um melhor desempenho.Choose a location closer to you for better performance.
    Nome do ClusterCluster Name Introduza um nome para o cluster do Hadoop.Enter a name for the Hadoop cluster. Uma vez que todos os clusters no HDInsight partilham o mesmo espaço de nomes DNS, este nome tem de ser único.Because all clusters in HDInsight share the same DNS namespace this name needs to be unique. O nome pode conter apenas letras minúsculas, números e hifens e deve começar com uma letra.The name may only contain lowercase letters, numbers, and hyphens, and must begin with a letter. Cada hífen tem de ser precedido e seguido de um caráter que não seja um hífen.Each hyphen must be preceded and followed by a non-hyphen character. O nome também deve ter entre 3 e 59 caracteres de comprimento.The name must also be between 3 and 59 characters long.
    Tipo de ClusterCluster Type Selecione hadoop.Select hadoop.
    Nome e palavra-passe de início de sessão no clusterCluster login name and password O nome de logon padrão é admin. A senha deve ter pelo menos 10 caracteres de comprimento e deve conter pelo menos um dígito, uma letra maiúscula e uma letras minúsculas, um caractere não alfanumérico (exceto os caracteres ' "' ).The default login name is admin. The password must be at least 10 characters in length and must contain at least one digit, one uppercase, and one lower case letter, one non-alphanumeric character (except characters ' " ` ). Certifique-se de que não escolhe uma palavra-passe comum, tal como "Pass@word1".Make sure you do not provide common passwords such as "Pass@word1".
    Nome de utilizador e palavra-passe de SSHSSH username and password O nome de utilizador predefinido é sshuser.The default username is sshuser. Pode mudar o nome de utilizador do SSH.You can rename the SSH username. A palavra-passe de utilizador do SSH tem os mesmos requisitos que a palavra-passe de início de sessão do cluster.The SSH user password has the same requirements as the cluster login password.

    Algumas propriedades foram codificadas no modelo.Some properties have been hardcoded in the template. Pode configurar estes valores a partir do modelo.You can configure these values from the template. Para obter mais explicações sobre essas propriedades, consulte criar Apache Hadoop clusters no HDInsight.For more explanation of these properties, see Create Apache Hadoop clusters in HDInsight.

    Nota

    Os valores que forem fornecidos têm de ser exclusivos e devem seguir as diretrizes de nomenclatura.The values you provide must be unique and should follow the naming guidelines. O modelo não realiza verificações de validação.The template does not perform validation checks. Caso os valores fornecidos já estejam a ser utilizados ou não sigam as diretrizes, receberá um erro depois de ter submetido o modelo.If the values you provide are already in use, or do not follow the guidelines, you get an error after you have submitted the template.

    O HDInsight Linux inicia o modelo do Resource Manager no portalHDInsight Linux gets started Resource Manager template on portal

  3. Selecione concordo com os termos e condições declarados acimae, em seguida, selecione comprar.Select I agree to the terms and conditions stated above, and then select Purchase. Você receberá uma notificação informando que sua implantação está em andamento.You will receive a notification that your deployment is in progress. A criação de um cluster demora cerca de 20 minutos.It takes about 20 minutes to create a cluster.

  4. Depois que o cluster for criado, você receberá uma notificação de implantação bem-sucedida com um link ir para o grupo de recursos .Once the cluster is created, you will receive a Deployment succeeded notification with a Go to resource group link. A página do grupo de recursos listará o novo cluster HDInsight e o armazenamento padrão associado ao cluster.Your Resource group page will list your new HDInsight cluster and the default storage associated with the cluster. Cada cluster tem uma conta de armazenamento do Azure ou uma Azure data Lake Storage dependência de conta .Each cluster has an Azure Storage account or an Azure Data Lake Storage account dependency. É designada de conta de armazenamento predefinida.It is referred as the default storage account. O cluster HDInsight e sua conta de armazenamento padrão devem estar colocalizados na mesma região do Azure.The HDInsight cluster and its default storage account must be colocated in the same Azure region. A eliminação dos clusters não elimina a conta de armazenamento.Deleting clusters does not delete the storage account.

Nota

Para outros métodos de criação de cluster e noções básicas sobre as propriedades usadas neste guia de início rápido, consulte Criar clusters HDInsight.For other cluster creation methods and understanding the properties used in this quickstart, see Create HDInsight clusters.

Limpar recursosClean up resources

Depois de concluir o início rápido, talvez você queira excluir o cluster.After you complete the quickstart, you may want to delete the cluster. Com o HDInsight, os dados são armazenados no Storage do Azure, pelo que pode eliminar um cluster em segurança quando este não está a ser utilizado.With HDInsight, your data is stored in Azure Storage, so you can safely delete a cluster when it is not in use. Também lhe é cobrado o valor de um cluster do HDInsight mesmo quando não o está a utilizar.You are also charged for an HDInsight cluster, even when it is not in use. Uma vez que os custos do cluster são muito superiores aos custos do armazenamento, faz sentido do ponto de vista económico eliminar os clusters quando não estiverem a ser utilizados.Since the charges for the cluster are many times more than the charges for storage, it makes economic sense to delete clusters when they are not in use.

Nota

Se tenciona avançar imediatamente para o tutorial seguinte para saber como executar operações de ETL com o Hadoop no HDInsight, talvez seja conveniente manter o cluster em execução.If you are immediately proceeding to the next tutorial to learn how to run ETL operations using Hadoop on HDInsight, you may want to keep the cluster running. Isso ocorre porque, no tutorial, você precisa criar um cluster Hadoop novamente.This is because in the tutorial you have to create a Hadoop cluster again. No entanto, se não avançar já para o tutorial seguinte, tem de eliminar o cluster agora.However, if you are not going through the next tutorial right away, you must delete the cluster now.

Para eliminar o cluster e/ou a conta de armazenamento predefinidaTo delete the cluster and/or the default storage account

  1. Volte ao separador do browser onde tem o portal do Azure.Go back to the browser tab where you have the Azure portal. Deverá estar na página de descrição geral do cluster.You shall be on the cluster overview page. Se apenas quiser eliminar o cluster, mas quiser manter a conta de armazenamento predefinida, selecione Eliminar.If you only want to delete the cluster but retain the default storage account, select Delete.

    Excluir cluster do HDInsight do portalHDInsight delete cluster from portal

  2. Se quiser eliminar o cluster e a conta de armazenamento predefinida, selecione o nome do grupo de recursos (realçado na captura de ecrã anterior) para abrir a página do grupo de recursos.If you want to delete the cluster as well as the default storage account, select the resource group name (highlighted in the previous screenshot) to open the resource group page.

  3. Selecione Eliminar grupo de recursos para eliminar o grupo de recursos, o qual contém o cluster e a conta de armazenamento predefinida.Select Delete resource group to delete the resource group, which contains the cluster and the default storage account. Tenha em atenção que a eliminação do grupo de recursos elimina a conta de armazenamento.Note deleting the resource group deletes the storage account. Se pretender manter a conta do Storage, opte por eliminar apenas o cluster.If you want to keep the storage account, choose to delete the cluster only.

Passos seguintesNext steps

Neste guia de início rápido, você aprendeu a criar um cluster Apache Hadoop no HDInsight usando um modelo do Resource Manager.In this quickstart, you learned how to create an Apache Hadoop cluster in HDInsight using a Resource Manager template. No artigo seguinte, vai aprender a realizar uma operação de ETL (extração, transformação e carregamento) com o Hadoop no HDInsight.In the next article, you learn how to perform an extract, transform, and load (ETL) operation using Hadoop on HDInsight.