Op Linux gebaseerde clusters maken in HDInsight met behulp van de Azure Portal

De Azure Portal is een webgebaseerd beheerprogramma voor services en resources die worden gehost in Microsoft Azure cloud. In dit artikel leert u hoe u op Linux gebaseerde Azure HDInsight clusters maakt met behulp van de portal. Meer informatie is beschikbaar via HDInsight-clusters maken.

Waarschuwing

HDInsight-clusters worden pro rato per minuut gefactureerd, ongeacht of u er wel of niet gebruik van maakt. Verwijder uw cluster daarom als u er klaar mee bent. Zie how to delete an HDInsight cluster (een HDInsight-cluster verwijderen).

De Azure Portal maakt de meeste clustereigenschappen bekend. Met behulp Azure Resource Manager sjablonen kunt u veel details verbergen. Zie Apache Hadoop-clusters maken in HDInsightmet behulp van Resource Manager sjablonen voor meer informatie.

Als u nog geen abonnement op Azure hebt, maak dan een gratis account aan voordat u begint.

Clusters maken

Notitie

De functie die veilige overdracht vereist, dwingt alle aanvragen naar uw account af via een beveiligde verbinding. Alleen HDInsight-clusterversie 3.6 of nieuwer ondersteunt deze functie. Zie Apache Hadoop-clustermaken met opslagaccounts voor veilige overdracht in Azure HDInsight voor meer Azure HDInsight.

  1. Meld u aan bij Azure Portal.

  2. Selecteer + Een resource maken in het menu aan de bovenkant.

    Maak een nieuw cluster in de Azure Portal

  3. Selecteer Analytics > Azure HDInsight om naar de pagina HDInsight-cluster maken te gaan.

Basisbeginselen

Basisprincipes van HDInsight-cluster maken

Geef op het tabblad Basis de volgende gegevens op:

Eigenschap Beschrijving
Abonnement Selecteer in de vervolgkeuzelijst het Azure-abonnement dat wordt gebruikt voor het cluster.
Resourcegroep Selecteer in de vervolgkeuzelijst de bestaande resourcegroep of selecteer Nieuwe maken.
Clusternaam Geef een wereldwijd unieke naam op.
Region Selecteer in de vervolgkeuzelijst een regio waarin het cluster wordt gemaakt.
Clustertype Klik op Clustertype selecteren om een lijst te openen. Selecteer in de lijst het gezochte clustertype. HDInsight-clusters zijn beschikbaar in verschillende typen. Ze komen overeen met de workload of technologie waar het cluster op is afgestemd. Er is geen ondersteunde methode voor het maken van een cluster waarin meerdere typen worden gecombineerd.
Versie Selecteer een versie in de vervolgkeuzelijst. Gebruik de standaardversie als u niet weet wat u moet kiezen. Zie HDInsight-clusterversies voor meer informatie.
Gebruikersnaam voor clusteraanmeldgegevens Geef de gebruikersnaam op; de standaard is beheerder.
Wachtwoord voor clusteraanmeldgegevens Geef het wachtwoord op.
Aanmeldingswachtwoord voor cluster bevestigen Het wachtwoord opnieuw invoeren
SSH-gebruikersnaam (Secure Shell) Geef de gebruikersnaam op; de standaardwaarde is sshuser
Het wachtwoord voor clusteraanmelding gebruiken voor SSH Als u hetzelfde SSH-wachtwoord wilt gebruiken als het beheerderswachtwoord dat u eerder hebt opgegeven, selecteert u het selectievakje Clusterwachtwoord voor SSH gebruiken. Zo niet, geef dan een WACHTWOORD of OPENBARE SLEUTEL op om de SSH-gebruiker te verifiëren. Een openbare sleutel is de aanpak die we aanbevelen. Kies Selecteren onderaan om de configuratie van de referenties op te slaan. Zie hdinsight (Apache Hadoop) Verbinding maken metbehulp van SSH voor meer informatie.

Selecteer Volgende: Storage >> naar het volgende tabblad te gaan.

Storage

Waarschuwing

Vanaf 15 juni 2020 kunnen klanten geen nieuwe service-principal maken met HDInsight. Zie Service-principal en certificaten maken met behulp van Azure Active Directory.

Clusteropslag maken in HDInsight

Primaire opslag

Selecteer uw standaardopslagtype in de vervolgkeuzelijst voor primair opslagtype. De latere velden die moeten worden voltooid, variëren op basis van uw selectie. Voor Azure Storage:

  1. Kies voor Selectiemethode de optie Selecteren in lijst of Toegangssleutel gebruiken.

    • Selecteer voor Selecteren in de lijst uw primaire opslagaccount in de vervolgkeuzelijst of selecteer Nieuwe maken.
    • Voer bij Toegangssleutel gebruiken de naam van Storage account in. Geef vervolgens de toegangssleutel op.
  2. Accepteer voor Container de standaardwaarde of voer een nieuwe in.

Aanvullende Azure Storage

Optioneel: selecteer Azure Storage voor extra clusteropslag. Het gebruik van een extra opslagaccount in een andere regio dan het HDInsight-cluster wordt niet ondersteund.

Metastore-Instellingen

Optioneel: geef een bestaande SQL Database om metagegevens van Apache Hive, Apache Oozie en of Apache Ambari buiten het cluster op te slaan. De Azure SQL Database die wordt gebruikt voor de metastore moet connectiviteit met andere Azure-services toestaan, waaronder Azure HDInsight. Wanneer u een metastore maakt, moet u geen database met streepjes of afbreekstreeën een naam geven. Deze tekens kunnen ertoe leiden dat het proces voor het maken van het cluster mislukt.

Belangrijk

Voor clustervormen die ondersteuning bieden voor metastores, biedt de standaard metastore een Azure SQL Database met een DTU-limiet van basic laag 5 (niet upgradebaar). Geschikt voor eenvoudige testdoeleinden. Voor grote workloads of productieworkloads wordt u aangeraden te migreren naar een externe metastore.

Selecteer Volgende: Beveiliging en netwerk >> naar het volgende tabblad te gaan.

Beveiliging en netwerken

HDInsight- clusterbeveiligingsnetwerken maken

Geef op het tabblad Beveiliging en netwerken de volgende informatie op:

Eigenschap Beschrijving
Enterprise-beveiligingspakket Optioneel: schakel het selectievakje in om de Enterprise Security Package. Zie Een HDInsight-clusterconfigureren met Enterprise Security Package met behulp van Azure Active Directory Domain Services voor meer informatie.
TLS Optioneel: selecteer een TLS-versie in de vervolgkeuzelijst. Zie voor meer informatie Transport Layer Security.
Virtueel netwerk Optioneel: Selecteer een bestaand virtueel netwerk en subnet in de vervolgkeuzelijst. Zie Plan a virtual network deployment for Azure HDInsight clusters (Een implementatie van een virtueel netwerk plannen voor Azure HDInsight clusters) voor meer informatie. Het artikel bevat specifieke configuratievereisten voor het virtuele netwerk.
Instellingen voor schijfversleuteling Optioneel: schakel het selectievakje in om versleuteling te gebruiken. Zie Schijfversleuteling met door de klant beheerde sleutel voor meer informatie.
Kafka REST-proxy Deze instelling is alleen beschikbaar voor het clustertype Kafka. Zie Using a REST proxy (Een REST-proxy gebruiken) voor meer informatie.
Identiteit Optioneel: Selecteer een bestaande door de gebruiker toegewezen service-id in de vervolgkeuzelijst. Zie Beheerde identiteiten inAzure HDInsight.

Selecteer Volgende: Configuratie en prijzen >> naar het volgende tabblad te gaan.

Configuratie en prijzen

Clusterconfiguratie maken in HDInsight

Geef op het tabblad Configuratie en prijzen de volgende informatie op:

Eigenschap Beschrijving
+ Toepassing toevoegen Optioneel: selecteer alle toepassingen die u wilt gebruiken. Microsoft, onafhankelijke softwareleveranciers (ISV's) of u kunt deze toepassingen ontwikkelen. Zie Toepassingen installeren tijdens het maken van het cluster voor meer informatie.
Knooppuntgrootte Optioneel: Selecteer een knooppunt met een andere grootte.
Aantal knooppunten Optioneel: Voer het aantal knooppunten voor het opgegeven knooppunttype in. Als u meer dan 32 werkknooppunten wilt gebruiken, selecteert u een hoofdknooppuntgrootte met ten minste acht kernen en 14 GB RAM-geheugen. Plan de knooppunten tijdens het maken van het cluster of door het cluster na het maken te schalen.
Automatisch schalen inschakelen Optioneel: schakel het selectievakje in om de functie in teschakelen. Zie Automatisch schalen van clusters voor Azure HDInsight meer informatie.
+ Scriptactie toevoegen Optioneel: deze optie werkt als u een aangepast script wilt gebruiken om een cluster aan te passen, omdat het cluster wordt gemaakt. Zie Op Linux gebaseerde HDInsight-clustersaanpassen met behulp van scriptacties voor meer informatie over scriptacties.

Selecteer Beoordelen en maken om >> clusterconfiguratie te valideren en door te gaan naar het laatste tabblad.

Controleren en maken

Samenvatting van HDInsight-cluster maken

Controleer de instellingen. Selecteer Maken om het cluster te maken.

Meestal duurt het genereren van het cluster ongeveer 20 minuten. Controleer meldingen om het inrichtingsproces te controleren.

Na het maken

Nadat het aanmaakproces is gemaakt, selecteert u Naar resource gaan in de melding Implementatie is geslaagd. Het clustervenster bevat de volgende informatie.

Overzicht van HDI Azure Portal cluster

Sommige pictogrammen in het venster worden als volgt uitgelegd:

Eigenschap Beschrijving
Overzicht Biedt alle essentiële informatie over het cluster. Voorbeelden zijn de naam, de resourcegroep waar deze bij hoort, de locatie, het besturingssysteem en de URL voor het clusterdashboard.
Clusterdashboards Leidt u naar de Ambari-portal die aan het cluster is gekoppeld.
SSH + Cluster-aanmelding Biedt informatie die nodig is voor toegang tot het cluster met behulp van SSH.
Verwijderen Hiermee verwijdert u het HDInsight-cluster.

Het cluster verwijderen

Zie Een HDInsight-cluster verwijderen met behulp van uw browser, PowerShell of de Azure CLI.

Problemen oplossen

Zie Vereisten voor toegangsbeheer als u problemen ondervindt met het maken van HDInsight-clusters.

Volgende stappen

U hebt een HDInsight-cluster gemaakt. Leer nu hoe u met uw cluster werkt.