Einrichten von Clustern in HDInsight mit Apache Hadoop, Apache Spark, Apache Kafka usw.Set up clusters in HDInsight with Apache Hadoop, Apache Spark, Apache Kafka, and more

Erfahren Sie, wie Sie Cluster in HDInsight mit Apache Hadoop, Apache Spark, Apache Kafka, Interactive Query, Apache HBase, ML Services oder Apache Storm einrichten und konfigurieren.Learn how to set up and configure clusters in HDInsight with Apache Hadoop, Apache Spark, Apache Kafka, Interactive Query, Apache HBase, ML Services, or Apache Storm. Darüber hinaus lernen Sie Cluster anzupassen und Sicherheit hinzuzufügen, indem Sie sie mit einer Domäne verknüpfen.Also, learn how to customize clusters and add security by joining them to a domain.

Ein Hadoop-Cluster besteht aus mehreren virtuellen Computern (Knoten), die zur verteilten Verarbeitung von Aufgaben verwendet werden.A Hadoop cluster consists of several virtual machines (nodes) that are used for distributed processing of tasks. Azure HDInsight verwaltet die Implementierungsdetails der Installation und Konfiguration einzelner Knoten, sodass Sie nur allgemeine Konfigurationsinformationen bereitstellen müssen.Azure HDInsight handles implementation details of installation and configuration of individual nodes, so you only have to provide general configuration information.

Wichtig

Die Abrechnung für einen HDInsight-Cluster beginnt, sobald der Cluster erstellt wurde, und endet mit dem Löschen des Clusters.HDInsight cluster billing starts once a cluster is created and stops when the cluster is deleted. Die Gebühren werden anteilig nach Minuten erhoben. Daher sollten Sie Ihren Cluster immer löschen, wenn Sie ihn nicht mehr verwenden.Billing is pro-rated per minute, so you should always delete your cluster when it is no longer in use. Erfahren Sie, wie Sie einen Cluster löschen.Learn how to delete a cluster.

Methoden für die ClustereinrichtungCluster setup methods

Die folgende Tabelle zeigt die verschiedenen Methoden, die Sie zum Einrichten eines HDInsight-Clusters verwenden können.The following table shows the different methods you can use to set up an HDInsight cluster.

Verfahren zur ClustererstellungClusters created with WebbrowserWeb browser BefehlszeileCommand line REST-APIREST API SDKSDK
Azure-PortalAzure portal      
Azure Data FactoryAzure Data Factory
Azure-BefehlszeilenschnittstelleAzure CLI      
Azure PowerShellAzure PowerShell      
cURLcURL    
.NET SDK.NET SDK      
Azure-Ressourcen-Manager-VorlagenAzure Resource Manager templates      

Grundlegende ClustereinrichtungBasic cluster setup

Dieser Artikel enthält die Schritte, die Sie im Azure-Portal zum Erstellen eines HDInsight-Clusters mithilfe der Standardansicht oder im Modus Klassisch ausführen.This article walks you through setup in the Azure portal, where you can create an HDInsight cluster using the default view or Classic.

HDInsight-Erstellungsoptionen – benutzerdefinierte Schnellerfassung

Befolgen Sie die Anweisungen auf dem Bildschirm.Follow instructions on the screen. Sie finden im Folgenden folgende Informationen:Details are provided below for:

RessourcengruppennameResource group name

Azure Resource Manager können Sie mit den Ressourcen in Ihrer Anwendung als Gruppe arbeiten, bezeichnet als „Azure-Ressourcengruppe“.Azure Resource Manager helps you work with the resources in your application as a group, referred to as an Azure resource group. Sie können alle Ressourcen für Ihre Anwendung in einem einzigen, koordinierten Vorgang bereitstellen, aktualisieren, überwachen oder löschen.You can deploy, update, monitor, or delete all the resources for your application in a single coordinated operation.

Clustertypen und KonfigurationCluster types and configuration

Azure HDInsight bietet derzeit die folgenden Typen von Clustern mit je einer Reihe von Komponenten, um bestimmte Funktionen bereitzustellen.Azure HDInsight currently provides the following cluster types, each with a set of components to provide certain functionalities.

Wichtig

HDInsight-Cluster sind jeweils für einzelne Workloads oder Technologien in verschiedenen Typen verfügbar.HDInsight clusters are available in various types, each for a single workload or technology. Es ist keine unterstützte Methode zum Erstellen eines Clusters vorhanden, bei der mehrere Typen kombiniert werden, z.B. Storm und HBase in einem Cluster.There is no supported method to create a cluster that combines multiple types, such as Storm and HBase on one cluster. Wenn für Ihre Lösung Technologien erforderlich sind, die auf mehrere HDInsight-Clustertypen verteilt sind, können Sie die erforderlichen Clustertypen über ein virtuelles Azure-Netzwerk miteinander verbinden.If your solution requires technologies that are spread across multiple HDInsight cluster types, an Azure virtual network can connect the required cluster types.

ClustertypCluster type FunktionalitätFunctionality
HadoopHadoop Batch-Abfragen und -analysen gespeicherter DatenBatch query and analysis of stored data
HBaseHBase Verarbeitung großen Mengen von schemalosen NoSQL-DatenProcessing for large amounts of schemaless, NoSQL data
Interactive QueryInteractive Query Interaktive und schnellere Hive-Abfragen durch speicherinternes CachingIn-memory caching for interactive and faster Hive queries
KafkaKafka Dies ist eine verteilte Open-Source-Streamingplattform, die zum Erstellen von Datenpipelines und Anwendungen mit Echtzeitstreaming verwendet werden kann.A distributed streaming platform that can be used to build real-time streaming data pipelines and applications
ML ServicesML Services Verschiedene Funktionen für Big Data-Statistiken, Vorhersagemodellierung und Machine LearningVarious big data statistics, predictive modeling, and machine learning capabilities
SparkSpark Arbeitsspeicherinterne Verarbeitung, interaktive Abfragen, Microbatch-DatenstromverarbeitungIn-memory processing, interactive queries, micro-batch stream processing
StormStorm Ereignisverarbeitung in EchtzeitReal-time event processing

HDInsight-VersionHDInsight version

Wählen Sie die Version von HDInsight für diesen Cluster aus.Choose the version of HDInsight for this cluster. Weitere Informationen finden Sie unter Unterstützte HDInsight-Versionen.For more information, see Supported HDInsight versions.

ClusternameCluster name

Für Namen von HDInsight-Clustern gelten folgende Einschränkungen:HDInsight cluster names have the following restrictions:

  • Zulässige Zeichen: a-z, 0–9, A-ZAllowed characters: a-z, 0-9, A-Z
  • Max. Länge: 59Max length: 59
  • Reservierte Namen: appsReserved names: apps
  • Der Benennungsbereich des Clusters gilt überall in Azure und in allen Abonnements.The cluster naming scope is for all Azure, across all subscriptions. Der Clustername muss somit weltweit eindeutig sein.So the cluster name must be unique worldwide.
  • Die ersten sechs Zeichen müssen innerhalb eines VNET eindeutig sein.First six characters must be unique within a VNET

Clusteranmeldung und SSH-BenutzernameCluster login and SSH username

Während der Clustererstellung ermöglichen die HDInsight-Cluster Ihnen das Konfigurieren von zwei Benutzerkonten:With HDInsight clusters, you can configure two user accounts during cluster creation:

  • HTTP-Benutzer: Der Standard-Benutzername lautet admin. Für ihn gilt im Azure-Portal die Standardkonfiguration.HTTP user: The default username is admin. It uses the basic configuration on the Azure portal. Er wird auch als „Clusterbenutzer“ bezeichnet.Sometimes it is called "Cluster user."
  • SSH-Benutzer: Wird verwendet, um die Verbindung mit dem Cluster über SSH herzustellen.SSH user: Used to connect to the cluster through SSH. Weitere Informationen finden Sie unter Verwenden von SSH mit Linux-basiertem Hadoop in HDInsight unter Linux, Unix oder OS X.For more information, see Use SSH with HDInsight.

Für den HTTP-Benutzernamen gelten folgende Einschränkungen:The HTTP username has the following restrictions:

  • Zulässige Sonderzeichen: _ und @Allowed special characters: _ and @
  • Unzulässige Zeichen: #;."',/:`!*?$(){}[]<>|&--=+%~^LeerzeichenCharacters not allowed: #;."',/:`!*?$(){}[]<>|&--=+%~^space
  • Max. Länge: 20Max length: 20

Für den SSH-Benutzernamen gelten folgende Einschränkungen:The SSH username has the following restrictions:

  • Zulässige Sonderzeichen: _ und @Allowed special characters: _ and @
  • Unzulässige Zeichen: #;."',/:`!*?$(){}[]<>|&--=+%~^LeerzeichenCharacters not allowed: #;."',/:`!*?$(){}[]<>|&--=+%~^space
  • Max. Länge: 64Max length: 64
  • Reservierte Namen: hadoop, users, oozie, hive, mapred, ambari-qa, zookeeper, tez, hdfs, sqoop, yarn, hcat, ams, hbase, storm, administrator, admin, user, user1, test, user2, test1, user3, admin1, 1, 123, a, actuser, adm, admin2, aspnet, backup, console, david, guest, john, owner, root, server, sql, support, support_388945a0, sys, test2, test3, user4, user5, sparkReserved names: hadoop, users, oozie, hive, mapred, ambari-qa, zookeeper, tez, hdfs, sqoop, yarn, hcat, ams, hbase, storm, administrator, admin, user, user1, test, user2, test1, user3, admin1, 1, 123, a, actuser, adm, admin2, aspnet, backup, console, david, guest, john, owner, root, server, sql, support, support_388945a0, sys, test2, test3, user4, user5, spark

Mit dem Sicherheitspaket für Unternehmen können Sie HDInsight mit Active Directory und Apache Ranger integrieren.The Enterprise security package allows you to integrate HDInsight with Active Directory and Apache Ranger. Mithilfe des Enterprise-Sicherheitspakets können mehrere Benutzer erstellt werden.Multiple users can be created using the Enterprise security package.

Orte (Regionen) für Cluster und SpeicherLocation (regions) for clusters and storage

Sie müssen den Clusterstandort nicht explizit angeben: Der Cluster befindet sich an derselben Position wie der Standardspeicher.You don't need to specify the cluster location explicitly: The cluster is in the same location as the default storage. Um eine Liste der unterstützten Regionen zu erhalten, klicken Sie in der Dropdownliste Region auf HDInsight-Preise.For a list of supported regions, click the Region drop-down list on HDInsight pricing.

Speicherendpunkte für ClusterStorage endpoints for clusters

Obwohl eine lokale Installation von Hadoop das Hadoop Distributed File System (HDFS) für die Speicherung im Cluster verwendet, nutzen Sie in der Cloud Speicherendpunkte, die mit dem Cluster verbunden sind.Although an on-premises installation of Hadoop uses the Hadoop Distributed File System (HDFS) for storage on the cluster, in the cloud you use storage endpoints connected to cluster. Durch Verwendung von Cloudspeicher können Sie die für Berechnungen verwendeten HDInsight-Cluster sicher löschen und gleichzeitig Ihre Daten beibehalten.Using cloud storage means you can safely delete the HDInsight clusters used for computation while still retaining your data.

HDInsight-Cluster können die folgenden Speicheroptionen verwenden:HDInsight clusters can use the following storage options:

  • Azure Data Lake Storage Gen2Azure Data Lake Storage Gen2
  • Azure Data Lake Storage Gen1Azure Data Lake Storage Gen1
  • Azure Storage vom Typ „Allgemein v2“Azure storage General Purpose v2
  • Azure Storage vom Typ „Allgemein v1“Azure storage General Purpose v1
  • Azure Storage-Blockblob (nur als sekundärer Speicher unterstützt)Azure storage Block blob (only supported as secondary storage)

Weitere Informationen zu Speicheroptionen mit HDInsight finden Sie unter Vergleich der Speicheroptionen für die Verwendung mit Azure HDInsight-Clustern.For more information on storage options with HDInsight, see Compare storage options for use with Azure HDInsight clusters.

Warnung

Die Verwendung eines zusätzlichen Speicherkontos an einem anderen Ort als dem HDInsight-Cluster wird nicht unterstützt.Using an additional storage account in a different location from the HDInsight cluster is not supported.

Während der Konfiguration geben Sie für den Standardspeicherendpunkt einen Blobcontainer für ein Azure-Speicherkonto oder eine Data Lake Storage-Instanz an.During configuration, for the default storage endpoint you specify a blob container of an Azure Storage account or Data Lake Storage. Der Standardspeicher enthält Anwendungs- und Systemprotokolle.The default storage contains application and system logs. Optional können Sie zusätzliche verknüpfte Azure-Speicherkonten und Data Lake Storage-Konten angeben, auf die der Cluster zugreifen kann.Optionally, you can specify additional linked Azure Storage accounts and Data Lake Storage accounts that the cluster can access. Der HDInsight-Cluster und die abhängigen Speicherkonten müssen sich an demselben Azure-Standort befinden.The HDInsight cluster and the dependent storage accounts must be in the same Azure location.

Clusterspeichereinstellungen: HDFS-kompatible Speicherendpunkte

Hinweis

Das Feature, das eine sichere Übertragung vorschreibt, erzwingt eine sichere Verbindung für alle Anforderungen, die an Ihr Konto gerichtet werden.The feature that requires secure transfer enforces all requests to your account through a secure connection. Dieses Feature wird erst ab HDInsight-Clusterversion 3.6 unterstützt.Only HDInsight cluster version 3.6 or newer supports this feature. Weitere Informationen finden Sie unter Erstellen von Apache Hadoop-Clustern mit Speicherkonten mit sicherer Übertragung in Azure HDInsight.For more information, see Create Apache Hadoop cluster with secure transfer storage accounts in Azure HDInsight.

Optionale MetastoresOptional metastores

Sie können optionale Hive- oder Apache Oozie Metastores erstellen.You can create optional Hive or Apache Oozie metastores. Allerdings unterstützen nicht alle Clustertypen Metastores, und Azure SQL Data Warehouse ist nicht mit Metastores kompatibel.However, not all cluster types support metastores, and Azure SQL Data Warehouse isn't compatible with metastores.

Weitere Informationen finden Sie unter Verwenden von externen Metadatenspeichern in Azure HDInsight.For more information, see Use external metadata stores in Azure HDInsight.

Wichtig

Verwenden Sie beim Erstellen eines benutzerdefinierten Metastores keinen Datenbanknamen, der Gedankenstriche, Bindestriche oder Leerzeichen enthält.When you create a custom metastore, don't use dashes, hyphens, or spaces in the database name. Dies kann dazu führen, dass der Clustererstellungsprozess fehlschlägt.This can cause the cluster creation process to fail.

Hive-MetastoreHive metastore

Verwenden Sie einen benutzerdefinierten Metastore, wenn Sie nach dem Löschen des HDInsight-Clusters Ihre Hive-Tabellen beibehalten möchten.If you want to retain your Hive tables after you delete an HDInsight cluster, use a custom metastore. Sie können diesen Metastore anschließend an einen anderen HDInsight-Cluster anfügen.You can then attach the metastore to another HDInsight cluster.

Ein HDInsight-Metastore, der für eine HDInsight-Clusterversion erstellt wurde, kann nicht über verschiedene HDInsight-Clusterversionen freigegeben werden.An HDInsight metastore that is created for one HDInsight cluster version cannot be shared across different HDInsight cluster versions. Eine Liste mit den HDInsight-Versionen finden Sie unter Unterstützte HDInsight-Versionen.For a list of HDInsight versions, see Supported HDInsight versions.

Oozie-MetastoreOozie metastore

Verwenden Sie zur Erhöhung der Leistung bei Verwendung von Oozie einen benutzerdefinierten Metastore.To increase performance when using Oozie, use a custom metastore. Ein Metastore kann auch Zugriff auf Oozie-Auftragsdaten bieten, nachdem Sie Ihren Cluster gelöscht haben.A metastore can also provide access to Oozie job data after you delete your cluster.

Wichtig

Ein benutzerdefinierter Oozie-Metastore kann nicht wiederverwendet werden.You cannot reuse a custom Oozie metastore. Wenn Sie einen benutzerdefinierten Oozie-Metastore verwenden möchten, müssen Sie beim Erstellen des HDInsight-Clusters eine leere Azure SQL-Datenbank bereitstellen.To use a custom Oozie metastore, you must provide an empty Azure SQL Database when creating the HDInsight cluster.

Sicherheitspaket für UnternehmenEnterprise security package

Für Cluster der Typen Hadoop, Spark, HBase, Kafka und Interactive Query können Sie das Enterprise-Sicherheitspaket aktivieren.For Hadoop, Spark, HBase, Kafka, and Interactive Query cluster types, you can choose to enable the Enterprise Security Package. Dieses Paket bietet die Möglichkeit, mithilfe von Apache Ranger und der Integration in Azure Active Directory eine sicherere Clustereinrichtung zu erreichen.This package provides option to have a more secure cluster setup by using Apache Ranger and integrating with Azure Active Directory. Weitere Informationen finden Sie unter Übersicht über die Unternehmenssicherheit in Azure HDInsight.For more information, see Overview of enterprise security in Azure HDInsight.

HDInsight-Erstellungsoptionen – Sicherheitspaket für Unternehmen auswählen

Weitere Informationen zum Erstellen eines in eine Domäne eingebundenen HDInsight-Clusters finden Sie unter Erstellen einer in eine Domäne eingebundenen HDInsight-Sandboxumgebung.For more information on creating domain-joined HDInsight cluster, see Create domain-joined HDInsight sandbox environment.

Erweitern von Clustern mit einem virtuellen NetzwerkExtend clusters with a virtual network

Wenn für Ihre Lösung Technologien erforderlich sind, die auf mehrere HDInsight-Clustertypen verteilt sind, können Sie die erforderlichen Clustertypen über ein virtuelles Azure-Netzwerk miteinander verbinden.If your solution requires technologies that are spread across multiple HDInsight cluster types, an Azure virtual network can connect the required cluster types. Durch diese Konfiguration können die Cluster und der gesamte Code, den Sie dafür bereitstellen, direkt miteinander kommunizieren.This configuration allows the clusters, and any code you deploy to them, to directly communicate with each other.

Weitere Informationen zur Verwendung eines virtuellen Azure-Netzwerks mit HDInsight finden Sie unter Planen eines virtuellen Netzwerks für HDInsight.For more information on using an Azure virtual network with HDInsight, see Plan a virtual network for HDInsight.

Ein Beispiel für die Verwendung von zwei Clustertypen in einem virtuellen Azure-Netzwerk finden Sie unter Verwenden von strukturiertem Apache Spark-Streaming mit Apache Kafka.For an example of using two cluster types within an Azure virtual network, see Use Apache Spark Structured Streaming with Apache Kafka. Weitere Informationen zur Verwendung von HDInsight mit einem virtuellen Netzwerk, einschließlich spezifischer Konfigurationsanforderungen für das virtuelle Netzwerk, finden Sie unter Planen eines virtuellen Netzwerks für HDInsight.For more information about using HDInsight with a virtual network, including specific configuration requirements for the virtual network, see Plan a virtual network for HDInsight.

Konfigurieren der ClustergrößeConfigure cluster size

Die Verwendung der Knoten wird so lange abgerechnet, wie der Cluster vorhanden ist.You are billed for node usage for as long as the cluster exists. Die Abrechnung beginnt, sobald ein Cluster erstellt wurde, und sie endet, wenn der Cluster gelöscht wird.Billing starts when a cluster is created and stops when the cluster is deleted. Bei Clustern ist kein Aufheben der Zuweisung oder ein Anhalten möglich.Clusters can’t be de-allocated or put on hold.

Anzahl der Knoten für jeden ClustertypNumber of nodes for each cluster type

Jeder Clustertyp verfügt über eine eigene Anzahl von Knoten, Terminologie für Knoten und eine VM-Standardgröße.Each cluster type has its own number of nodes, terminology for nodes, and default VM size. In der folgenden Tabelle ist die Anzahl von Knoten für jeden Knotentyp jeweils in Klammern angegeben.In the following table, the number of nodes for each node type is in parentheses.

typeType NodesNodes DiagrammDiagram
HadoopHadoop Hauptknoten (2), Workerknoten (1+)Head node (2), Worker node (1+) HDInsight-Hadoop-Clusterknoten
hbaseHBase Hauptserver (2), Regionsserver (1+), Master-/Zookeeper-Knoten (3)Head server (2), region server (1+), master/ZooKeeper node (3) HDInsight-HBase-Clustertypeinrichtung
StormStorm Nimbus-Knoten (2), Supervisor-Server (1+), Zookeeper-Knoten (3)Nimbus node (2), supervisor server (1+), ZooKeeper node (3) HDInsight-Storm-Clustertypeinrichtung
SparkSpark Hauptknoten (2), Workerknoten (1+), ZooKeeper-Knoten (3) (kostenlos für ZooKeeper-VMs der Größe A1)Head node (2), Worker node (1+), ZooKeeper node (3) (free for A1 ZooKeeper VM size) HDInsight-Spark-Clustertypeinrichtung

Weitere Informationen finden Sie unter Standardknotenkonfiguration und VM-Größen für Cluster in „Welche Hadoop-Komponenten und -Versionen gibt es in HDInsight?“.For more information, see Default node configuration and virtual machine sizes for clusters in "What are the Hadoop components and versions in HDInsight?"

Die Kosten von HDInsight-Clustern ergeben sich aus der Anzahl der Knoten und aus der Größe der virtuellen Computer für die Knoten.The cost of HDInsight clusters is determined by the number of nodes and the virtual machines sizes for the nodes.

Unterschiedliche Clustertypen weisen verschiedene Knotentypen, eine unterschiedliche Anzahl von Knoten sowie verschiedene Knotengrößen auf:Different cluster types have different node types, numbers of nodes, and node sizes:

  • Hadoop-Standardclustertyp:Hadoop cluster type default:
    • Zwei HauptknotenTwo head nodes
    • Vier WorkerknotenFour Worker nodes
  • Storm-Standardclustertyp:Storm cluster type default:
    • Zwei NimbusknotenTwo Nimbus nodes
    • Drei Zookeeper-KnotenThree ZooKeeper nodes
    • Vier SupervisorknotenFour supervisor nodes

Wenn Sie HDInsight gerade erst testen, empfehlen wir, nur einen Workerknoten zu verwenden.If you are just trying out HDInsight, we recommend you use one Worker node. Weitere Informationen zu den Preisen von HDInsight finden Sie unter HDInsight – Preise.For more information about HDInsight pricing, see HDInsight pricing.

Hinweis

Die Begrenzung der Clustergröße variiert je nach Azure-Abonnement.The cluster size limit varies among Azure subscriptions. Wenden Sie sich an den Azure-Abrechnungssupport, um diese Begrenzung zu erhöhen.Contact Azure billing support to increase the limit.

Wenn Sie das Azure-Portal zum Konfigurieren des Clusters verwenden, ist die Knotengröße über die Registerkarte Configuration + Pricing (Konfiguration + Preise) verfügbar. Außerdem werden im Portal die Kosten angezeigt, die den unterschiedlichen Knotengrößen zugeordnet sind.When you use the Azure portal to configure the cluster, the node size is available through the Configuration + pricing tab. In the portal, you can also see the cost associated with the different node sizes.

HDInsight – Knotengröße auswählen

Größen virtueller ComputerVirtual machine sizes

Wählen Sie bei der Bereitstellung von Clustern die Computeressourcen basierend auf der Lösung aus, die Sie bereitstellen möchten.When you deploy clusters, choose compute resources based on the solution you plan to deploy. Für HDInsight-Cluster werden die folgenden virtuellen Computer verwendet:The following VMs are used for HDInsight clusters:

Wenn Sie wissen möchten, welchen Wert Sie beim Erstellen eines Clusters mithilfe unterschiedlicher SDKs oder von Azure PowerShell als VM-Größe angeben sollten, lesen Sie unter VM-Größen für HDInsight-Cluster nach.To find out what value you should use to specify a VM size while creating a cluster using the different SDKs or while using Azure PowerShell, see VM sizes to use for HDInsight clusters. Verwenden Sie im verknüpften Artikel in den Tabellen den Wert in der Spalte Größe.From this linked article, use the value in the Size column of the tables.

Wichtig

Wenn Sie mehr als 32 Workerknoten in einem Cluster benötigen, müssen Sie eine Hauptknotengröße von mindestens 8 Kernen und 14 GB Arbeitsspeicher (RAM) auswählen.If you need more than 32 Worker nodes in a cluster, you must select a head node size with at least 8 cores and 14 GB of RAM.

Weitere Informationen finden Sie unter Größen für virtuelle Computer.For more information, see Sizes for virtual machines. Informationen zu den Preisen der unterschiedlichen Größen finden Sie unter HDInsight-Preise.For information about pricing of the various sizes, see HDInsight pricing.

Klassische ClustereinrichtungClassic cluster setup

Die klassische Clustereinrichtung basiert auf den Einstellungen der Standarderstellung mit folgenden zusätzlichen Optionen:Classic cluster setup builds on the default create settings, and adds the following options:

Installieren von HDInsight-Anwendungen in ClusternInstall HDInsight applications on clusters

Eine HDInsight-Anwendung kann von Benutzern in einem Linux-basierten HDInsight-Cluster installiert werden.An HDInsight application is an application that users can install on a Linux-based HDInsight cluster. Sie können Anwendungen von Microsoft, Anwendungen von Drittanbietern oder selbst entwickelte Anwendungen verwenden.You can use applications provided by Microsoft, third parties, or that you develop yourself. Weitere Informationen finden Sie unter Installieren von Apache Hadoop-Anwendungen von Drittanbietern in Azure HDInsight.For more information, see Install third-party Apache Hadoop applications on Azure HDInsight.

Die meisten HDInsight-Anwendungen werden auf einem leeren Edgeknoten installiert.Most of the HDInsight applications are installed on an empty edge node. Ein leerer Edgeknoten ist ein virtueller Linux-Computer, auf dem die gleichen Clienttools installiert und konfiguriert sind wie im Hauptknoten.An empty edge node is a Linux virtual machine with the same client tools installed and configured as in the head node. Sie können den Edgeknoten zum Zugreifen auf den Cluster sowie zum Testen und Hosten Ihrer Clientanwendungen verwenden.You can use the edge node for accessing the cluster, testing your client applications, and hosting your client applications. Weitere Informationen finden Sie unter Use empty edge nodes in HDInsight(Verwenden leerer Edgeknoten in HDInsight).For more information, see Use empty edge nodes in HDInsight.

Erweiterte Einstellungen: SkriptaktionenAdvanced settings: Script actions

Sie können zusätzliche Komponenten installieren oder die Clusterkonfiguration mithilfe von Skripts während der Erstellung anpassen.You can install additional components or customize cluster configuration by using scripts during creation. Diese Skripts werden mithilfe der Konfigurationsoption Skriptaktionaufgerufen, die vom Azure-Verwaltungsportal, von HDInsight Windows PowerShell-Cmdlets oder dem HDInsight .NET SDK verwendet werden kann.Such scripts are invoked via Script Action, which is a configuration option that can be used from the Azure portal, HDInsight Windows PowerShell cmdlets, or the HDInsight .NET SDK. Weitere Informationen finden Sie unter Anpassen eines HDInsight-Clusters mithilfe von Skriptaktionen.For more information, see Customize HDInsight cluster using Script Action.

Einige systemeigene Java-Komponenten wie Apache Mahout und Cascading können auf dem Cluster als JAR-Dateien (Java Archive) ausgeführt werden.Some native Java components, like Apache Mahout and Cascading, can be run on the cluster as Java Archive (JAR) files. Diese JAR-Dateien können an Azure Storage verteilt und mit den Verfahren zur Übermittlung von Hadoop-Aufträgen an HDInsight-Cluster gesendet werden.These JAR files can be distributed to Azure Storage and submitted to HDInsight clusters with Hadoop job submission mechanisms. Weitere Informationen finden Sie unter Programmgesteuerte Übermittlung von Apache Hadoop-Aufträgen.For more information, see Submit Apache Hadoop jobs programmatically.

Hinweis

Wenn bei der Bereitstellung von JAR-Dateien für HDInsight-Cluster oder beim Aufrufen von JAR-Dateien für HDInsight-Cluster Probleme auftreten, wenden Sie sich an den Microsoft-Support.If you have issues deploying JAR files to HDInsight clusters, or calling JAR files on HDInsight clusters, contact Microsoft Support.

Cascading wird von HDInsight nicht unterstützt, und es steht kein Microsoft-Support dafür zur Verfügung.Cascading is not supported by HDInsight and is not eligible for Microsoft Support. Listen der unterstützten Komponenten finden Sie unter Neuheiten in den von HDInsight bereitgestellten Clusterversionen.For lists of supported components, see What's new in the cluster versions provided by HDInsight.

Es kann vorkommen, dass Sie die folgenden Konfigurationsdateien während des Erstellungsprozesses bearbeiten möchten:Sometimes, you want to configure the following configuration files during the creation process:

  • clusterIdentity.xmlclusterIdentity.xml
  • core-site.xmlcore-site.xml
  • gateway.xmlgateway.xml
  • hbase-env.xmlhbase-env.xml
  • hbase-site.xmlhbase-site.xml
  • hdfs-site.xmlhdfs-site.xml
  • hive-env.xmlhive-env.xml
  • hive-site.xmlhive-site.xml
  • mapred-sitemapred-site
  • oozie-site.xmloozie-site.xml
  • oozie-env.xmloozie-env.xml
  • storm-site.xmlstorm-site.xml
  • tez-site.xmltez-site.xml
  • webhcat-site.xmlwebhcat-site.xml
  • yarn-site.xmlyarn-site.xml

Weitere Informationen finden Sie unter Anpassen von HDInsight-Clustern mithilfe von Bootstrap.For more information, see Customize HDInsight clusters using Bootstrap.

Nächste SchritteNext steps