Nastavení clusterů v HDInsight pomocí Apache Hadoop, Apache Spark, Apache Kafka a dalšíchSet up clusters in HDInsight with Apache Hadoop, Apache Spark, Apache Kafka, and more

Naučte se, jak nastavit a nakonfigurovat clustery v HDInsight pomocí Apache Hadoop, Apache Spark, Apache Kafka, interaktivních dotazů, Apache HBA, služeb ML nebo Apache Storm.Learn how to set up and configure clusters in HDInsight with Apache Hadoop, Apache Spark, Apache Kafka, Interactive Query, Apache HBase, ML Services, or Apache Storm. Přečtěte si také, jak přizpůsobit clustery a přidat zabezpečení jejich připojením k doméně.Also, learn how to customize clusters and add security by joining them to a domain.

Cluster Hadoop se skládá z několika virtuálních počítačů (uzlů), které se používají pro distribuované zpracování úloh.A Hadoop cluster consists of several virtual machines (nodes) that are used for distributed processing of tasks. Azure HDInsight zpracovává podrobnosti o implementaci instalace a konfigurace jednotlivých uzlů, takže stačí zadat obecné informace o konfiguraci.Azure HDInsight handles implementation details of installation and configuration of individual nodes, so you only have to provide general configuration information.

Důležité

Fakturace clusteru HDInsight začíná, jakmile se cluster vytvoří a zastaví se, když se cluster odstraní.HDInsight cluster billing starts once a cluster is created and stops when the cluster is deleted. Fakturuje se poměrnou částí po minutách, takže byste cluster měli vždycky odstranit, když už se nepoužívá.Billing is pro-rated per minute, so you should always delete your cluster when it is no longer in use. Naučte se, jak Odstranit cluster.Learn how to delete a cluster.

Metody instalace clusteruCluster setup methods

V následující tabulce jsou uvedeny různé metody, které můžete použít k nastavení clusteru HDInsight.The following table shows the different methods you can use to set up an HDInsight cluster.

Clustery vytvořené pomocíClusters created with Webový prohlížečWeb browser Příkazový řádekCommand line REST APIREST API Sada SDKSDK
Azure PortalAzure portal      
Azure Data FactoryAzure Data Factory
Rozhraní příkazového řádku AzureAzure CLI      
Azure PowerShellAzure PowerShell      
cURLcURL    
SADA .NET SDK.NET SDK      
Šablony Azure Resource ManagerAzure Resource Manager templates      

Základní nastavení clusteruBasic cluster setup

Tento článek vás provede instalačním programem v Azure Portal, kde můžete vytvořit cluster HDInsight pomocí výchozího zobrazení nebo klasickéhonastavení.This article walks you through setup in the Azure portal, where you can create an HDInsight cluster using the default view or Classic.

možnosti vytvoření vlastního rychlého vytvoření v HDInsight

Postupujte podle pokynů na obrazovce.Follow instructions on the screen. Níže jsou uvedeny podrobnosti pro:Details are provided below for:

Název skupiny prostředkůResource group name

Azure Resource Manager vám pomůže pracovat s prostředky v aplikaci jako se skupinou, která se označuje jako skupina prostředků Azure.Azure Resource Manager helps you work with the resources in your application as a group, referred to as an Azure resource group. Všechny prostředky pro aplikaci můžete nasadit, aktualizovat, monitorovat nebo odstranit v rámci jediné koordinované operace.You can deploy, update, monitor, or delete all the resources for your application in a single coordinated operation.

Typy a konfigurace clusteruCluster types and configuration

Azure HDInsight v současné době poskytuje následující typy clusterů, z nichž každá obsahuje sadu součástí, které poskytují určité funkce.Azure HDInsight currently provides the following cluster types, each with a set of components to provide certain functionalities.

Důležité

Clustery HDInsight jsou k dispozici v různých typech, každou pro jednu úlohu nebo technologii.HDInsight clusters are available in various types, each for a single workload or technology. Neexistuje žádná podporovaná metoda pro vytvoření clusteru, který kombinuje více typů, jako je například zaplavení a HBA v jednom clusteru.There is no supported method to create a cluster that combines multiple types, such as Storm and HBase on one cluster. Pokud vaše řešení vyžaduje technologie, které jsou rozdělené mezi více typů clusterů HDInsight, může virtuální síť Azure propojit požadované typy clusterů.If your solution requires technologies that are spread across multiple HDInsight cluster types, an Azure virtual network can connect the required cluster types.

Typ clusteruCluster type FunkceFunctionality
HadoopHadoop Dávkové dotazování a analýza uložených datBatch query and analysis of stored data
HBaseHBase Zpracování velkých objemů NoSQL dat bez schématuProcessing for large amounts of schemaless, NoSQL data
Interaktivní dotazInteractive Query Ukládání do mezipaměti v paměti pro interaktivní a rychlejší dotazy na podregistrIn-memory caching for interactive and faster Hive queries
KafkaKafka Platforma pro distribuované streamování, která se dá použít k sestavení datových kanálů a aplikací streamování v reálném časeA distributed streaming platform that can be used to build real-time streaming data pipelines and applications
Služby MLML Services Různé statistiky s velkými objemy dat, prediktivní modelování a možnosti strojového učeníVarious big data statistics, predictive modeling, and machine learning capabilities
PerlivýchSpark Zpracování v paměti, interaktivní dotazy, zpracování streamu mikrodávkováníIn-memory processing, interactive queries, micro-batch stream processing
ChráněnStorm Zpracování událostí v reálném časeReal-time event processing

Verze HDInsightHDInsight version

Vyberte verzi HDInsight pro tento cluster.Choose the version of HDInsight for this cluster. Další informace najdete v tématu podporované verze HDInsight.For more information, see Supported HDInsight versions.

Název clusteruCluster name

Názvy clusterů HDInsight mají následující omezení:HDInsight cluster names have the following restrictions:

  • Povolené znaky: a-z, 0-9, A až ZAllowed characters: a-z, 0-9, A-Z
  • Maximální délka: 59Max length: 59
  • Rezervované názvy: aplikaceReserved names: apps
  • Obor názvů clusteru je pro všechny Azure v rámci všech předplatných.The cluster naming scope is for all Azure, across all subscriptions. Proto musí být název clusteru jedinečný po celém světě.So the cluster name must be unique worldwide.
  • Prvních šest znaků musí být v rámci virtuální sítě jedinečné.First six characters must be unique within a VNET

Přihlášení ke clusteru a uživatelské jméno SSHCluster login and SSH username

Clustery HDInsight umožňují během vytváření clusteru konfigurovat dva uživatelské účty:With HDInsight clusters, you can configure two user accounts during cluster creation:

  • Uživatel HTTP: výchozí uživatelské jméno je admin. Používá základní konfiguraci na Azure Portal.HTTP user: The default username is admin. It uses the basic configuration on the Azure portal. V některých případech se nazývá "uživatel clusteru".Sometimes it is called "Cluster user."
  • Uživatel SSH: slouží k připojení ke clusteru přes SSH.SSH user: Used to connect to the cluster through SSH. Další informace najdete v tématu Použití SSH se službou HDInsight.For more information, see Use SSH with HDInsight.

Uživatelské jméno protokolu HTTP má následující omezení:The HTTP username has the following restrictions:

  • Povolené speciální znaky: _ a @Allowed special characters: _ and @
  • Nepovolené znaky: #;. "", /: '! *? $ () {} [] < > | &--= +% ~ ^ SpaceCharacters not allowed: #;."',/:`!*?$(){}[]<>|&--=+%~^space
  • Maximální délka: 20Max length: 20

Uživatelské jméno SSH má následující omezení:The SSH username has the following restrictions:

  • Povolené speciální znaky: _ a @Allowed special characters: _ and @
  • Nepovolené znaky: #;. "", /: '! *? $ () {} [] < > | &--= +% ~ ^ SpaceCharacters not allowed: #;."',/:`!*?$(){}[]<>|&--=+%~^space
  • Maximální délka: 64Max length: 64
  • Rezervované názvy: Hadoop, uživatelé, Oozie, podregistr, mapred, Ambari-QA, Zookeeper, tez, HDFS, Sqoop, příze, hcat, AMS, HBA, doplňování, správce, správce, uživatel, uživatel1, test, uživatel2, test1, user3, admin1, 1, 123, a, ACTUser, ADM, admin2, ASPNET, Backup, Console, David, Host, Jan, vlastník, root, server, SQL, podpora, Support_388945a0, sys, test2, test3, user4, user5, SparkReserved names: hadoop, users, oozie, hive, mapred, ambari-qa, zookeeper, tez, hdfs, sqoop, yarn, hcat, ams, hbase, storm, administrator, admin, user, user1, test, user2, test1, user3, admin1, 1, 123, a, actuser, adm, admin2, aspnet, backup, console, david, guest, john, owner, root, server, sql, support, support_388945a0, sys, test2, test3, user4, user5, spark

Balíček Enterprise Security umožňuje integrovat HDInsight se službou Active Directory a Apache Ranger.The Enterprise security package allows you to integrate HDInsight with Active Directory and Apache Ranger. Pomocí balíčku podnikového zabezpečení lze vytvořit více uživatelů.Multiple users can be created using the Enterprise security package.

Umístění (oblastí) pro clustery a úložištěLocation (regions) for clusters and storage

Umístění clusteru nemusíte explicitně určovat: cluster je ve stejném umístění jako výchozí úložiště.You don't need to specify the cluster location explicitly: The cluster is in the same location as the default storage. Seznam podporovaných oblastí získáte tak, že kliknete na rozevírací seznam oblast na ceny služby HDInsight.For a list of supported regions, click the Region drop-down list on HDInsight pricing.

Koncové body úložiště pro clusteryStorage endpoints for clusters

I když místní instalace systému Hadoop používá pro úložiště v clusteru systém souborů DFS (Distributed File System) Hadoop (HDFS), v cloudu použijete koncové body úložiště připojené ke clusteru.Although an on-premises installation of Hadoop uses the Hadoop Distributed File System (HDFS) for storage on the cluster, in the cloud you use storage endpoints connected to cluster. Použití cloudového úložiště znamená, že můžete bezpečně odstranit clustery HDInsight používané pro výpočty a přitom zachovat data.Using cloud storage means you can safely delete the HDInsight clusters used for computation while still retaining your data.

Clustery HDInsight můžou používat následující možnosti úložiště:HDInsight clusters can use the following storage options:

  • Azure Data Lake Storage Gen2Azure Data Lake Storage Gen2
  • Azure Data Lake Storage Gen1Azure Data Lake Storage Gen1
  • Azure Storage Pro obecné účely v2Azure storage General Purpose v2
  • Azure Storage Pro obecné účely v1Azure storage General Purpose v1
  • Objekt blob bloku Azure Storage (podporuje se jenom jako sekundární úložiště)Azure storage Block blob (only supported as secondary storage)

Další informace o možnostech úložiště ve službě HDInsight najdete v tématu porovnání možností úložiště pro použití s clustery Azure HDInsight.For more information on storage options with HDInsight, see Compare storage options for use with Azure HDInsight clusters.

Varování

Použití dalšího účtu úložiště v jiném umístění z clusteru HDInsight se nepodporuje.Using an additional storage account in a different location from the HDInsight cluster is not supported.

Během konfigurace pro výchozí koncový bod úložiště zadáte kontejner objektů blob Azure Storage účtu nebo Data Lake Storage.During configuration, for the default storage endpoint you specify a blob container of an Azure Storage account or Data Lake Storage. Výchozí úložiště obsahuje protokoly aplikací a systému.The default storage contains application and system logs. Volitelně můžete zadat další propojené účty Azure Storage a účty Data Lake Storage, ke kterým může cluster přistupovat.Optionally, you can specify additional linked Azure Storage accounts and Data Lake Storage accounts that the cluster can access. Cluster HDInsight a závislé účty úložiště musí být ve stejném umístění Azure.The HDInsight cluster and the dependent storage accounts must be in the same Azure location.

Nastavení úložiště clusteru: koncové body úložiště kompatibilní s HDFS

Poznámka

Funkce, která vyžaduje zabezpečený přenos vynucuje všechny požadavky na účet přes zabezpečené připojení.The feature that requires secure transfer enforces all requests to your account through a secure connection. Jenom HDInsight verze 3.6 nebo novější podporuje clusteru tuto funkci.Only HDInsight cluster version 3.6 or newer supports this feature. Další informace najdete v tématu vytvořit Apache Hadoop cluster s bezpečným přenosem účty úložiště v Azure HDInsight.For more information, see Create Apache Hadoop cluster with secure transfer storage accounts in Azure HDInsight.

Volitelné metaúložištěOptional metastores

Můžete vytvořit volitelný podregistr nebo Apache Oozie metaúložiště.You can create optional Hive or Apache Oozie metastores. Ne všechny typy clusterů ale podporují metaúložiště a Azure SQL Data Warehouse nejsou kompatibilní s metaúložiště.However, not all cluster types support metastores, and Azure SQL Data Warehouse isn't compatible with metastores.

Další informace najdete v tématu použití externích úložišť metadat ve službě Azure HDInsight.For more information, see Use external metadata stores in Azure HDInsight.

Důležité

Když vytvoříte vlastní metastore, nepoužívejte v názvu databáze pomlčky, spojovníky nebo mezery.When you create a custom metastore, don't use dashes, hyphens, or spaces in the database name. To může způsobit selhání procesu vytváření clusteru.This can cause the cluster creation process to fail.

metastore HiveHive metastore

Pokud chcete uchovat tabulky podregistru po odstranění clusteru HDInsight, použijte vlastní metastore.If you want to retain your Hive tables after you delete an HDInsight cluster, use a custom metastore. Pak můžete metastore připojit k jinému clusteru HDInsight.You can then attach the metastore to another HDInsight cluster.

An HDInsight metastore, která je vytvořená pro jednu verzi clusteru HDInsight, nejde sdílet mezi různými verzemi clusterů HDInsight.An HDInsight metastore that is created for one HDInsight cluster version cannot be shared across different HDInsight cluster versions. Seznam verzí služby HDInsight najdete v tématu podporované verze služby HDInsight.For a list of HDInsight versions, see Supported HDInsight versions.

Oozie metastoreOozie metastore

Pokud chcete zvýšit výkon při použití Oozie, použijte vlastní metastore.To increase performance when using Oozie, use a custom metastore. Metastore může také poskytnout přístup k datům úlohy Oozie po odstranění clusteru.A metastore can also provide access to Oozie job data after you delete your cluster.

Důležité

Nemůžete znovu použít vlastní Oozie metastore.You cannot reuse a custom Oozie metastore. Pokud chcete použít vlastní metastore Oozie, musíte při vytváření clusteru HDInsight zadat prázdnou Azure SQL Database.To use a custom Oozie metastore, you must provide an empty Azure SQL Database when creating the HDInsight cluster.

Balíček podnikového zabezpečeníEnterprise security package

Pro typy clusterů Hadoop, Spark, HBA, Kafka a interaktivní dotaz můžete povolit balíček zabezpečení podniku.For Hadoop, Spark, HBase, Kafka, and Interactive Query cluster types, you can choose to enable the Enterprise Security Package. Tento balíček nabízí možnost mít bezpečnější instalaci clusteru pomocí Apache Ranger a integraci s Azure Active Directory.This package provides option to have a more secure cluster setup by using Apache Ranger and integrating with Azure Active Directory. Další informace najdete v tématu Přehled podnikového zabezpečení ve službě Azure HDInsight.For more information, see Overview of enterprise security in Azure HDInsight.

možnosti vytvoření HDInsight výběr balíčku podnikového zabezpečení

Další informace o vytvoření clusteru HDInsight připojeného k doméně najdete v tématu vytvoření prostředí sandboxu HDInsight připojeného k doméně.For more information on creating domain-joined HDInsight cluster, see Create domain-joined HDInsight sandbox environment.

Rozšiřování clusterů pomocí virtuální sítěExtend clusters with a virtual network

Pokud vaše řešení vyžaduje technologie, které jsou rozdělené mezi více typů clusterů HDInsight, může virtuální síť Azure propojit požadované typy clusterů.If your solution requires technologies that are spread across multiple HDInsight cluster types, an Azure virtual network can connect the required cluster types. Tato konfigurace umožňuje clusterům a veškerý kód, který do nich nasazujete, k přímé komunikaci.This configuration allows the clusters, and any code you deploy to them, to directly communicate with each other.

Další informace o používání služby Azure Virtual Network s HDInsight najdete v tématu plánování virtuální sítě pro HDInsight.For more information on using an Azure virtual network with HDInsight, see Plan a virtual network for HDInsight.

Příklad použití dvou typů clusterů v rámci virtuální sítě Azure najdete v tématu použití Apache Spark strukturovaného streamování s Apache Kafka.For an example of using two cluster types within an Azure virtual network, see Use Apache Spark Structured Streaming with Apache Kafka. Další informace o používání služby HDInsight s virtuální sítí, včetně specifických požadavků na konfiguraci pro virtuální síť, najdete v tématu plánování virtuální sítě pro HDInsight.For more information about using HDInsight with a virtual network, including specific configuration requirements for the virtual network, see Plan a virtual network for HDInsight.

Konfigurace velikosti clusteruConfigure cluster size

Účtuje se vám využití uzlu, dokud cluster existuje.You are billed for node usage for as long as the cluster exists. Fakturace začne při vytvoření clusteru a zastaví se při jeho odstranění.Billing starts when a cluster is created and stops when the cluster is deleted. Clustery nemůžou být nepřidělené nebo se zablokují.Clusters can’t be de-allocated or put on hold.

Počet uzlů pro každý typ clusteruNumber of nodes for each cluster type

Každý typ clusteru má svůj vlastní počet uzlů, terminologii pro uzly a výchozí velikost virtuálního počítače.Each cluster type has its own number of nodes, terminology for nodes, and default VM size. V následující tabulce je počet uzlů pro každý typ uzlu v závorkách.In the following table, the number of nodes for each node type is in parentheses.

TypType SortimentNodes diagramDiagram
HadoopHadoop Hlavní uzel (2), pracovní uzel (1 +)Head node (2), Worker node (1+) Uzly clusteru HDInsight Hadoop
HBaseHBase Hlavní server (2), server oblasti (1 +), hlavní/ZooKeeper uzel (3)Head server (2), region server (1+), master/ZooKeeper node (3) Instalace typu clusteru HDInsight HBA
ChráněnStorm Nimbus uzel (2), server pro řízení (1 +), ZooKeeper uzel (3)Nimbus node (2), supervisor server (1+), ZooKeeper node (3) Nastavení typu clusteru HDInsight v HDInsight
PerlivýchSpark Hlavní uzel (2), pracovní uzel (1 +), uzel ZooKeeper (3) (volné pro velikost virtuálního počítače a1 ZooKeeper)Head node (2), Worker node (1+), ZooKeeper node (3) (free for A1 ZooKeeper VM size) Nastavení typu clusteru HDInsight Spark

Další informace najdete v tématu Konfigurace výchozích uzlů a velikosti virtuálních počítačů pro clustery v tématu Co jsou komponenty Hadoop a verze v HDInsight?.For more information, see Default node configuration and virtual machine sizes for clusters in "What are the Hadoop components and versions in HDInsight?"

Náklady na clustery HDInsight se určují podle počtu uzlů a velikosti virtuálních počítačů pro uzly.The cost of HDInsight clusters is determined by the number of nodes and the virtual machines sizes for the nodes.

Různé typy clusterů mají různé typy uzlů, počty uzlů a velikosti uzlů:Different cluster types have different node types, numbers of nodes, and node sizes:

  • Výchozí typ clusteru Hadoop:Hadoop cluster type default:
    • Dva hlavní uzlyTwo head nodes
    • Čtyři pracovní uzlyFour Worker nodes
  • Výchozí typ clusteru pro hodnoty:Storm cluster type default:
    • Dva uzly NimbusTwo Nimbus nodes
    • Tři uzly ZookeeperThree ZooKeeper nodes
    • Čtyři uzly SprávceFour supervisor nodes

Pokud jste právě zkoušeli HDInsight, doporučujeme použít jeden pracovní uzel.If you are just trying out HDInsight, we recommend you use one Worker node. Další informace o cenách služby HDInsight najdete v tématu ceny služby HDInsight.For more information about HDInsight pricing, see HDInsight pricing.

Poznámka

Omezení velikosti clusteru se liší v rámci předplatných Azure.The cluster size limit varies among Azure subscriptions. Pokud chcete tento limit zvýšit, kontaktujte podporu fakturace Azure .Contact Azure billing support to increase the limit.

Když použijete Azure Portal ke konfiguraci clusteru, velikost uzlu je k dispozici na kartě Konfigurace + ceny . Na portálu můžete také zobrazit náklady spojené s různými velikostmi uzlů.When you use the Azure portal to configure the cluster, the node size is available through the Configuration + pricing tab. In the portal, you can also see the cost associated with the different node sizes.

HDInsight Volba velikosti uzlu

Velikosti virtuálních počítačůVirtual machine sizes

Při nasazení clusterů vyberte výpočetní prostředky na základě řešení, které plánujete nasadit.When you deploy clusters, choose compute resources based on the solution you plan to deploy. Pro clustery HDInsight se používají následující virtuální počítače:The following VMs are used for HDInsight clusters:

Pokud chcete zjistit, jakou hodnotu byste měli použít k určení velikosti virtuálního počítače při vytváření clusteru pomocí různých sad SDK nebo při použití Azure PowerShell, přečtěte si téma velikosti virtuálních počítačů, které se mají použít pro clustery HDInsight.To find out what value you should use to specify a VM size while creating a cluster using the different SDKs or while using Azure PowerShell, see VM sizes to use for HDInsight clusters. Z tohoto odkazovaného článku použijte hodnotu ve sloupci Velikost v tabulkách.From this linked article, use the value in the Size column of the tables.

Důležité

Pokud v clusteru potřebujete víc než 32 pracovních uzlů, musíte vybrat velikost hlavního uzlu s aspoň 8 jádry a 14 GB paměti RAM.If you need more than 32 Worker nodes in a cluster, you must select a head node size with at least 8 cores and 14 GB of RAM.

Další informace najdete v tématu velikosti pro virtuální počítače.For more information, see Sizes for virtual machines. Informace o cenách různých velikostí najdete v tématu ceny služby HDInsight.For information about pricing of the various sizes, see HDInsight pricing.

Instalace klasického clusteruClassic cluster setup

Instalace klasického clusteru vytvoří výchozí nastavení pro vytvoření a přidá následující možnosti:Classic cluster setup builds on the default create settings, and adds the following options:

Instalace aplikací HDInsight do clusterůInstall HDInsight applications on clusters

An HDInsight aplikace je aplikace, kterou mohou uživatelé nainstalovat na cluster HDInsight se systémem Linux.An HDInsight application is an application that users can install on a Linux-based HDInsight cluster. Můžete používat aplikace od Microsoftu, třetích stran nebo si sami vyvíjíte.You can use applications provided by Microsoft, third parties, or that you develop yourself. Další informace najdete v tématu instalace aplikací Apache Hadoop třetích stran v Azure HDInsight.For more information, see Install third-party Apache Hadoop applications on Azure HDInsight.

Většina aplikací HDInsight je nainstalovaná na prázdném hraničním uzlu.Most of the HDInsight applications are installed on an empty edge node. Prázdný hraniční uzel je virtuální počítač se systémem Linux se stejnými klientskými nástroji, který je nainstalovaný a nakonfigurovaný jako hlavní uzel.An empty edge node is a Linux virtual machine with the same client tools installed and configured as in the head node. Hraniční uzel můžete použít pro přístup ke clusteru, testování klientských aplikací a hostování klientských aplikací.You can use the edge node for accessing the cluster, testing your client applications, and hosting your client applications. Další informace najdete v tématu použití prázdných hraničních uzlů v HDInsight.For more information, see Use empty edge nodes in HDInsight.

Rozšířená nastavení: akce skriptuAdvanced settings: Script actions

Během vytváření můžete nainstalovat další součásti nebo přizpůsobit konfiguraci clusteru pomocí skriptů.You can install additional components or customize cluster configuration by using scripts during creation. Tyto skripty jsou vyvolány prostřednictvím akce skriptu, což je možnost konfigurace, kterou lze použít z Azure Portal, rutin prostředí Windows PowerShell pro HDInsight nebo sady HDInsight .NET SDK.Such scripts are invoked via Script Action, which is a configuration option that can be used from the Azure portal, HDInsight Windows PowerShell cmdlets, or the HDInsight .NET SDK. Další informace najdete v tématu přizpůsobení clusteru HDInsight pomocí akce skriptu.For more information, see Customize HDInsight cluster using Script Action.

Některé nativní komponenty Java, jako je Apache Mahout a Cascading, se dají spouštět v clusteru jako soubory v archivu Java (JAR).Some native Java components, like Apache Mahout and Cascading, can be run on the cluster as Java Archive (JAR) files. Tyto soubory JAR je možné distribuovat, aby Azure Storage a odeslaly do clusterů HDInsight pomocí mechanismů pro odesílání úloh Hadoop.These JAR files can be distributed to Azure Storage and submitted to HDInsight clusters with Hadoop job submission mechanisms. Další informace najdete v tématu odeslání Apache Hadoop úloh programově.For more information, see Submit Apache Hadoop jobs programmatically.

Poznámka

Pokud máte problémy s nasazováním souborů JAR do clusterů HDInsight nebo voláním souborů JAR v clusterech HDInsight, kontaktujte Podpora Microsoftu.If you have issues deploying JAR files to HDInsight clusters, or calling JAR files on HDInsight clusters, contact Microsoft Support.

Kaskáding není HDInsight podporován a nemá nárok na podpora Microsoftu.Cascading is not supported by HDInsight and is not eligible for Microsoft Support. Seznam podporovaných součástí najdete v tématu co je nového ve verzích clusterů poskytovaných službou HDInsight.For lists of supported components, see What's new in the cluster versions provided by HDInsight.

V některých případech budete chtít během procesu vytváření nakonfigurovat následující konfigurační soubory:Sometimes, you want to configure the following configuration files during the creation process:

  • clusterIdentity. XMLclusterIdentity.xml
  • Core-site. XMLcore-site.xml
  • Gateway. XMLgateway.xml
  • HBase-env. XMLhbase-env.xml
  • HBase-site. XMLhbase-site.xml
  • HDFS-site. XMLhdfs-site.xml
  • Hive-env. XMLhive-env.xml
  • Hive-site. XMLhive-site.xml
  • mapred – lokalitamapred-site
  • Oozie-site. XMLoozie-site.xml
  • Oozie-env. XMLoozie-env.xml
  • Storm-site. XMLstorm-site.xml
  • tez-site. XMLtez-site.xml
  • webhcat-site. XMLwebhcat-site.xml
  • YARN-site. XMLyarn-site.xml

Další informace najdete v tématu Přizpůsobení clusterů HDInsight pomocí nástroje Bootstrap.For more information, see Customize HDInsight clusters using Bootstrap.

Další krokyNext steps