Porte usate dai servizi Hadoop su HDInsight

Questo documento fornisce un elenco delle porte usate dai servizi Hadoop in esecuzione nei cluster HDInsight basati su Linux. Fornisce anche informazioni sulle porte usate per connettersi al cluster tramite SSH.

Porte pubbliche e porte non pubbliche

I cluster HDInsight basati su Linux espongono pubblicamente solo tre porte su Internet: 22, 23 e 443. Queste porte vengono usate per accedere in modo sicuro al cluster tramite SSH e ai servizi esposti tramite il protocollo HTTPS protetto.

Internamente, HDInsight viene implementato da più macchine virtuali di Azure (i nodi all'interno del cluster) in esecuzione su una rete virtuale di Azure. Dall'interno della rete virtuale è possibile accedere alle porte non esposte a Internet. Ad esempio, se ci si connette a uno dei nodi head tramite SSH, dal nodo head è possibile accedere direttamente ai servizi in esecuzione sui nodi del cluster.

Importante

Se non si specifica una rete virtuale di Azure come opzione di configurazione per HDInsight, se ne crea automaticamente una. Tuttavia, non è possibile aggiungere altri computer (ad esempio altre macchine virtuali di Azure o nel computer di sviluppo client) a questa rete virtuale.

Per aggiungere altre macchine alla rete virtuale, creare innanzitutto la rete virtuale e specificarla durante la creazione del cluster HDInsight. Per altre informazioni, vedere Estendere le funzionalità di HDInsight usando Rete virtuale di Azure

Porte pubbliche

Tutti i nodi di un cluster HDInsight si trovano all'interno di una rete virtuale Azure e non sono accessibile direttamente da Internet. Un gateway pubblico fornisce accesso a Internet per le porte seguenti, comuni a tutti i tipi di cluster HDInsight.

Service Port Protocol Descrizione
sshd 22 SSH Connette i client a SSHD sul nodo head primario. Per altre informazioni, vedere Usare SSH con HDInsight.
sshd 22 SSH Connette i client a sshd sul nodo perimetrale. Per altre informazioni, vedere Usare SSH con HDInsight.
sshd 23 SSH Connette i client a SSHD sul nodo head secondario. Per altre informazioni, vedere Usare SSH con HDInsight.
Ambari 443 HTTPS Interfaccia utente Web Ambari Vedere Gestire i cluster HDInsight mediante l'utilizzo dell'interfaccia utente Web Ambari
Ambari 443 HTTPS API REST Ambari Vedere Gestire i cluster HDInsight mediante l'API REST Ambari
WebHCat 443 HTTPS API REST HCatalog Vedere gli articoli sull'uso di Hive con Curl, l'uso di Pig con Curl e l'uso di MapReduce con Curl
HiveServer2 443 ODBC Esegue la connessione ad Hive tramite ODBC. Vedere Connettere Excel a HDInsight mediante Microsoft Hive ODBC Driver.
HiveServer2 443 JDBC Esegue la connessione ad Hive tramite JDBC. Vedere Connettersi a Hive in Azure HDInsight con il driver Hive JDBC

Gli elementi seguenti sono disponibili per tipi di cluster specifici:

Service Port Protocol Tipo di cluster Descrizione
Stargate 443 HTTPS HBase API REST HBase Vedere Introduzione all'uso di HBase
Livy 443 HTTPS Spark API REST Spark Vedere Inviare processi Spark in modalità remota con Livy
Storm 443 HTTPS Storm Interfaccia utente Web di Storm Vedere Distribuire e gestire topologie Apache Storm in HDInsight

Autenticazione

Tutti i servizi esposti pubblicamente su Internet devono essere autenticati:

Port Credenziali
22 o 23 Le credenziali utente SSH specificate durante la creazione del cluster
443 Il nome di accesso (impostazione predefinita: admin) e la password impostati durante la creazione del cluster

Porte non pubbliche

Nota

Alcuni servizi sono disponibili solo su tipi di cluster specifici. Ad esempio, HBase è disponibile solo su tipi di cluster HBase.

Ambari

Service Nodi Port Path Protocol
Interfaccia utente Web Ambari Nodi head 8080 / HTTP
API REST Ambari Nodi head 8080 /api/v1 HTTP

Porte HDFS

Service Nodi Port Protocol Descrizione
Interfaccia utente Web NameNode Nodi head 30070 HTTPS Interfaccia utente Web per visualizzare lo stato
Servizio metadati NameNode Nodi head 8020 IPC Metadati del file system
DataNode Tutti i nodi di lavoro 30075 HTTPS Interfaccia utente Web per visualizzare lo stato, i log e così via.
DataNode Tutti i nodi di lavoro 30010   Trasferimento dati
DataNode Tutti i nodi di lavoro 30020 IPC Operazioni sui metadati
NameNode secondario Nodi head 50090 HTTP Checkpoint per i metadati NameNode

Porte YARN

Service Nodi Port Protocol Descrizione
Interfaccia utente Web di Resource Manager Nodi head 8088 HTTP Interfaccia utente Web per Resource Manager
Interfaccia utente Web di Resource Manager Nodi head 8090 HTTPS Interfaccia utente Web per Resource Manager
Interfaccia di amministrazione di Resource Manager Nodi head 8141 IPC Per gli invii delle applicazioni (Hive, server Hive, Pig e così via)
Utilità di pianificazione di Resource Manager Nodi head 8030 HTTP Interfaccia di amministrazione
Interfaccia dell'applicazione Resource Manager Nodi head 8050 HTTP Indirizzo dell'interfaccia di gestione delle applicazioni
NodeManager Tutti i nodi di lavoro 30050   L'indirizzo del gestore di contenitore
Interfaccia utente Web di NodeManager Tutti i nodi di lavoro 30060 HTTP Interfaccia di Resource Manager
Indirizzo di Timeline Nodi head 10200 RPC Il servizio RPC del servizio Timeline.
Interfaccia utente Web di Timeline Nodi head 8181 HTTP L'interfaccia utente Web del servizio Timeline

Porte Hive

Service Nodi Port Protocol Descrizione
HiveServer2 Nodi head 10001 Thrift Servizio per la connessione ad Hive (Thrift/JDBC)
Metastore Hive Nodi head 9083 Thrift Servizio per la connessione ai metadati Hive (Thrift/JDBC)

Porte WebHCat

Service Nodi Port Protocol Descrizione
Server WebHCat Nodi head 30111 HTTP API Web su HCatalog e su altri servizi Hadoop

Porte MapReduce

Service Nodi Port Protocol Descrizione
JobHistory Nodi head 19888 HTTP Interfaccia utente Web di MapReduce JobHistory
JobHistory Nodi head 10020   Server di MapReduce JobHistory
ShuffleHandler   13562   Trasferisce output intermedi di Map ai reducer che eseguono la richiesta

Oozie

Service Nodi Port Protocol Descrizione
Server di Oozie Nodi head 11000 HTTP URL per il servizio Oozie
Server di Oozie Nodi head 11001 HTTP Porta per l'amministrazione di Oozie

Metriche di Ambari

Service Nodi Port Protocol Descrizione
TimeLine (cronologia delle applicazioni) Nodi head 6188 HTTP L'interfaccia utente Web del servizio Timeline
TimeLine (cronologia delle applicazioni) Nodi head 30200 RPC L'interfaccia utente Web del servizio Timeline

Porte HBase

Service Nodi Port Protocol Descrizione
HMaster Nodi head 16000    
Interfaccia utente Web informativa di HMaster Nodi head 16010 HTTP La porta per l'interfaccia utente Web Master HBase
Server dell'area Tutti i nodi di lavoro 16020    
    2181   La porta usata dai client per connettersi a ZooKeeper

Porte Kafka

Service Nodi Port Protocol Descrizione
Gestore Nodi di lavoro 9092 Protocollo di trasmissione Kafka Usato per la comunicazione di client
  Nodi Zookeeper 2181   La porta usata dai client per connettersi a ZooKeeper

Porte Spark

Service Nodi Port Protocol Descrizione
Server Spark Thrift Nodi head 10002 Thrift Servizio per la connessione a Spark SQL (Thrift/JDBC)