Rychlý Start: vytvoření a monitorování topologie Apache Storm ve službě Azure HDInsightQuickstart: Create and monitor an Apache Storm topology in Azure HDInsight

Apache Storm je škálovatelný výpočetní systém v reálném čase odolný proti chybám, distribuovaný určený pro zpracování datových proudů.Apache Storm is a scalable, fault-tolerant, distributed, real-time computation system for processing streams of data. Pomocí Storm v Azure HDInsight můžete vytvořit cloudový cluster Storm, který bude provádět analýzy velkých objemů dat v reálném čase.With Storm on Azure HDInsight, you can create a cloud-based Storm cluster that performs big data analytics in real time.

V tomto rychlém startu použijete příklad z projektu Apache -Starter k vytvoření a monitorování Apache Storm topologie do existujícího clusteru Apache Storm.In this quickstart, you use an example from the Apache storm-starter project to create and monitor an Apache Storm topology to an existing Apache Storm cluster.

PředpokladyPrerequisites

Vytvoření topologieCreate the topology

  1. Připojte se ke clusteru nevlastníce.Connect to your Storm cluster. Níže uvedený příkaz upravte nahrazením CLUSTERNAME názvem vašeho clusteru pro zaplavení a zadáním příkazu:Edit the command below by replacing CLUSTERNAME with the name of your Storm cluster, and then enter the command:

    ssh sshuser@CLUSTERNAME-ssh.azurehdinsight.net
    
  2. WORDCOUNT příklad je součástí vašeho clusteru HDInsight na adrese /usr/hdp/current/storm-client/contrib/storm-starter/ .The WordCount example is included on your HDInsight cluster at /usr/hdp/current/storm-client/contrib/storm-starter/. Tato topologie vygeneruje náhodné věty a spočítá, kolikrát se slova vyskytují.The topology generates random sentences and counts how many times words occur. K zahájení topologie WORDCOUNT v clusteru použijte následující příkaz:Use the following command to start the wordcount topology on the cluster:

    storm jar /usr/hdp/current/storm-client/contrib/storm-starter/storm-starter-topologies-*.jar org.apache.storm.starter.WordCountTopology wordcount
    

Monitorování topologieMonitor the topology

Funkce poskytuje webové rozhraní pro práci s běžícími topologiemi a je součástí clusteru HDInsight.Storm provides a web interface for working with running topologies, and is included on your HDInsight cluster.

Ke sledování topologie pomocí uživatelského rozhraní Storm použijte následující kroky:Use the following steps to monitor the topology using the Storm UI:

  1. Pokud chcete zobrazit uživatelské rozhraní Storm, otevřete ve webovém prohlížeči adresu https://CLUSTERNAME.azurehdinsight.net/stormui.To display the Storm UI, open a web browser to https://CLUSTERNAME.azurehdinsight.net/stormui. Nahraďte CLUSTERNAME názvem svého clusteru.Replace CLUSTERNAME with the name of your cluster.

  2. V části Souhrn topologievyberte položku WORDCOUNT ve sloupci název .Under Topology Summary, select the wordcount entry in the Name column. Zobrazí se další informace o topologii.Information about the topology is displayed.

    Řídicí panel Storm s informacemi o topologii Storm Starter WordCount.

    Na nové stránce najdete následující informace:The new page provides the following information:

    VlastnostProperty PopisDescription
    Statistiky topologieTopology stats Základní informace o výkonu topologie uspořádané do časových oken.Basic information on the topology performance, organized into time windows. Výběrem konkrétního časového okna změníte časové okno informací zobrazených v dalších částech stránky.Selecting a specific time window changes the time window for information displayed in other sections of the page.
    SpoutůSpouts Základní informace o spoutů, včetně poslední chyby vrácené jednotlivými Spout.Basic information about spouts, including the last error returned by each spout.
    PřipevňovacíchBolts Základní informace o šrouby.Basic information about bolts.
    Konfigurace topologieTopology configuration Podrobné informace o konfiguraci topologieDetailed information about the topology configuration.
    AktivovatActivate Obnoví zpracování deaktivované topologie.Resumes processing of a deactivated topology.
    DeaktivovatDeactivate Pozastaví běžící topologii.Pauses a running topology.
    Obnovení rovnováhyRebalance Upravuje paralelismus topologie.Adjusts the parallelism of the topology. Po změně počtu uzlů v clusteru musíte znovu vyvážit spuštěné topologie.You should rebalance running topologies after you have changed the number of nodes in the cluster. Nové vyvážení upraví paralelismus, aby se vykompenzovalo zvýšení nebo snížení počtu uzlů v clusteru.Rebalancing adjusts parallelism to compensate for the increased/decreased number of nodes in the cluster. Další informace najdete v tématu Princip paralelismu Apache Storm topologie.For more information, see Understanding the parallelism of an Apache Storm topology.
    KillKill Ukončí topologii nečinnosti po zadaném časovém limitu.Terminates a Storm topology after the specified timeout.
  3. Na této stránce vyberte položku z oddílu Spouts nebo Bolts.From this page, select an entry from the Spouts or Bolts section. Zobrazí se informace o vybrané komponentě.Information about the selected component is displayed.

    Řídicí panel Storm s informacemi o vybraných součástech.

    Na nové stránce se zobrazí následující informace:The new page displays the following information:

    VlastnostProperty PopisDescription
    Statistiky Spout/šroubůSpout/Bolt stats Základní informace o výkonu komponenty uspořádané do časových oken.Basic information on the component performance, organized into time windows. Výběrem konkrétního časového okna změníte časové okno informací zobrazených v dalších částech stránky.Selecting a specific time window changes the time window for information displayed in other sections of the page.
    Vstupní statistiky (jenom šroub)Input stats (bolt only) Informace o součástech, které vytváří data spotřebovaná šroubem.Information on components that produce data consumed by the bolt.
    Statistiky výstupuOutput stats Informace o datech emitovaných tímto šroubem.Information on data emitted by this bolt.
    Prováděcí modulyExecutors Informace o instancích této součásti.Information on instances of this component.
    chybyErrors Chyby, které tato součást vytvořila.Errors produced by this component.
  4. Chcete-li zobrazit podrobnosti pro konkrétní instanci komponenty, při zobrazení podrobností o funkcích spout nebo bolt vyberte položku ze sloupce Port v oddílu Vykonavatelé.When viewing the details of a spout or bolt, select an entry from the Port column in the Executors section to view details for a specific instance of the component.

2015-01-27 14:18:02 b.s.d.task [INFO] Emitting: split default ["with"]
2015-01-27 14:18:02 b.s.d.task [INFO] Emitting: split default ["nature"]
2015-01-27 14:18:02 b.s.d.executor [INFO] Processing received message source: split:21, stream: default, id: {}, [snow]
2015-01-27 14:18:02 b.s.d.task [INFO] Emitting: count default [snow, 747293]
2015-01-27 14:18:02 b.s.d.executor [INFO] Processing received message source: split:21, stream: default, id: {}, [white]
2015-01-27 14:18:02 b.s.d.task [INFO] Emitting: count default [white, 747293]
2015-01-27 14:18:02 b.s.d.executor [INFO] Processing received message source: split:21, stream: default, id: {}, [seven]
2015-01-27 14:18:02 b.s.d.task [INFO] Emitting: count default [seven, 1493957]

V tomto příkladu se slovo seven vyskytlo 1493957krát.In this example, the word seven has occurred 1493957 times. Tolikrát bylo toto slovo zjištěno od spuštění této topologie.This count is how many times the word has been encountered since this topology was started.

Zastavení topologieStop the topology

Vraťte se na stránku Souhrn topologie, kde naleznete topologii počtu slov a pak vyberte tlačítko Zastavit z oddílu Topologie akce.Return to the Topology summary page for the word-count topology, and then select the Kill button from the Topology actions section. Po zobrazení výzvy zadejte hodnotu 10 jako počet sekund, po které se má počkat před zastavením topologie.When prompted, enter 10 for the seconds to wait before stopping the topology. Po uplynutí časového limitu se topologie už při návštěvě oddílu Uživatelské rozhraní Storm řídicího panelu nezobrazí.After the timeout period, the topology no longer appears when you visit the Storm UI section of the dashboard.

Vyčištění prostředkůClean up resources

Po dokončení rychlého startu možná budete chtít cluster odstranit.After you complete the quickstart, you may want to delete the cluster. Pomocí HDInsight jsou vaše data uložena v Azure Storage, takže můžete clusteru bezpečně odstranit, pokud není používán.With HDInsight, your data is stored in Azure Storage, so you can safely delete a cluster when it is not in use. Za cluster služby HDInsight se účtují poplatky, i když se nepoužívá.You are also charged for an HDInsight cluster, even when it is not in use. Vzhledem k tomu, že poplatky za cluster představují několikanásobek poplatků za úložiště, dává ekonomický smysl odstraňovat clustery, které nejsou používány.Since the charges for the cluster are many times more than the charges for storage, it makes economic sense to delete clusters when they are not in use.

Pokud chcete odstranit cluster, přečtěte si téma odstranění clusteru HDInsight pomocí prohlížeče, PowerShellu nebo rozhraní příkazového řádku Azure.To delete a cluster, see Delete an HDInsight cluster using your browser, PowerShell, or the Azure CLI.

Další krokyNext steps

V tomto rychlém startu jste použili příklad z projektu Apache -Starter k vytvoření a monitorování Apache Storm topologie do existujícího clusteru Apache Storm.In this quickstart, you used an example from the Apache storm-starter project to create and monitor an Apache Storm topology to an existing Apache Storm cluster. V dalším článku se naučíte základy správy a monitorování topologií Apache Storm.Advance to the next article to learn the basics of managing and monitoring Apache Storm topologies.