Práce v Apache Hadoop ekosystému ve službě HDInsight z počítače s WindowsWork in the Apache Hadoop ecosystem on HDInsight from a Windows PC

Přečtěte si o možnostech vývoje a správy na počítači s Windows pro práci v Apache Hadoop ekosystému ve službě HDInsight.Learn about development and management options on the Windows PC for working in the Apache Hadoop ecosystem on HDInsight.

HDInsight je založený na komponentách Apache Hadoop a Hadoop, open source technologiích vyvinutých na platformě Linux.HDInsight is based on Apache Hadoop and Hadoop components, open-source technologies developed on Linux. HDInsight verze 3,4 a vyšší používá distribuci Ubuntu Linux jako základní operační systém pro cluster.HDInsight version 3.4 and higher uses the Ubuntu Linux distribution as the underlying OS for the cluster. Můžete ale pracovat se službou HDInsight z klienta Windows nebo vývojového prostředí Windows.However, you can work with HDInsight from a Windows client or Windows development environment.

Použití PowerShellu pro úlohy nasazení a správyUse PowerShell for deployment and management tasks

Azure PowerShell je skriptovací prostředí, které můžete použít k řízení a automatizaci úloh nasazení a správy ve službě HDInsight ze systému Windows.Azure PowerShell is a scripting environment that you can use to control and automate deployment and management tasks in HDInsight from Windows.

Příklady úloh, které můžete provádět s PowerShellem:Examples of tasks you can do with PowerShell:

Pokud chcete získat nejnovější verzi, postupujte podle kroků pro instalaci a konfiguraci Azure PowerShellu .Follow steps to install and configure Azure Powershell to get the latest version.

Nástroje, které můžete spustit v prohlížečiUtilities you can run in a browser

Následující nástroje mají webové uživatelské rozhraní, které běží v prohlížeči:The following utilities have a web UI that runs in a browser:

Data Lake (Hadoop) Tools pro Visual StudioData Lake (Hadoop) Tools for Visual Studio

Pomocí Data Lakech nástrojů pro Visual Studio nasaďte a spravujte topologie přeplavování.Use Data Lake Tools for Visual Studio to deploy and manage Storm topologies. Nástroje pro Data Lake také instalují sadu SDK SCP.NET, která umožňuje vyvíjet topologie C# s využitím sady Visual Studio.Data Lake Tools also installs the SCP.NET SDK, which allows you to develop C# Storm topologies with Visual Studio.

Než přejdete na následující příklady, nainstalujte a vyzkoušejte si data Lake nástroje pro Visual Studio.Before you go to the following examples, install and try Data Lake Tools for Visual Studio.

Příklady úloh, které můžete provádět pomocí sady Visual Studio a Data Lakech nástrojů pro Visual Studio:Examples of tasks you can do with Visual Studio and Data Lake Tools for Visual Studio:

Visual Studio a sada .NET SDKVisual Studio and the .NET SDK

Sadu Visual Studio se sadou .NET SDK můžete použít ke správě clusterů a vývoji aplikací pro velké objemy dat.You can use Visual Studio with the .NET SDK to manage clusters and develop big data applications. Můžete použít další prostředí pro následující úkoly, ale příklady jsou uvedeny v aplikaci Visual Studio.You can use other IDEs for the following tasks, but examples are shown in Visual Studio.

Příklady úloh, které můžete provádět s .NET SDK v sadě Visual Studio:Examples of tasks you can do with the .NET SDK in Visual Studio:

IntelliJ nápad a rozzatmění IDE pro clustery SparkIntellij IDEA and Eclipse IDE for Spark clusters

INTELLIJ nápad i rozhraní IDE pro zatmění lze použít k:Both Intellij IDEA and the Eclipse IDE can be used to:

  • Vývoj a odesílání aplikace Scala Spark v clusteru HDInsight Spark.Develop and submit a Scala Spark application on an HDInsight Spark cluster.
  • Přístup k prostředkům clusteru Spark.Access Spark cluster resources.
  • Vývoj a spouštění aplikace Scala Spark lokálněDevelop and run a Scala Spark application locally.

Tyto články ukazují, jak:These articles show how:

Poznámkové bloky ve Sparku pro odborníky přes dataNotebooks on Spark for data scientists

Clustery Apache Spark v HDInsight zahrnují notebooky Apache Zeppelin a jádra, které je možné použít s poznámkovým blokem Jupyter.Apache Spark clusters in HDInsight include Apache Zeppelin notebooks and kernels that can be used with Jupyter Notebooks.

Spouštění nástrojů a technologií založených na systému Linux ve WindowsRun Linux-based tools and technologies on Windows

Pokud jste pocházeli v situaci, kdy je nutné použít nástroj nebo technologii, která je k dispozici pouze pro Linux, vezměte v úvahu následující možnosti:If you come across a situation where you must use a tool or technology that is only available on Linux, consider the following options:

  • Bash v Ubuntu ve Windows 10 poskytuje podsystém Linux ve Windows.Bash on Ubuntu on Windows 10 provides a Linux subsystem on Windows. Bash umožňuje přímo spouštět nástroje pro Linux bez nutnosti udržovat vyhrazenou instalaci systému Linux.Bash allows you to directly run Linux utilities without having to maintain a dedicated Linux installation. Pokyny k instalaci najdete v tématu Instalační příručka k systému Windows pro Linux pro systém Windows 10 .See Windows Subsystem for Linux Installation Guide for Windows 10 for installation steps. Budou fungovat i další prostředí UNIX .Other Unix shells will work as well.
  • Docker for Windows poskytuje přístup k mnoha nástrojům pro Linux a dá se spustit přímo z Windows.Docker for Windows provides access to many Linux-based tools, and can be run directly from Windows. Můžete například použít Docker ke spuštění klienta Beeline pro podregistr přímo z Windows.For example, you can use Docker to run the Beeline client for Hive directly from Windows. Docker můžete použít také ke spuštění místního Jupyter Notebook a ke vzdálenému připojení ke Sparku ve službě HDInsight.You can also use Docker to run a local Jupyter Notebook and remotely connect to Spark on HDInsight. Začínáme s Docker for WindowsGet started with Docker for Windows
  • MobaXTerm umožňuje grafiku procházet systémem souborů clusteru přes připojení SSH.MobaXTerm allows you to graphically browse the cluster file system over an SSH connection.

Nástroje pro různé platformyCross-platform tools

Rozhraní příkazového řádku Azure (CLI) je nové víceplatformové prostředí příkazového řádku Microsoftu pro správu prostředků Azure.The Azure command-line interface (CLI) is Microsoft's cross-platform command-line experience for managing Azure resources. Další informace najdete v tématu rozhraní příkazového řádku (CLI) pro Azure Command-Line.For more information, see Azure Command-Line Interface (CLI).

Další krokyNext steps

Pokud už nepracujete na clusterech se systémem Linux, přečtěte si článek postup:If you're new to working in Linux-based clusters, see the follow articles: