Arbeiten im Apache Hadoop-Ökosystem in HDInsight auf einem Windows-ComputerWork in the Apache Hadoop ecosystem on HDInsight from a Windows PC

Erfahren Sie mehr über die Entwicklungs- und Verwaltungsoptionen auf einem Windows-Computer für die Arbeit im Apache Hadoop-Ökosystem in HDInsight.Learn about development and management options on the Windows PC for working in the Apache Hadoop ecosystem on HDInsight.

HDInsight basiert auf Apache Hadoop und Hadoop-Komponenten sowie Open-Source-Technologien, die unter Linux entwickelt wurden.HDInsight is based on Apache Hadoop and Hadoop components, open-source technologies developed on Linux. HDInsight 3.4 oder höher verwendet die Linux-Distribution Ubuntu als zugrunde liegendes Betriebssystem für den Cluster.HDInsight version 3.4 and higher uses the Ubuntu Linux distribution as the underlying OS for the cluster. Sie können aber auch von einem Windows-Client oder einer Windows-Entwicklungsumgebung aus mit HDInsight arbeiten.However, you can work with HDInsight from a Windows client or Windows development environment.

Verwenden von PowerShell für Bereitstellungs- und VerwaltungsaufgabenUse PowerShell for deployment and management tasks

Azure PowerShell ist eine Skriptumgebung, mit der Sie Bereitstellungs- und Verwaltungsaufgaben in HDInsight von Windows aus steuern und automatisieren können.Azure PowerShell is a scripting environment that you can use to control and automate deployment and management tasks in HDInsight from Windows.

Beispiele für Aufgaben, die Sie mit PowerShell erledigen können:Examples of tasks you can do with PowerShell:

Führen Sie die Schritte zum Installieren und Konfigurieren von Azure PowerShell aus, um die neueste Version zu erhalten.Follow steps to install and configure Azure Powershell to get the latest version.

Hilfsprogramme für die Ausführung in einem BrowserUtilities you can run in a browser

Die folgenden Hilfsprogramme verfügen über eine Webbenutzeroberfläche, die in einem Browser ausgeführt wird:The following utilities have a web UI that runs in a browser:

Data Lake-Tools (Hadoop) für Visual StudioData Lake (Hadoop) Tools for Visual Studio

Verwenden Sie die Data Lake-Tools für Visual Studio zum Bereitstellen und Verwalten von Storm-Topologien.Use Data Lake Tools for Visual Studio to deploy and manage Storm topologies. Die Data Lake-Tools installieren auch das SCP.NET SDK, mit dem Sie C#-Storm-Topologien mit Visual Studio entwickeln können.Data Lake Tools also installs the SCP.NET SDK, which allows you to develop C# Storm topologies with Visual Studio.

Bevor Sie mit den folgenden Beispielen fortfahren, installieren und testen Sie die Data Lake-Tools für Visual Studio.Before you go to the following examples, install and try Data Lake Tools for Visual Studio.

Beispiele für Aufgaben, die Sie mit Visual Studio und den Data Lake-Tools für Visual Studio ausführen können:Examples of tasks you can do with Visual Studio and Data Lake Tools for Visual Studio:

Visual Studio und das .NET SDKVisual Studio and the .NET SDK

Sie können Visual Studio mit dem .NET SDK verwenden, um Cluster zu verwalten und Big Data-Anwendungen zu entwickeln.You can use Visual Studio with the .NET SDK to manage clusters and develop big data applications. Sie können auch andere IDEs für die folgenden Aufgaben verwenden, in den Beispielen wird jedoch Visual Studio gezeigt.You can use other IDEs for the following tasks, but examples are shown in Visual Studio.

Beispiele für Aufgaben, die Sie mit dem .NET SDK in Visual Studio ausführen können:Examples of tasks you can do with the .NET SDK in Visual Studio:

Intellij IDEA und Eclipse-IDE für Spark-ClusterIntellij IDEA and Eclipse IDE for Spark clusters

Sowohl Intellij IDEA als auch die Eclipse-IDE können für Folgendes verwendet werden:Both Intellij IDEA and the Eclipse IDE can be used to:

  • Entwickeln und Übermitteln einer Scala Spark-Anwendung an einen HDInsight Spark-ClusterDevelop and submit a Scala Spark application on an HDInsight Spark cluster.
  • Zugreifen auf Spark-ClusterressourcenAccess Spark cluster resources.
  • Entwickeln und lokales Ausführen einer Scala Spark-AnwendungDevelop and run a Scala Spark application locally.

In diesem Artikel wird Folgendes beschrieben:These articles show how:

Notebooks in Spark für DatenanalystenNotebooks on Spark for data scientists

Apache Spark-Cluster in HDInsight enthalten Apache Zeppelin-Notebooks und -Kernel, die mit Jupyter-Notebooks verwendet werden können.Apache Spark clusters in HDInsight include Apache Zeppelin notebooks and kernels that can be used with Jupyter notebooks.

Ausführen von Linux-basierten Tools und Technologien unter WindowsRun Linux-based tools and technologies on Windows

In Situationen, in denen Sie Tools oder Technologien verwenden müssen, die nur unter Linux verfügbar sind, sollten Sie die folgenden Möglichkeiten in Erwägung ziehen:If you encounter a situation where you must use a tool or technology that is only available on Linux, consider the following options:

  • Bash auf Ubuntu unter Windows 10 stellt ein Linux-Subsystem unter Windows bereit.Bash on Ubuntu on Windows 10 provides a Linux subsystem on Windows. Bash erlaubt die direkte Ausführung von Linux-Hilfsprogrammen, ohne eine dedizierte Linux-Installation verwalten zu müssen.Bash allows you to directly run Linux utilities without having to maintain a dedicated Linux installation. Die Installationsschritte finden Sie unter Windows Subsystem for Linux Installation Guide for Windows 10 (Windows-Subsystem für Linux: Installationshandbuch für Windows 10).See Windows Subsystem for Linux Installation Guide for Windows 10 for installation steps. Es funktionieren auch andere Unix-Shells.Other Unix shells will work as well.
  • Docker für Windows ermöglicht den Zugriff auf viele Linux-basierten Tools und kann direkt unter Windows ausgeführt werden.Docker for Windows provides access to many Linux-based tools, and can be run directly from Windows. Sie können Docker beispielsweise verwenden, um den Beeline-Client für Hive direkt unter Windows auszuführen.For example, you can use Docker to run the Beeline client for Hive directly from Windows. Sie können auch Docker verwenden, um ein lokales Jupyter-Notebook auszuführen und eine Remoteverbindung mit Spark in HDInsight herzustellen.You can also use Docker to run a local Jupyter notebook and remotely connect to Spark on HDInsight. Erste Schritte mit Docker für WindowsGet started with Docker for Windows
  • MobaXTerm ermöglicht das Durchsuchen des Clusterdateisystems über eine SSH-Verbindung auf einer grafischen Benutzeroberfläche.MobaXTerm allows you to graphically browse the cluster file system over an SSH connection.

Plattformübergreifende ToolsCross-platform tools

Die Azure-Befehlszeilenschnittstelle (CLI) ist die plattformübergreifende Befehlszeilenumgebung von Microsoft zum Verwalten von Azure-Ressourcen.The Azure command-line interface (CLI) is Microsoft's cross-platform command-line experience for managing Azure resources. Weitere Informationen finden Sie unter Azure-Befehlszeilenschnittstelle (CLI).For more information, see Azure Command-Line Interface (CLI).

Nächste SchritteNext steps

Wenn Sie nicht mit der Arbeit in Linux-basierten Clustern vertraut sind, lesen Sie die folgenden Artikel:If you're new to working in Linux-based clusters, see the follow articles: