Odesílání úloh z Nástrojů R pro Visual StudioSubmit jobs from R Tools for Visual Studio

Nástroje R pro Visual Studio (RTVS) je zdarma, open source rozšíření pro Community (zdarma), Professional a verze Enterprise Edition obou Visual Studio 2017, a Visual Studio 2015 Update 3nebo vyšší.R Tools for Visual Studio (RTVS) is a free, open-source extension for the Community (free), Professional, and Enterprise editions of both Visual Studio 2017, and Visual Studio 2015 Update 3 or higher. Není k dispozici pro RTVS Visual Studio 2019.RTVS is not available for Visual Studio 2019.

RTVS vylepšuje pracovního postupu R tím, že nabízí nástroje, jako interaktivní okno R (REPL), technologie intellisense (dokončování kódu), vykreslení vizualizace prostřednictvím knihoven jazyka R, jako jsou ggplot2 a ggviz, Ladění kódu Ra provádění dalších akcí.RTVS enhances your R workflow by offering tools such as the R Interactive window (REPL), intellisense (code completion), plot visualization through R libraries such as ggplot2 and ggviz, R code debugging, and more.

Nastavení prostředíSet up your environment

  1. Nainstalujte nástroje R pro Visual Studio.Install R Tools for Visual Studio.

    Instalace RTVS v sadě Visual Studio 2017

  2. Vyberte pro datové vědy a analytické aplikace úloh, vyberte podpora jazyka R, podpora modulu CLR pro vývoj v jazyce R, a Microsoft R Client možnosti.Select the Data science and analytical applications workload, then select the R language support, Runtime support for R development, and Microsoft R Client options.

  3. Musíte mít veřejného a privátního klíče pro ověřování SSH.You need to have public and private keys for SSH authentication.

  4. Nainstalujte ML Server na svém počítači.Install ML Server on your machine. ML Server poskytuje RevoScaleR a RxSpark funkce.ML Server provides the RevoScaleR and RxSpark functions.

  5. Nainstalujte PuTTY poskytnout výpočetního kontextu pro spuštění RevoScaleR funkcí z místního klienta do clusteru HDInsight.Install PuTTY to provide a compute context to run RevoScaleR functions from your local client to your HDInsight cluster.

  6. Máte možnost použít nastavení pro datové vědy pro prostředí sady Visual Studio, který poskytuje nové rozložení pro váš pracovní prostor pro nástroje R.You have the option to apply the Data Science Settings to your Visual Studio environment, which provides a new layout for your workspace for the R tools.

    1. Chcete-li uložit aktuální nastavení sady Visual Studio, použijte nástroje > Nastavení importu a exportu příkaz a pak vyberte exportovat vybrané nastavení prostředí a zadejte název souboru.To save your current Visual Studio settings, use the Tools > Import and Export Settings command, then select Export selected environment settings and specify a file name. Obnovení těchto nastavení, použijte stejný příkaz a vyberte importovat vybrané nastavení prostředí.To restore those settings, use the same command and select Import selected environment settings.

    2. Přejděte nástroje R nabídka položek, vyberte nastavení pro datové vědy... .Go to the R Tools menu item, then select Data Science Settings....

      Nastavení pro datové vědy...

      Poznámka

      Pomocí přístupu v kroku 1, můžete také uložit a obnovit rozložení mezi odborníky přes data individuální namísto opakování nastavení pro datové vědy příkazu.Using the approach in step 1, you can also save and restore your personalized data scientist layout, rather than repeating the Data Science Settings command.

Spusťte místní metody RExecute local R methods

  1. Vytvoření clusteru HDInsight služby ML.Create your HDInsight ML Services cluster.

  2. Nainstalujte RTVS rozšíření.Install the RTVS extension.

  3. Stáhněte si soubor zip, ukázky.Download the samples zip file.

  4. Otevřít examples/Examples.sln spustíte řešení v sadě Visual Studio.Open examples/Examples.sln to launch the solution in Visual Studio.

  5. Otevřít 1-Getting Started with R.R soubor A first look at R složku řešení.Open the 1-Getting Started with R.R file in the A first look at R solution folder.

  6. Spouští se v horní části souboru, stiskněte klávesy Ctrl + Enter zaslání každého řádku, jeden po druhém, interaktivní okno R.Starting at the top of the file, press Ctrl+Enter to send each line, one at a time, to the R Interactive window. Některé řádky může nějakou dobu, během instalace balíčků.Some lines might take a while as they install packages.

    • Alternativně je můžete vybrat všechny řádky v souboru jazyka R (Ctrl + A), pak provést všechny (Ctrl + Enter) nebo vybrat spuštění interaktivní ikonu na panelu nástrojů.Alternatively, you can select all lines in the R file (Ctrl+A), then either execute all (Ctrl+Enter), or select the Execute Interactive icon on the toolbar. Spustit interaktivníExecute interactive
  7. Po spuštění všech řádků ve skriptu, byste měli vidět výstup podobný tomuto:After running all the lines in the script, you should see an output similar to this:

    Nastavení pro datové vědy...

Odesílání úloh do clusteru služby HDInsight MLSubmit jobs to an HDInsight ML Services cluster

Pomocí klienta Microsoft ML Server nebo Microsoft R v počítači Windows pomocí klienta PuTTY, můžete vytvořit výpočetní kontext, který se spustí distribuované RevoScaleR funkcí z místního klienta do clusteru HDInsight.Using a Microsoft ML Server/Microsoft R Client from a Windows computer equipped with PuTTY, you can create a compute context that will run distributed RevoScaleR functions from your local client to your HDInsight cluster. Použití RxSpark vytvoření výpočetního kontextu zadání vašeho uživatelského jména, cluster Apache Hadoop hraniční uzel, přepínače SSH a tak dále.Use RxSpark to create the compute context, specifying your username, the Apache Hadoop cluster's edge node, SSH switches, and so forth.

  1. Adresa hraničního uzlu služby ML na HDInsight je CLUSTERNAME-ed-ssh.azurehdinsight.net kde CLUSTERNAME je název vašeho clusteru služby ML.The ML Services edge node address on HDInsight is CLUSTERNAME-ed-ssh.azurehdinsight.net where CLUSTERNAME is the name of your ML Services cluster.

  2. Vložte následující kód do R interaktivního okna v sadě Visual Studio, změna hodnot proměnných instalační program, aby odpovídaly vašemu prostředí.Paste the following code into the R Interactive window in Visual Studio, altering the values of the setup variables to match your environment.

    # Setup variables that connect the compute context to your HDInsight cluster
    mySshHostname <- 'r-cluster-ed-ssh.azurehdinsight.net ' # HDI secure shell hostname
    mySshUsername <- 'sshuser' # HDI SSH username
    mySshClientDir <- "C:\\Program Files (x86)\\PuTTY"
    mySshSwitches <- '-i C:\\Users\\azureuser\\r.ppk' # Path to your private ssh key
    myHdfsShareDir <- paste("/user/RevoShare", mySshUsername, sep = "/")
    myShareDir <- paste("/var/RevoShare", mySshUsername, sep = "/")
    mySshProfileScript <- "/usr/lib64/microsoft-r/3.3/hadoop/RevoHadoopEnvVars.site"
    
    # Create the Spark Cluster compute context
    mySparkCluster <- RxSpark(
          sshUsername = mySshUsername,
      sshHostname = mySshHostname,
      sshSwitches = mySshSwitches,
      sshProfileScript = mySshProfileScript,
      consoleOutput = TRUE,
      hdfsShareDir = myHdfsShareDir,
      shareDir = myShareDir,
      sshClientDir = mySshClientDir
    )
    
    # Set the current compute context as the Spark compute context defined above
    rxSetComputeContext(mySparkCluster)
    

    Nastavit kontext Spark

  3. Spusťte následující příkazy v R interaktivním okně:Execute the following commands in the R Interactive window:

    rxHadoopCommand("version") # should return version information
    rxHadoopMakeDir("/user/RevoShare/newUser") # creates a new folder in your storage account
    rxHadoopCopy("/example/data/people.json", "/user/RevoShare/newUser") # copies file to new folder
    

    Zobrazený výstup by měl vypadat přibližně takto:You should see an output similar to the following:

    Úspěšné provedení příkazu příjmu

  4. Ověřte, že rxHadoopCopy úspěšně zkopírovala people.json soubor ze složky příklad dat na nově vytvořený /user/RevoShare/newUser složky:Verify that the rxHadoopCopy successfully copied the people.json file from the example data folder to the newly created /user/RevoShare/newUser folder:

    1. Z podokna clusteru služby HDInsight ML v Azure, vyberte účty úložiště z nabídky na levé straně.From your HDInsight ML Services cluster pane in Azure, select Storage accounts from the left-hand menu.

      Účty úložiště

    2. Vyberte výchozí účet úložiště pro váš cluster, a poznamenejte si název kontejneru/adresáři.Select the default storage account for your cluster, making note of the container/directory name.

    3. Vyberte kontejnery v levé nabídce na podokno vašeho účtu úložiště.Select Containers from the left-hand menu on your storage account pane.

      Containers

    4. Vyberte název kontejneru vašeho clusteru, přejděte uživatele složky (možná muset kliknout na načíst další v dolní části seznamu) a pak vyberte RevoShare, pak newUser.Select your cluster's container name, browse to the user folder (you might have to click Load more at the bottom of the list), then select RevoShare, then newUser. people.json Souboru má být zobrazen v newUser složky.The people.json file should be displayed in the newUser folder.

      Zkopírovaný soubor

  5. Jakmile budete hotovi, pomocí aktuálního kontextu Apache Sparku, je nutné zastavit.After you are finished using the current Apache Spark context, you must stop it. Nelze spustit více kontexty najednou.You cannot run multiple contexts at once.

    rxStopEngine(mySparkCluster)
    

Další postupNext steps