R Language Modules

In diesem Artikel werden die Module in Azure Machine Learning Studio (klassisch) aufgelistet, die das Ausführen von R-Code unterstützen. Diese Module vereinfachen das Veröffentlichen von r-Modellen in der Produktion und die Verwendung der r-sprach Community, um reale Probleme zu lösen.

Hinweis

Gilt für: Machine Learning Studio (klassisch)

Dieser Inhalt bezieht sich nur auf Studio (klassisch). Ähnliche Drag & Drop-Module wurden Azure Machine Learning-Designer hinzugefügt. Weitere Informationen finden Sie in diesem Artikel zum Vergleich der beiden Versionen.

Außerdem werden in diesem Artikel einige allgemeine Anforderungen für die Verwendung von R in Machine Language Studio (klassisch) beschrieben, und es werden bekannte Probleme und Tipps aufgeführt.

Liste der Module

Die Kategorie " R Language modules " enthält die folgenden Module:

  • Execute R Script: führt ein r-Skript aus einem Machine Learning Experiment aus.
  • Create R Model: erstellt ein r-Modell mithilfe von benutzerdefinierten Ressourcen.

Anforderungen bei der Verwendung von R

Beachten Sie vor der Verwendung des R-Skripts in Machine Learning Studio (klassisch) die folgenden Anforderungen:

  • Wenn Sie Daten importiert haben, die CSV oder andere Formate verwenden, können Sie die Daten nicht direkt im CSV-Format aus Ihrem R-Code lesen. Verwenden Sie stattdessen Convert to DataSet , um die Daten vorzubereiten, bevor Sie Sie als Eingabe für ein R-Modul verwenden.

  • Wenn Sie ein Machine Learning DataSet als Eingabe an ein r-Modul anfügen, wird das Dataset automatisch in den R-Arbeitsbereich als Datenrahmen mit dem Variablennamen DataSet geladen.

    Sie können jedoch zusätzliche Datenrahmen definieren oder den Namen der standardmäßigen datasetvariablen in Ihrem R-Skript ändern.

  • Die R-Module werden in einer geschützten und isolierten Umgebung in Ihrem privaten Arbeitsbereich ausgeführt. Sie können innerhalb Ihres Arbeitsbereichs Datenrahmen und Variablen für die Verwendung in mehreren Modulen erstellen.

    Allerdings können Sie keine R-Datenrahmen aus einem anderen Arbeitsbereich laden oder Variablen lesen, die in einem anderen Arbeitsbereich erstellt wurden, selbst wenn dieser Arbeitsbereich in einer Azure-Sitzung geöffnet ist. Außerdem können Sie keine Module verwenden, die eine Java-Abhängigkeit aufweisen oder direkten Netzwerk Zugriff erfordern.

Optimierung für R-Bewertungsaufgaben

Die Implementierung von R in der Machine Learning Studio (klassisch) und in der Arbeitsbereichs Umgebung umfasst zwei Hauptkomponenten. Eine Komponente koordiniert die Skriptausführung, und die andere Komponente bietet Hochgeschwindigkeitsdaten Zugriff und-Bewertung. Die Bewertungs Komponente ist optimiert, um die Skalierbarkeit und Leistung zu verbessern.

R-Arbeitsbereiche in Machine Learning Studio (klassisch) unterstützen daher auch zwei Arten von Bewertungsaufgaben, die jeweils für unterschiedliche Anforderungen optimiert sind. Wenn Sie ein Experiment entwickeln, verwenden Sie in der Regel die Bewertung auf Datei Basis. In der Regel verwenden Sie den Anforderungs Antwort Dienst (Request Response Service, RRS) für eine sehr schnelle Bewertung, wenn Sie eine Bewertung als Teil eines Webdiensts durchführen.

R-Paket-und-Versions Unterstützung

Machine Learning Studio (klassisch) umfasst mehr als 500 der beliebtesten R-Pakete. Die r-Pakete, aus denen Sie auswählen können, hängen davon ab, welche r-Version Sie für Ihr Experiment ausgewählt haben:

  • CRAN R
  • Microsoft R Open (MRO 3.2.2 oder MRO 3.4.4)

Wenn Sie ein Experiment erstellen, müssen Sie eine einzelne R-Version auswählen, die für alle Module in Ihrem Experiment ausgeführt werden soll.

Liste der Pakete pro Version

Eine Liste der Pakete, die derzeit in Machine Learning unterstützt werden, finden Sie unter von Azure Machine Learning unterstützte R-Pakete.

Sie können auch dem Modul Execute R Script in Ihrem Experiment den folgenden Code hinzufügen und ihn ausführen, um ein DataSet mit Paketnamen und-Versionen zu erhalten. Stellen Sie sicher, dass Sie die R-Version in den Modul Eigenschaften festlegen, um die richtige Liste für die gewünschte Umgebung zu generieren.

data.set <- data.frame(installed.packages())
maml.mapOutputPort("data.set")

Wichtig

Die Pakete, die in Machine Language Studio (klassisch) unterstützt werden, ändern sich häufig. Wenn Sie Zweifel haben, ob ein r-Paket unterstützt wird, verwenden Sie das bereitgestellte r-Codebeispiel, um die komplette Liste der Pakete in der aktuellen Umgebung zu erhalten.

Erweitern von Experimenten mithilfe der Programmiersprache R

Es gibt viele Möglichkeiten, mit denen Sie Ihr Experiment durch benutzerdefinierte R-Skripts oder durch Hinzufügen von R-Paketen erweitern können. Im folgenden finden Sie einige Ideen zum Einstieg:

  • Verwenden Sie R-Code, um benutzerdefinierte mathematische Vorgänge auszuführen. Es gibt z. B. R-Pakete zum Lösen von Differentialgleichungen, Generieren von Zufallszahlen oder Ausführen von Monte Carlo-Simulationen.

  • Anwenden benutzerdefinierter Transformationen auf Daten. Beispielsweise können Sie ein R-Paket verwenden, um Interpolationen für Zeitreihendaten auszuführen oder eine linguistische Analyse auszuführen.

  • Arbeiten Sie mit unterschiedlichen Datenquellen. Die R-Skript Module unterstützen einen zusätzlichen Satz von Eingaben, die Datendateien im komprimierten Format enthalten können. Sie können komprimierte Datendateien zusammen mit R-Paketen, die für solche Datenquellen entworfen wurden, verwenden, um hierarchische Daten in einer flachen Datentabelle zu vereinfachen. Diese können auch zum Lesen von Daten aus Excel und anderen Dateiformaten verwendet werden.

  • Verwenden Sie benutzerdefinierte Metriken für die Evaluierung. Anstatt z. b. die in der Auswertungbereitgestellten Funktionen zu verwenden, könnten Sie ein R-Paket importieren und dann seine Metriken anwenden.

Das folgende Beispiel veranschaulicht den allgemeinen Prozess für die Installation neuer Pakete und die Verwendung von benutzerdefiniertem R-Code in Ihrem Experiment.

Aufteilen von Spalten mithilfe von R

Mitunter müssen die Daten umfassend bearbeitet werden, um Merkmale zu extrahieren. Angenommen, Sie verfügen über eine Textdatei, die eine ID gefolgt von Werten und hinweisen enthält, die alle durch Leerzeichen voneinander getrennt sind. Oder angenommen, die Textdatei enthält Zeichen, die nicht von Machine Language Studio (klassisch) unterstützt werden.

Es gibt mehrere R-Pakete, die spezielle Funktionen für diese Aufgaben bereitstellen. Das splitstackshape-Bibliotheks Paket enthält mehrere nützliche Funktionen zum Aufteilen mehrerer Spalten, auch wenn jede Spalte ein anderes Trennzeichen aufweist.

Im folgenden Beispiel wird veranschaulicht, wie die erforderlichen Pakete installiert und Spalten aufgeteilt werden. Fügen Sie dem Modul Execute R Script den folgenden Code hinzu.

#install dependent packages  
install.packages("src/concat.split.multiple/data.table_1.9.2.zip", lib=".", repos = NULL, verbose = TRUE)  
(success.data.table <- library("data.table", lib.loc = ".", logical.return = TRUE, verbose = TRUE))  
  
install.packages("src/concat.split.multiple/plyr_1.8.1.zip", lib=".", repos = NULL, verbose = TRUE)  
(success.plyr <- library("plyr", lib.loc = ".", logical.return = TRUE, verbose = TRUE))  
  
install.packages("src/concat.split.multiple/Rcpp_0.11.2.zip", lib=".", repos = NULL, verbose = TRUE)  
(success.Rcpp <- library("Rcpp", lib.loc = ".", logical.return = TRUE, verbose = TRUE))  
  
install.packages("src/concat.split.multiple/reshape2_1.4.zip", lib=".", repos = NULL, verbose = TRUE)  
(success.reshape2 <- library("reshape2", lib.loc = ".", logical.return = TRUE, verbose = TRUE))  
  
#install actual packages  
install.packages("src/concat.split.multiple/splitstackshape_1.2.0.zip", lib=".", repos = NULL, verbose = TRUE)  
(success.splitstackshape <- library("splitstackshape", lib.loc = ".", logical.return = TRUE, verbose = TRUE))  
  
#Load installed library  
library(splitstackshape)  
  
#Use library method to split & concat  
data <- concat.split.multiple(maml.mapInputPort(1), c("TermsAcceptedUserClientIPAddress", "EmailAddress"), c(".", "@"))  
  
#Print column names to console  
colnames(data)  
  
#Redirect data to output port  
maml.mapOutputPort("data")  

Zusätzliche Ressourcen

Beginnen Sie mit diesem Tutorial, das beschreibt, wie Sie ein benutzerdefiniertes R-Modul erstellen:

In diesem Artikel werden die Unterschiede zwischen den beiden Bewertungs Modulen ausführlich erläutert und erläutert, wie Sie eine Bewertungsmethode auswählen können, wenn Sie Ihr Experiment als Webdienst bereitstellen:

Dieses Experiment in der Azure AI Gallery veranschaulicht, wie Sie ein benutzerdefiniertes R-Modul erstellen können, das Trainings-, Bewertungs-und Evaluierungs Aktionen durchführt:

Dieser Artikel, veröffentlicht auf R-Blogger, veranschaulicht, wie Sie eine eigene Evaluierungs Methode in Machine Learning erstellen können:

Weitere Hilfe zu R

Diese Site enthält eine kategorisierte Liste von Paketen, die Sie nach Schlüsselwörtern durchsuchen können:

Zusätzliche R-Codebeispiele und Hilfe zu R und den zugehörigen Anwendungen finden Sie in folgenden Ressourcen:

Weitere Informationen