R-taal modules

Dit artikel bevat een lijst met de modules in Azure Machine Learning Studio (klassiek) die ondersteuning bieden voor het uitvoeren van R-code. Deze modules maken het gemakkelijker om R-modellen in productie te publiceren en om de ervaring van de R-taal te gebruiken om problemen met de praktijk op te lossen.

Notitie

Van toepassing op : machine learning Studio (klassiek)

Deze inhoud is alleen van toepassing op Studio (klassiek). Er zijn Vergelijk bare modules voor slepen en neerzetten toegevoegd aan Azure Machine Learning Designer. In dit artikel vindt u meer informatie over de twee versies.

In dit artikel worden ook enkele algemene vereisten beschreven voor het gebruik van R in machine language Studio (klassiek), en een lijst met bekende problemen en tips.

Lijst met modules

De categorie R-taal modules bevat de volgende modules:

  • R-script uitvoeren: voert een r-script uit van een machine learning experiment.
  • R-model maken: Hiermee maakt u een r-model met behulp van aangepaste resources.

Vereisten voor het gebruik van R

Bekijk de volgende vereisten voordat u R-script in Machine Learning Studio (klassiek) gebruikt:

  • Als u gegevens hebt geïmporteerd die gebruikmaken van CSV of een andere indeling, kunt u de gegevens niet rechtstreeks in CSV-indeling lezen vanuit uw R-code. Gebruik in plaats daarvan Convert naar dataset om de gegevens voor te bereiden voordat u deze gebruikt als invoer voor een R-module.

  • Wanneer u Machine Learning gegevensset als invoer aan een R-module koppelt, wordt de gegevensset automatisch in de R-werk ruimte geladen als een gegevens frame, met de naam gegevenssetvan de variabele.

    U kunt echter aanvullende gegevens frames definiëren of de naam van de standaard variabele gegevensset in uw R-script wijzigen.

  • De R-modules worden uitgevoerd in een beveiligde en geïsoleerde omgeving binnen uw persoonlijke werk ruimte. In uw werk ruimte kunt u gegevens frames en-variabelen maken voor gebruik door meerdere modules.

    U kunt echter geen R-gegevens frames uit een andere werk ruimte laden of variabelen lezen die zijn gemaakt in een andere werk ruimte, zelfs als deze werk ruimte is geopend in een Azure-sessie. U kunt ook geen modules gebruiken die een Java-afhankelijkheid hebben of waarvoor directe netwerk toegang is vereist.

Optimalisatie voor R-Score taken

De implementatie van R in de Machine Learning Studio (klassieke) en werkruimte omgeving bevat twee hoofd onderdelen. Een component coördineert de uitvoering van het script en de andere biedt uiterst snelle toegang tot gegevens en een betere score. Het Score onderdeel is geoptimaliseerd om de schaal baarheid en prestaties te verbeteren.

Daarom ondersteunen R-werk ruimten in Machine Learning Studio (klassiek) ook twee soorten Score taken, die elk zijn geoptimaliseerd voor verschillende vereisten. Normaal gesp roken gebruikt u per bestand score voor het maken van een experiment. Normaal gesp roken gebruikt u de request Response Service (RR'S) voor een zeer snel Score, wanneer u scoreeert als onderdeel van een webservice.

Ondersteuning voor R-pakketten en-versies

Machine Learning Studio (klassiek) omvat meer dan 500 van de meest populaire R-pakketten. De R-pakketten waaruit u kunt kiezen, zijn afhankelijk van de R-versie die u voor uw experiment selecteert:

  • KRANEN R
  • Micro soft R open (BHT 3.2.2 of BHT 3.4.4)

Telkens wanneer u een experiment maakt, moet u één R-versie kiezen om uit te voeren voor alle modules in uw experiment.

Lijst met pakketten per versie

Zie R-pakketten die worden ondersteund door Azure machine learningvoor een lijst met de pakketten die momenteel worden ondersteund in machine learning.

U kunt ook de volgende code toevoegen aan een script module voor het uitvoeren van R in uw experiment en deze uitvoeren om een gegevensset te verkrijgen die pakket namen en versies bevat. Zorg ervoor dat u de R-versie in de module eigenschappen instelt om de juiste lijst te genereren voor uw omgeving.

data.set <- data.frame(installed.packages())
maml.mapOutputPort("data.set")

Belangrijk

De pakketten die worden ondersteund in machine language Studio (klassiek), worden regel matig gewijzigd. Als u twijfels hebt over of een R-pakket wordt ondersteund, gebruikt u het voor beeld van de R-code voor het ophalen van de volledige lijst met pakketten in de huidige omgeving.

Experimenten uitbreiden met behulp van de R-taal

Er zijn veel manieren waarop u uw experiment kunt uitbreiden door gebruik te maken van een aangepast R-script of door R-pakketten toe te voegen. Hier volgen enkele ideeën om aan de slag te gaan:

  • Gebruik R-code om aangepaste wiskundige bewerkingen uit te voeren. Er zijn bijvoorbeeld R-pakketten voor het oplossen van differentiële vergelijkingen, het genereren van wille keurige getallen of het uitvoeren van Monte Carlo-simulaties.

  • Aangepaste trans formaties voor gegevens Toep assen. U kunt bijvoorbeeld een R-pakket gebruiken om interpolatie uit te voeren op de tijdreeks gegevens of een taal kundige analyse uit te voeren.

  • Werken met verschillende gegevens bronnen. De R-script modules ondersteunen een extra set invoer, die gegevens bestanden kan bevatten (gezipte indeling). U kunt zip-gegevens bestanden, samen met R-pakketten die zijn ontworpen voor dergelijke gegevens bronnen, gebruiken om hiërarchische gegevens in een platte gegevens tabel in te voegen. U kunt deze ook gebruiken voor het lezen van gegevens uit Excel en andere bestands indelingen.

  • Aangepaste metrische gegevens gebruiken voor evaluatie. Zo kunt u in plaats van de functies die in evaluerenworden gebruikt, een R-pakket importeren en vervolgens de metrische gegevens Toep assen.

In het volgende voor beeld ziet u het algehele proces voor het installeren van nieuwe pakketten en het gebruik van aangepaste R-code in uw experiment.

Kolommen splitsen met R

Soms vereist de gegevens uitgebreide manipulatie om functies te extra heren. Stel dat u een tekst bestand hebt dat een ID bevat, gevolgd door waarden en opmerkingen, gescheiden door spaties. Of stel dat uw tekst bestand tekens bevat die niet worden ondersteund door machine language Studio (klassiek).

Er zijn verschillende R-pakketten die speciale functies bieden voor dergelijke taken. Het splitstackshape-bibliotheek pakket bevat verschillende nuttige functies voor het splitsen van meerdere kolommen, zelfs als elke kolom een ander scheidings teken heeft.

In het volgende voor beeld ziet u hoe u de benodigde pakketten installeert, en splitst u kolommen op. U voegt deze code toe aan de module voor het uitvoeren van een R-script .

#install dependent packages  
install.packages("src/concat.split.multiple/data.table_1.9.2.zip", lib=".", repos = NULL, verbose = TRUE)  
(success.data.table <- library("data.table", lib.loc = ".", logical.return = TRUE, verbose = TRUE))  
  
install.packages("src/concat.split.multiple/plyr_1.8.1.zip", lib=".", repos = NULL, verbose = TRUE)  
(success.plyr <- library("plyr", lib.loc = ".", logical.return = TRUE, verbose = TRUE))  
  
install.packages("src/concat.split.multiple/Rcpp_0.11.2.zip", lib=".", repos = NULL, verbose = TRUE)  
(success.Rcpp <- library("Rcpp", lib.loc = ".", logical.return = TRUE, verbose = TRUE))  
  
install.packages("src/concat.split.multiple/reshape2_1.4.zip", lib=".", repos = NULL, verbose = TRUE)  
(success.reshape2 <- library("reshape2", lib.loc = ".", logical.return = TRUE, verbose = TRUE))  
  
#install actual packages  
install.packages("src/concat.split.multiple/splitstackshape_1.2.0.zip", lib=".", repos = NULL, verbose = TRUE)  
(success.splitstackshape <- library("splitstackshape", lib.loc = ".", logical.return = TRUE, verbose = TRUE))  
  
#Load installed library  
library(splitstackshape)  
  
#Use library method to split & concat  
data <- concat.split.multiple(maml.mapInputPort(1), c("TermsAcceptedUserClientIPAddress", "EmailAddress"), c(".", "@"))  
  
#Print column names to console  
colnames(data)  
  
#Redirect data to output port  
maml.mapOutputPort("data")  

Aanvullende bronnen

Begin met deze zelf studie waarin wordt beschreven hoe u een aangepaste R-module bouwt:

In dit artikel worden de verschillen tussen de twee waarderings engines in detail beschreven en wordt uitgelegd hoe u een score methode kunt kiezen wanneer u uw experiment als een webservice implementeert:

In dit experiment in de Azure AI Gallery ziet u hoe u een aangepaste R-module kunt maken die training, Score en evaluatie biedt:

In dit artikel, dat wordt gepubliceerd op R-bloggers, ziet u hoe u uw eigen evaluatie methode kunt maken in Machine Learning:

Meer hulp bij R

Deze site bevat een Gecategoriseerde lijst met pakketten waarop u kunt zoeken op tref woorden:

Raadpleeg de volgende bronnen voor extra R-code voorbeelden en hulp met R en de bijbehorende toepassingen:

Zie ook