Python-code uitvoeren in Azure Machine Learning Designer
In dit artikel leert u hoe u het onderdeel Python-script uitvoeren gebruikt om aangepaste logica toe te voegen aan de Azure Machine Learning-ontwerpfunctie. In deze instructies gebruikt u de Pandas-bibliotheek om eenvoudige functie-engineering uit te voeren.
U kunt de ingebouwde code-editor gebruiken om snel eenvoudige Python-logica toe te voegen. U moet de zip-bestandsmethode gebruiken om complexere code toe te voegen of om extra Python-bibliotheken te uploaden.
De standaard uitvoeringsomgeving maakt gebruik van de Anacondas-distributie van Python. Zie de naslagpagina python-scriptonderdeel uitvoeren voor een volledige lijst met vooraf geïnstalleerde pakketten.
Belangrijk
Als u grafische elementen die in dit document worden vermeld, zoals knoppen in Studio of Designer, niet ziet, hebt u mogelijk niet het juiste machtigingsniveau voor de werkruimte. Neem contact op met de beheerder van uw Azure-abonnement om te controleren of u het juiste toegangsniveau hebt gekregen. Zie Gebruikers en rollen beherenvoor meer informatie.
Python uitvoeren die is geschreven in de ontwerpfunctie
Het onderdeel Python-script uitvoeren toevoegen
Zoek het onderdeel Python-script uitvoeren in het ontwerppalet. U vindt deze in de sectie Python-taal .
Sleep het onderdeel naar het pijplijncanvas.
Verbinding maken met invoergegevenssets
In dit artikel wordt de voorbeeldgegevensset Automobile price data (Raw) gebruikt.
Sleep de gegevensset naar het pijplijncanvas.
Verbind de uitvoerpoort van de gegevensset met de invoerpoort linksboven van het onderdeel Python-script uitvoeren . De ontwerpfunctie maakt de invoer beschikbaar als een parameter voor het invoerpuntscript.
De juiste invoerpoort is gereserveerd voor gezipte Python-bibliotheken.
Noteer zorgvuldig de specifieke invoerpoort die u gebruikt. De ontwerpfunctie wijst de linkerinvoerpoort toe aan de variabele
dataset1
en de middelste invoerpoort aandataset2
.
Invoeronderdelen zijn optioneel, omdat u gegevens rechtstreeks in het onderdeel Python-script uitvoeren kunt genereren of importeren.
Uw Python-code schrijven
De ontwerper biedt een eerste toegangspuntscript voor u om uw eigen Python-code te bewerken en in te voeren.
In dit voorbeeld gebruikt u Pandas om twee van de kolommen voor autogegevenssets - Prijs en Paardenkracht - te combineren om een nieuwe kolom te maken, Dollars per pk. Deze kolom geeft aan hoeveel u betaalt voor elke pk-eenheid, wat een nuttig informatiepunt kan worden om te bepalen of een specifieke auto een goede deal is voor de prijs.
Selecteer het onderdeel Python-script uitvoeren .
Selecteer in het deelvenster dat rechts van het canvas wordt weergegeven het tekstvak Python-script .
Kopieer en plak de volgende code in het tekstvak:
import pandas as pd def azureml_main(dataframe1 = None, dataframe2 = None): dataframe1['Dollar/HP'] = dataframe1.price / dataframe1.horsepower return dataframe1
Uw pijplijn ziet er als volgt uit:
Het toegangspuntscript moet de functie
azureml_main
bevatten. De functie heeft twee functieparameters die zijn toegewezen aan de twee invoerpoorten voor het onderdeel Python-script uitvoeren .De retourwaarde moet een Pandas Dataframe zijn. U kunt maximaal twee dataframes retourneren als onderdeeluitvoer.
Verzend de pijplijn.
U hebt nu een gegevensset met een nieuwe functie in Dollars/HP . Deze nieuwe functie kan helpen bij het trainen van een auto-aanbevelingsfunctie. In dit voorbeeld ziet u functie-extractie en dimensionaliteitsvermindering.
Volgende stappen
Meer informatie over het importeren van uw eigen gegevens in de Azure Machine Learning-ontwerpfunctie.