Share via


Python-code uitvoeren in Azure Machine Learning Designer

In dit artikel leert u hoe u het onderdeel Python-script uitvoeren gebruikt om aangepaste logica toe te voegen aan de Azure Machine Learning-ontwerpfunctie. In deze instructies gebruikt u de Pandas-bibliotheek om eenvoudige functie-engineering uit te voeren.

U kunt de ingebouwde code-editor gebruiken om snel eenvoudige Python-logica toe te voegen. U moet de zip-bestandsmethode gebruiken om complexere code toe te voegen of om extra Python-bibliotheken te uploaden.

De standaard uitvoeringsomgeving maakt gebruik van de Anacondas-distributie van Python. Zie de naslagpagina python-scriptonderdeel uitvoeren voor een volledige lijst met vooraf geïnstalleerde pakketten.

Python-invoertoewijzing uitvoeren

Belangrijk

Als u grafische elementen die in dit document worden vermeld, zoals knoppen in Studio of Designer, niet ziet, hebt u mogelijk niet het juiste machtigingsniveau voor de werkruimte. Neem contact op met de beheerder van uw Azure-abonnement om te controleren of u het juiste toegangsniveau hebt gekregen. Zie Gebruikers en rollen beherenvoor meer informatie.

Python uitvoeren die is geschreven in de ontwerpfunctie

Het onderdeel Python-script uitvoeren toevoegen

  1. Zoek het onderdeel Python-script uitvoeren in het ontwerppalet. U vindt deze in de sectie Python-taal .

  2. Sleep het onderdeel naar het pijplijncanvas.

Verbinding maken met invoergegevenssets

In dit artikel wordt de voorbeeldgegevensset Automobile price data (Raw) gebruikt.

  1. Sleep de gegevensset naar het pijplijncanvas.

  2. Verbind de uitvoerpoort van de gegevensset met de invoerpoort linksboven van het onderdeel Python-script uitvoeren . De ontwerpfunctie maakt de invoer beschikbaar als een parameter voor het invoerpuntscript.

    De juiste invoerpoort is gereserveerd voor gezipte Python-bibliotheken.

    Gegevenssets verbinden

  3. Noteer zorgvuldig de specifieke invoerpoort die u gebruikt. De ontwerpfunctie wijst de linkerinvoerpoort toe aan de variabele dataset1en de middelste invoerpoort aan dataset2.

Invoeronderdelen zijn optioneel, omdat u gegevens rechtstreeks in het onderdeel Python-script uitvoeren kunt genereren of importeren.

Uw Python-code schrijven

De ontwerper biedt een eerste toegangspuntscript voor u om uw eigen Python-code te bewerken en in te voeren.

In dit voorbeeld gebruikt u Pandas om twee van de kolommen voor autogegevenssets - Prijs en Paardenkracht - te combineren om een nieuwe kolom te maken, Dollars per pk. Deze kolom geeft aan hoeveel u betaalt voor elke pk-eenheid, wat een nuttig informatiepunt kan worden om te bepalen of een specifieke auto een goede deal is voor de prijs.

  1. Selecteer het onderdeel Python-script uitvoeren .

  2. Selecteer in het deelvenster dat rechts van het canvas wordt weergegeven het tekstvak Python-script .

  3. Kopieer en plak de volgende code in het tekstvak:

    import pandas as pd
    
    def azureml_main(dataframe1 = None, dataframe2 = None):
        dataframe1['Dollar/HP'] = dataframe1.price / dataframe1.horsepower
        return dataframe1
    

    Uw pijplijn ziet er als volgt uit:

    Python-pijplijn uitvoeren

    Het toegangspuntscript moet de functie azureml_mainbevatten. De functie heeft twee functieparameters die zijn toegewezen aan de twee invoerpoorten voor het onderdeel Python-script uitvoeren .

    De retourwaarde moet een Pandas Dataframe zijn. U kunt maximaal twee dataframes retourneren als onderdeeluitvoer.

  4. Verzend de pijplijn.

U hebt nu een gegevensset met een nieuwe functie in Dollars/HP . Deze nieuwe functie kan helpen bij het trainen van een auto-aanbevelingsfunctie. In dit voorbeeld ziet u functie-extractie en dimensionaliteitsvermindering.

Volgende stappen

Meer informatie over het importeren van uw eigen gegevens in de Azure Machine Learning-ontwerpfunctie.