Wat is de Azure Machine Learning-ontwerpfunctie?
Azure Machine Learning designer is een interface met slepen en neerzetten die wordt gebruikt voor het trainen en implementeren van modellen in Azure Machine Learning. In dit artikel worden de taken beschreven die u in de ontwerpfunctie kunt uitvoeren.
- Zie Zelfstudie: Een regressiemodel zonder code trainen om aan de slag te gaan met de ontwerpfunctie.
- Zie algorithm and component reference (Naslag voor algoritmen en onderdelen) voor meer informatie over de onderdelen die beschikbaar zijn in de ontwerpfunctie.

De ontwerpfunctie gebruikt uw Azure Machine Learning om gedeelde resources te organiseren, zoals:
- Pijplijnen
- Gegevenssets
- Rekenbronnen
- Geregistreerde modellen
- Gepubliceerde pijplijnen
- Realtime-eindpunten
Modeltraining en -implementatie
Gebruik een visueel canvas om een end-to-end-machine learning te bouwen. Modellen trainen, testen en implementeren in de ontwerpfunctie:
- Sleep gegevenssets en onderdelen naar het canvas.
- Verbinding maken onderdelen om een pijplijnontwerp te maken.
- Dien een pijplijn-run in met behulp van de rekenbronnen in Azure Machine Learning werkruimte.
- Converteert uw trainingspijplijnen naar de deference-pijplijnen.
- Publiceer uw pijplijnen naar een REST-pijplijn-eindpunt om een nieuwe pijplijn te verzenden die wordt uitgevoerd met verschillende parameters en gegevenssets.
- Publiceer een trainingspijplijn om één pijplijn opnieuw te gebruiken om meerdere modellen te trainen en tegelijkertijd parameters en gegevenssets te wijzigen.
- Publiceer een batchdeferentiepijplijn om voorspellingen te doen over nieuwe gegevens met behulp van een eerder getraind model.
- Implementeer een realtime deferentiepijplijn naar een realtime-eindpunt om in realtime voorspellingen te doen over nieuwe gegevens.

Pijplijn
Een pijplijn bestaat uit gegevenssets en analytische onderdelen die u verbindt. Pijplijnen hebben veel toepassingen: u kunt een pijplijn maken die één model traint of een pijplijn die meerdere modellen traint. U kunt een pijplijn maken die in realtime of in batch voorspellingen doet, of een pijplijn maken die alleen gegevens opschoont. Met pijplijnen kunt u uw werk opnieuw gebruiken en uw projecten organiseren.
Pijplijnontwerp
Wanneer u een pijplijn bewerkt in de ontwerpfunctie, wordt de voortgang opgeslagen als een pijplijnontwerp. U kunt een pijplijnontwerp op elk moment bewerken door onderdelen toe te voegen of te verwijderen, rekendoelen te configureren, parameters te maken, en meer.
Een geldige pijplijn heeft de volgende kenmerken:
- Gegevenssets kunnen alleen verbinding maken met onderdelen.
- -onderdelen kunnen alleen verbinding maken met gegevenssets of andere onderdelen.
- Alle invoerpoorten voor onderdelen moeten verbinding hebben met de gegevensstroom.
- Alle vereiste parameters voor elk onderdeel moeten worden ingesteld.
Wanneer u klaar bent om uw pijplijnontwerp uit te voeren, dient u een pijplijn-run in.
Pijplijnuitvoering
Telkens wanneer u een pijplijn hebt uitgevoerd, worden de configuratie van de pijplijn en de resultaten ervan opgeslagen in uw werkruimte als een pijplijnuitleiding. U kunt teruggaan naar elke pijplijn die wordt uitgevoerd om deze te inspecteren voor probleemoplossing of controle. Kloon een pijplijn-run om een nieuw pijplijnontwerp te maken dat u kunt bewerken.
Pijplijnruns worden gegroepeerd in experimenten om de geschiedenis van de run te organiseren. U kunt het experiment instellen voor elke pijplijn die wordt uitgevoerd.
Gegevenssets
Een machine learning gegevensset maakt het eenvoudig om toegang te krijgen tot uw gegevens en er mee te werken. Er zijn verschillende voorbeeldgegevenssets opgenomen in de ontwerpfunctie waarmee u kunt experimenteren. U kunt meer gegevenssets registreren wanneer u ze nodig hebt.
Onderdeel
Een onderdeel is een algoritme dat u kunt uitvoeren op uw gegevens. De ontwerpfunctie heeft verschillende onderdelen, variërend van functies voor gegevensingressie tot trainings-, score- en validatieprocessen.
Een onderdeel kan een set parameters hebben die u kunt gebruiken om de interne algoritmen van het onderdeel te configureren. Wanneer u een onderdeel op het canvas selecteert, worden de parameters van het onderdeel weergegeven in het deelvenster Eigenschappen rechts van het canvas. U kunt de parameters in dit deelvenster wijzigen om het model af te stemmen. U kunt de rekenbronnen voor afzonderlijke onderdelen instellen in de ontwerpfunctie.
Zie Algorithm & component reference overview (Overzicht van algoritmen en onderdelen) & hulp bij het navigeren door de bibliotheek machine learning beschikbare algoritmen. Voor hulp bij het kiezen van een algoritme, zie Azure Machine Learning Algorithm Cheat Sheet.
Rekenbronnen
Gebruik rekenbronnen uit uw werkruimte om uw pijplijn uit te voeren en uw geïmplementeerde modellen te hosten als realtime-eindpunten of pijplijn-eindpunten (voor batchdeferentie). De ondersteunde rekendoelen zijn:
| Rekendoel | Training | Implementatie |
|---|---|---|
| Azure Machine Learning berekenen | ✓ | |
| Azure Kubernetes Service | ✓ |
Rekendoelen worden gekoppeld aan uw Azure Machine Learning werkruimte. U beheert uw rekendoelen in uw werkruimte in Azure Machine Learning studio.
Implementeren
Als u realtime de deferencing wilt uitvoeren, moet u een pijplijn implementeren als een realtime-eindpunt. Het realtime-eindpunt maakt een interface tussen een externe toepassing en uw scoremodel. Een aanroep van een realtime-eindpunt retourneert voorspellingsresultaten in realtime naar de toepassing. Als u een aanroep naar een realtime-eindpunt wilt maken, moet u de API-sleutel doorgeven die is gemaakt toen u het eindpunt hebt geïmplementeerd. Het eindpunt is gebaseerd op REST, een populaire architectuurkeuze voor webprogrammeringsprojecten.
Realtime-eindpunten moeten worden geïmplementeerd in een Azure Kubernetes Service cluster.
Zie Zelfstudie: Een machine learning implementeren met de ontwerpfunctie voormeer informatie over het implementeren van uw model.
Notitie
Azure Machine Learning Eindpunten (preview) bieden een verbeterde, eenvoudigere implementatie-ervaring. Eindpunten ondersteunen zowel realtime- als batchdeferentiescenario's. Eindpunten bieden een geïntegreerde interface voor het aanroepen en beheren van modelimplementaties voor verschillende rekentypen. Zie Wat zijn Azure Machine Learning eindpunten (preview)?.
Publiceren
U kunt ook een pijplijn publiceren naar een pijplijn-eindpunt. Net als bij een realtime-eindpunt kunt u met een pijplijn-eindpunt nieuwe pijplijn-runs verzenden vanuit externe toepassingen met behulp van REST-aanroepen. U kunt echter geen gegevens in realtime verzenden of ontvangen met behulp van een pijplijn-eindpunt.
Gepubliceerde pijplijnen zijn flexibel, ze kunnen worden gebruikt om modellen te trainen of opnieuw te trainen, batchdeferencinguit te voeren, nieuwe gegevens te verwerken en nog veel meer. U kunt meerdere pijplijnen publiceren naar één pijplijn-eindpunt en opgeven welke pijplijnversie moet worden uitgevoerd.
Een gepubliceerde pijplijn wordt uitgevoerd op de rekenbronnen die u definieert in het pijplijnontwerp voor elk onderdeel.
De ontwerpfunctie maakt hetzelfde PublishedPipeline-object als de SDK.
Volgende stappen
- Leer de basisprincipes van predictive analytics en machine learning met Zelfstudie: Autoprijzen voorspellen met de ontwerpfunctie
- Meer informatie over het wijzigen van bestaande designervoorbeelden om deze aan uw behoeften aan te passen.