Wat is de Azure Machine Learning-ontwerpfunctie?

Azure Machine Learning designer is een interface voor slepen en neerzetten die wordt gebruikt om modellen te trainen en te implementeren in Azure Machine Learning. In dit artikel worden de taken beschreven die u in de ontwerpfunctie kunt uitvoeren.

  • Zie Zelfstudie: Een regressiemodel zonder code trainen om aan de slag te gaan met de ontwerpfunctie.
  • Zie de naslag voor algoritmen en onderdelen voor meer informatie over de onderdelen die beschikbaar zijn in de ontwerpfunctie.

Voorbeeld van ontwerpfunctie van Azure Machine Learning

De ontwerper gebruikt uw Azure Machine Learning om gedeelde resources te organiseren, zoals:

Modeltraining en -implementatie

Gebruik een visueel canvas om een end-to-end-machine learning te bouwen. Modellen trainen, testen en implementeren in de ontwerpfunctie:

  1. Sleep gegevenssets en modules naar het canvas.
  2. Verbinding maken modules om een pijplijnontwerp te maken.
  3. Verzend een pijplijn-run met behulp van de rekenbronnen in Azure Machine Learning werkruimte.
  4. Converteert uw trainingspijplijnen naar de deference-pijplijnen.
  5. Publiceer uw pijplijnen naar een REST-pijplijn-eindpunt om een nieuwe pijplijn te verzenden die wordt uitgevoerd met verschillende parameters en gegevenssets.
    • Publiceer een trainingspijplijn om één pijplijn opnieuw te gebruiken om meerdere modellen te trainen tijdens het wijzigen van parameters en gegevenssets.
    • Publiceer een batchdeferentiepijplijn om voorspellingen te doen over nieuwe gegevens met behulp van een eerder getraind model.
  6. Implementeer een realtime deference-pijplijn naar een realtime-eindpunt om in realtime voorspellingen te doen over nieuwe gegevens.

Werkstroomdiagram voor training, batchdeferentie en realtime deference in de ontwerpfunctie

Pijplijn

Een pijplijn bestaat uit gegevenssets en algoritmische modules, die u verbindt. Pijplijnen hebben veel toepassingen: u kunt een pijplijn maken die één model traint of een pijplijn die meerdere modellen traint. U kunt een pijplijn maken die in realtime of in batch voorspellingen doet, of een pijplijn maken die alleen gegevens opschoont. Met pijplijnen kunt u uw werk opnieuw gebruiken en uw projecten organiseren.

Pijplijnontwerp

Wanneer u een pijplijn bewerkt in de ontwerpfunctie, wordt uw voortgang opgeslagen als een pijplijnontwerp. U kunt een pijplijnontwerp op elk moment bewerken door modules toe te voegen of te verwijderen, rekendoelen te configureren, parameters te maken, en meer.

Een geldige pijplijn heeft de volgende kenmerken:

  • Gegevenssets kunnen alleen verbinding maken met modules.
  • Modules kunnen alleen verbinding maken met gegevenssets of andere modules.
  • Alle invoerpoorten voor modules moeten een verbinding hebben met de gegevensstroom.
  • Alle vereiste parameters voor elke module moeten worden ingesteld.

Wanneer u klaar bent om uw pijplijnontwerp uit te voeren, dient u een pijplijnrun in.

Pijplijnuitvoering

Telkens wanneer u een pijplijn hebt uitgevoerd, worden de configuratie van de pijplijn en de resultaten ervan in uw werkruimte opgeslagen als een pijplijnuitleiding. U kunt teruggaan naar elke pijplijn om deze te controleren voor probleemoplossing of controle. Kloon een pijplijn-run om een nieuw pijplijnontwerp te maken dat u kunt bewerken.

Pijplijnruns worden gegroepeerd in experimenten om de geschiedenis van de run te organiseren. U kunt het experiment instellen voor elke pijplijn die wordt uitgevoerd.

Gegevenssets

Met machine learning gegevensset kunt u eenvoudig toegang krijgen tot en werken met uw gegevens. Er zijn verschillende voorbeeldgegevenssets opgenomen in de ontwerpfunctie waarmee u kunt experimenteren. U kunt meer gegevenssets registreren wanneer u ze nodig hebt.

Module

Een module is een algoritme dat u met uw gegevens kunt uitvoeren. De ontwerpfunctie heeft verschillende modules, variërend van functies voor gegevensingressen tot trainings-, score- en validatieprocessen.

Een module kan een reeks parameters hebben waarmee u de interne algoritmen van de module kunt configureren. Wanneer u een module op het canvas selecteert, worden de parameters van de module weergegeven in het deelvenster Properties, rechts van het canvas. U kunt de parameters in dat deelvenster wijzigen om uw pijplijn af te stemmen. U kunt de rekenbronnen voor afzonderlijke modules instellen in de ontwerpfunctie.

Module-eigenschappen

Zie Algorithm & module reference overview (Overzicht van algoritmen en modules) machine learning hulp bij het navigeren door de bibliotheek machine learning beschikbare algoritmen. Voor hulp bij het kiezen van een algoritme, zie Azure Machine Learning Algorithm Cheat Sheet.

Rekenbronnen

Gebruik rekenbronnen uit uw werkruimte om uw pijplijn uit te voeren en uw geïmplementeerde modellen te hosten als realtime eindpunten of pijplijn-eindpunten (voor batchdeferentie). De ondersteunde rekendoelen zijn:

Rekendoel Training Implementatie
Azure Machine Learning berekenen
Azure Kubernetes Service

Rekendoelen zijn gekoppeld aan uw Azure Machine Learning werkruimte. U beheert uw rekendoelen in uw werkruimte in Azure Machine Learning studio.

Implementeren

Als u realtime de deferencing wilt uitvoeren, moet u een pijplijn implementeren als een realtime-eindpunt. Het realtime-eindpunt maakt een interface tussen een externe toepassing en uw scoremodel. Een aanroep van een realtime-eindpunt retourneert voorspellingsresultaten in realtime aan de toepassing. Als u een aanroep naar een realtime-eindpunt wilt maken, kunt u de API-sleutel doorgeven die is gemaakt toen u het eindpunt hebt geïmplementeerd. Het eindpunt is gebaseerd op REST, een populaire architectuurkeuze voor webprogrammeringsprojecten.

Realtime-eindpunten moeten worden geïmplementeerd in een Azure Kubernetes Service cluster.

Zie Voor meer informatie over het implementeren van uw model Zelfstudie: Een machine learning implementeren met de ontwerpfunctie.

Notitie

Azure Machine Learning Eindpunten (preview) bieden een verbeterde, eenvoudigere implementatie-ervaring. Eindpunten ondersteunen zowel realtime- als batchdeferentiescenario's. Eindpunten bieden een geïntegreerde interface voor het aanroepen en beheren van modelimplementaties voor verschillende rekentypen. Zie Wat zijn Azure Machine Learning eindpunten (preview)?.

Publiceren

U kunt ook een pijplijn publiceren naar een pijplijn-eindpunt. Net als bij een realtime-eindpunt kunt u met een pijplijn-eindpunt nieuwe pijplijn-runs verzenden vanuit externe toepassingen met behulp van REST-aanroepen. U kunt echter geen gegevens in realtime verzenden of ontvangen met behulp van een pijplijn-eindpunt.

Gepubliceerde pijplijnen zijn flexibel, kunnen worden gebruikt voor het trainen of opnieuw trainen van modellen, het uitvoeren van batchdeferencing,het verwerken van nieuwe gegevens en nog veel meer. U kunt meerdere pijplijnen publiceren naar één pijplijn-eindpunt en opgeven welke pijplijnversie moet worden uitgevoerd.

Een gepubliceerde pijplijn wordt uitgevoerd op de rekenbronnen die u definieert in het pijplijnontwerp voor elke module.

De ontwerpfunctie maakt hetzelfde PublishedPipeline-object als de SDK.

Volgende stappen