Naslaginformatie over algoritme en onderdelen voor Azure Machine Learning Designer

VAN TOEPASSING OP: Python SDK azure-ai-ml v2 (actueel)

Notitie

Designer ondersteunt twee soorten onderdelen, klassieke vooraf samengestelde onderdelen en aangepaste onderdelen. Deze twee typen onderdelen zijn niet compatibel.

Klassieke vooraf gebouwde onderdelen bieden belangrijke vooraf gedefinieerde onderdelen voor gegevensverwerking en traditionele machine learning-taken, zoals regressie en classificatie. Dit type onderdeel wordt nog steeds ondersteund, maar er worden geen nieuwe onderdelen toegevoegd.

Met aangepaste onderdelen kunt u uw eigen code als onderdeel opgeven. Het biedt ondersteuning voor delen tussen werkruimten en naadloze creatie in Studio-, CLI- en SDK-interfaces.

Dit artikel is van toepassing op klassieke vooraf samengestelde onderdelen.

Deze referentie-inhoud biedt de technische achtergrond van elk van de klassieke vooraf gedefinieerde onderdelen die beschikbaar zijn in de Azure Machine Learning-ontwerpfunctie.

Elk onderdeel vertegenwoordigt een set code die onafhankelijk kan worden uitgevoerd en een machine learning-taak kan uitvoeren, gezien de vereiste invoer. Een onderdeel kan een bepaald algoritme bevatten of een taak uitvoeren die belangrijk is in machine learning, zoals ontbrekende waardevervanging of statistische analyse.

Zie voor hulp bij het kiezen van algoritmen

Tip

In elke pijplijn in de ontwerpfunctie krijgt u informatie over een specifiek onderdeel. Selecteer de koppeling Meer informatie in de onderdeelkaart wanneer u de muisaanwijzer op het onderdeel in de lijst met onderdelen plaatst of in het rechterdeelvenster van het onderdeel.

Onderdelen voor gegevensvoorbereiding

Functionaliteit Beschrijving Component
Gegevensinvoer en -uitvoer Verplaats gegevens uit cloudbronnen naar uw pijplijn. Schrijf uw resultaten of tussenliggende gegevens naar Azure Storage of SQL Database, terwijl u een pijplijn uitvoert of gebruik cloudopslag om gegevens uit te wisselen tussen pijplijnen. Gegevens handmatig invoeren
Gegevens exporteren
Gegevens importeren
Gegevenstransformatie Bewerkingen op gegevens die uniek zijn voor machine learning, zoals het normaliseren of binning van gegevens, dimensionaliteitsreductie en het converteren van gegevens tussen verschillende bestandsindelingen. Kolommen toevoegen
Rijen toevoegen
Wiskundige bewerking toepassen
SQL-transformatie toepassen
Ontbrekende gegevens opschonen
Clipwaarden
Converteren naar CSV
Converteren naar gegevensset
Converteren naar indicatorwaarden
Metagegevens bewerken
Gegevens groeperen in opslaglocaties
Join-gegevens
Gegevens normaliseren
Partitie en voorbeeld
Dubbele rijen verwijderen
SLOEG
Transformatie van kolommen selecteren
Kolommen selecteren in gegevensset
Gegevens splitsen
Onderdelen selecteren Selecteer een subset van relevante, nuttige functies die u kunt gebruiken om een analytisch model te bouwen. Functieselectie op basis van filter
Urgentie van functie permutatie
Statistische functies Bieden een breed scala aan statistische methoden met betrekking tot gegevenswetenschap. Gegevens samenvatten

Machine learning-algoritmen

Functionaliteit Beschrijving Component
Regressie Een waarde voorspellen. Regressie van versterkte beslissingsstructuur
Beslissingsforestregressie
Snelle kwantielregressie van forest
Lineaire regressie
Regressie van neuraal netwerk
Poisson-regressie
Clustering Gegevens groeperen. K-Means-clustering
Classificatie Een klasse voorspellen. Kies uit binaire algoritmen (twee klassen) of algoritmen met meerdere klassen. Beslissingsstructuur met meerdere klassen verhoogd
Beslissingsforest met meerdere klassen
Logistieke regressie met meerdere klassen
Neurale netwerk met meerdere klassen
One vs. All Multiclass
One versus One Multiclass
Gemiddelde perceptron van twee klassen
Two-Class Boosted Decision Tree
Beslissingsforest met twee klassen
Tweeklasse logistieke regressie
Twee klassen neuraal netwerk
Ondersteuningsvectormachine van twee klassen

Onderdelen voor het bouwen en evalueren van modellen

Functionaliteit Beschrijving Component
Modeltraining Gegevens uitvoeren via het algoritme. Clusteringmodel trainen
Trainingsmodel
Pytorch-model trainen
Hyperparameters van model afstemmen
Modelscore en -evaluatie Meet de nauwkeurigheid van het getrainde model. Transformatie toepassen
Gegevens toewijzen aan clusters
Model kruislings valideren
Model evalueren
Afbeeldingsmodel scoren
ScoreModel
Python-taal Schrijf code en sluit deze in een onderdeel in om Python te integreren met uw pijplijn. Python-model maken
Python-script uitvoeren
R-taal Schrijf code en sluit deze in een onderdeel in om R te integreren met uw pijplijn. R-script uitvoeren
Text Analytics Bieden gespecialiseerde rekenkundige hulpprogramma's voor het werken met zowel gestructureerde als ongestructureerde tekst. Word converteren naar vector
N Gram-functies extraheren uit tekst
Functie-hashing
Tekst vooraf verwerken
Latent Dirichlet-toewijzing
Score Vowpal Wabbit Model
Vowpal Wabbit-model trainen
Computer Vision Onderdelen voor verwerking van afbeeldingsgegevens en herkenning van installatiekopieën. Afbeeldingstransformatie toepassen
Converteren naar afbeeldingsmap
Init-afbeeldingstransformatie
Map met gesplitste installatiekopieën
DenseNet
ResNet
Aanbeveling Aanbevelingsmodellen bouwen. Aanbevelingsfunctie evalueren
SVD-aanbevelingsfunctie scoren
Score Wide and Deep Recommender
SVD-aanbevelingsfunctie trainen
Wide and Deep Recommender trainen
Anomaly Detection Modellen voor anomaliedetectie bouwen. Anomaliedetectie op basis van PCA
Anomaliedetectiemodel trainen

Webservice

Meer informatie over de webserviceonderdelen, die nodig zijn voor realtime deductie in Azure Machine Learning Designer.

Foutberichten

Meer informatie over de foutberichten en uitzonderingscodes die u kunt tegenkomen met behulp van onderdelen in Azure Machine Learning Designer.

Onderdelenomgeving

Alle ingebouwde onderdelen van de ontwerpfunctie worden uitgevoerd in een vaste omgeving die wordt geleverd door Microsoft.

Voorheen was deze omgeving gebaseerd op Python 3.6 en is nu bijgewerkt naar Python 3.8. Deze upgrade is transparant aangezien de onderdelen automatisch worden uitgevoerd in de Python 3.8-omgeving en er geen actie van de gebruiker wordt vereist. De omgevingsupdate kan van invloed zijn op de uitvoer van onderdelen en het implementeren van realtime-eindpunten vanuit een realtime deductie. Zie de volgende secties voor meer informatie.

Uitvoer van onderdelen verschilt van eerdere resultaten

Nadat de Python-versie is bijgewerkt van 3.6 naar 3.8, kunnen de afhankelijkheden van ingebouwde onderdelen ook dienovereenkomstig worden bijgewerkt. Daarom kunnen sommige onderdelenuitvoer afwijken van eerdere resultaten.

Als u het onderdeel Python-script uitvoeren gebruikt en eerder pakketten hebt geïnstalleerd die zijn gekoppeld aan Python 3.6, kunnen er fouten optreden zoals:

  • "Kan geen versie vinden die voldoet aan de vereiste."
  • 'Geen overeenkomende distributie gevonden'. Vervolgens moet u de pakketversie opgeven die is aangepast aan Python 3.8 en uw pijplijn opnieuw uitvoeren.

Probleem met realtime deductiepijplijn implementeren vanuit realtime-deductiepijplijn

Als u een realtime-eindpunt rechtstreeks implementeert vanuit een vorige voltooide realtime deductiepijplijn, kan dit fouten veroorzaken.

Aanbeveling: kloon de deductiepijplijn en verzend deze opnieuw en implementeer deze vervolgens in realtime-eindpunt.

Volgende stappen