Informazioni di riferimento sugli algoritmi e sui componenti per la finestra di progettazione di Azure Machine Learning

SI APPLICA A: Python SDK azure-ai-ml v2 (corrente)

Nota

Progettazione supporta due tipi di componenti, componenti predefiniti classici e componenti personalizzati. Questi due tipi di componenti non sono compatibili.

I componenti predefiniti classici forniscono componenti predefiniti principalmente per l'elaborazione dei dati e le attività tradizionali di Machine Learning, come la regressione e la classificazione. Questo tipo di componente continua a essere supportato, ma non avrà nuove aggiunte future.

I componenti personalizzati consentono di fornire codice personalizzato come componente. Supporta la condivisione tra aree di lavoro e la creazione semplice tra interfacce di Studio, interfaccia della riga di comando e SDK.

Questo articolo si applica ai componenti predefiniti classici.

Questo contenuto di riferimento fornisce informazioni tecniche su ognuno dei componenti predefiniti classici disponibili nella finestra di progettazione di Azure Machine Learning.

Ogni componente rappresenta un set di codice che può essere eseguito in modo indipendente ed eseguire un'attività di Machine Learning, in base agli input necessari. Un componente può contenere un particolare algoritmo o eseguire un'attività importante in Machine Learning, ad esempio la sostituzione di valori mancanti o l'analisi statistica.

Per assistenza nella scelta degli algoritmi, vedere:

Suggerimento

In qualsiasi pipeline della finestra di progettazione è possibile ottenere informazioni su un componente specifico. Selezionare il collegamento Altre informazioni nella scheda componente quando si passa il puntatore del mouse sul componente nell'elenco dei componenti o nel riquadro destro del componente.

Componenti di preparazione dei dati

Funzionalità Descrizione component
Dati di input e di output Spostano i dati da origini cloud nella pipeline. Scrivere i risultati o i dati intermedi in Archiviazione di Azure o database SQL durante l'esecuzione di una pipeline o usare l'archiviazione cloud per scambiare dati tra pipeline. Enter Data Manually (Immissione manuale dei dati)
Esportazione dei dati
Importazione dei dati
Trasformazioni dei dati Operazioni su dati specifici per l'apprendimento automatico, ad esempio la normalizzazione o il binning dei dati, la riduzione della dimensionalità e la conversione dei dati tra vari formati di file. Aggiungi colonne
Add Rows (Aggiungi righe)
Apply Math Operation (Applica operazione matematica)
Apply SQL Transformation (Applica trasformazione SQL)
Clean Missing Data (Pulisci dati mancanti)
Clip Values (Ritaglia valori)
Convert to CSV (Converti in CSV)
Convert to Dataset (Converti in set di dati)
Convert to Indicator Values (Converti in valori indicatore)
Edit Metadata (Modifica metadati)
Group Data into Bins (Raggruppa dati in contenitori)
Join Data (Unisci dati)
Normalize Data (Normalizza dati)
Partition and Sample (Crea partizioni ed esegui campionamenti)
Remove Duplicate Rows (Rimuovi righe duplicate)
SMOTE
Select Columns Transform (Seleziona trasformazione colonne)
Select Columns in Dataset (Seleziona colonne nel set di dati)
Dividere dati
Selezione funzionalità Selezionare un subset di funzionalità pertinenti e utili da usare per creare un modello analitico. Filter Based Feature Selection (Selezione caratteristiche basata su filtro)
Permutation Feature Importance (Importanza caratteristica permutazione)
Funzioni di statistiche Offrono un'ampia gamma di metodi statistici correlati al data science. Summarize Data (Riepiloga dati)

Algoritmi di apprendimento automatico

Funzionalità Descrizione component
Regressione Prevede un valore. Boosted Decision Tree Regression (Regressione albero delle decisioni con boosting)
Decision Forest Regression (Regressione foresta delle decisioni)
Regressione quantile della foresta veloce
Linear Regression (Regressione lineare)
Neural Network Regression (Regressione rete neurale)
Regressione poisson
Clustering Raggruppa i dati. Clustering K-Means
Classificazione Prevedono una classe. Scegliere tra algoritmi binari (a due classi) o multiclasse. Albero delle decisioni incrementato a più classi
Foresta delle decisioni multiclasse
Regressione logistica multiclasse
Rete neurale multiclasse
Una e tutte le multiclassi
Uno e uno multiclasse
Percettrone medio a due classi
Albero delle decisioni incrementato a due classi
Foresta delle decisioni a due classi
Regressione logistica a due classi
Rete neurale a due classi
Two Class Support Vector Machine (Macchina a vettori di supporto a due classi)

Componenti per la compilazione e la valutazione di modelli

Funzionalità Descrizione component
Training del modello Eseguono i dati tramite l'algoritmo. Train Clustering Model (Training del modello di clustering)
Eseguire il training del modello
Eseguire il training del modello Pytorch
Tune Model Hyperparameters (Ottimizza iperparametri del modello)
Valutazione e assegnazione di punteggi al modello Misurano l'accuratezza del modello sottoposto a training. Applica trasformazione
Assign Data to Clusters (Assegna dati ai cluster)
Cross Validate Model (Convalida incrociata modello)
Evaluate Model (Valuta modello)
Score Image Model
Score Model (Punteggio modello)
Linguaggio di Python Scrivere codice e incorporarlo in un componente per integrare Python con la pipeline. Create Python Model (Crea modello Python)
Execute Python Script (Esegui script Python)
Linguaggio di R Scrivere codice e incorporarlo in un componente per integrare R con la pipeline. Execute R Script (Esegui script R)
Analisi del testo Forniscono strumenti di calcolo specializzati per usare testo strutturato e non strutturato. Convert Word to Vector (Converti parola in vettore)
Extract N Gram Features from Text (Estrai caratteristiche n-gramma da testo)
Hashing di funzioni
Preprocess Text (Preelabora il testo)
Latent Dirichlet Allocation (Allocazione Dirichlet latente)
Score Vowpal Wabbit Model
Eseguire il training del modello Vowpal Wabbit
Visione artificiale Pre-elaborazione dei dati delle immagini e componenti correlati al riconoscimento delle immagini. Applica trasformazione immagine
Converti in directory di immagini
Trasformazione Immagine Init
Split Image Directory
DenseNet
ResNet
Elemento consigliato Creano modelli di raccomandazione. Evaluate Recommender (Valuta modelo di raccomandazione)
Score SVD Recommender (Punteggio modulo di raccomandazione SVD)
Punteggio wide e deep recommender
Train SVD Recommender (Training modulo di raccomandazione SVD)
Train Wide and Deep Recommender
Rilevamento di anomalie Creano modelli di rilevamento delle anomalie. PCA-Based Anomaly Detection (Rilevamento anomalie basato su PCA)
Train Anomaly Detection Model (Training modello di rilevamento anomalie)

Servizio Web

Informazioni sui componenti del servizio Web necessari per l'inferenza in tempo reale nella finestra di progettazione di Azure Machine Learning.

Messaggi di errore

Informazioni sui messaggi di errore e sui codici di eccezione che possono verificarsi usando i componenti nella finestra di progettazione di Azure Machine Learning.

Ambiente componenti

Tutti i componenti predefiniti della finestra di progettazione verranno eseguiti in un ambiente fisso fornito da Microsoft.

In precedenza questo ambiente era basato su Python 3.6 e ora è stato aggiornato a Python 3.8. Questo aggiornamento è trasparente, in quanto i componenti verranno eseguiti automaticamente nell'ambiente Python 3.8 senza alcun intervento dell'utente. L'aggiornamento dell'ambiente può influire sugli output dei componenti e sulla distribuzione di endpoint in tempo reale da un'inferenza in tempo reale, vedere le sezioni seguenti per altre informazioni.

Gli output dei componenti sono diversi dai risultati precedenti

Dopo l'aggiornamento della versione di Python dalla versione 3.6 alla versione 3.8, le dipendenze dei componenti predefiniti possono essere aggiornate di conseguenza. Di conseguenza, è possibile che alcuni output dei componenti siano diversi dai risultati precedenti.

Se si usa il componente Execute Python Script e si dispone di pacchetti precedentemente installati associati a Python 3.6, è possibile che si verifichino errori come:

  • "Impossibile trovare una versione che soddisfi il requisito".
  • "Nessuna distribuzione corrispondente trovata". Sarà quindi necessario specificare la versione del pacchetto adattata a Python 3.8 ed eseguire di nuovo la pipeline.

Distribuire un endpoint in tempo reale da un problema di pipeline di inferenza in tempo reale

Se si distribuisce direttamente l'endpoint in tempo reale da una pipeline di inferenza in tempo reale completata precedente, potrebbero verificarsi errori.

Raccomandazione: clonare la pipeline di inferenza e inviarla di nuovo, quindi eseguire la distribuzione nell'endpoint in tempo reale.

Passaggi successivi