Informazioni di riferimento sugli algoritmi e sui componenti per la finestra di progettazione di Azure Machine Learning

Articolo
01/10/2024

SI APPLICA A: Python SDK azure-ai-ml v2 (corrente)

Nota

Progettazione supporta due tipi di componenti, componenti predefiniti classici e componenti personalizzati. Questi due tipi di componenti non sono compatibili.

I componenti predefiniti classici forniscono componenti predefiniti principalmente per l'elaborazione dei dati e le attività tradizionali di Machine Learning, come la regressione e la classificazione. Questo tipo di componente continua a essere supportato, ma non avrà nuove aggiunte future.

I componenti personalizzati consentono di fornire codice personalizzato come componente. Supporta la condivisione tra aree di lavoro e la creazione semplice tra interfacce di Studio, interfaccia della riga di comando e SDK.

Questo articolo si applica ai componenti predefiniti classici.

Questo contenuto di riferimento fornisce informazioni tecniche su ognuno dei componenti predefiniti classici disponibili nella finestra di progettazione di Azure Machine Learning.

Ogni componente rappresenta un set di codice che può essere eseguito in modo indipendente ed eseguire un'attività di Machine Learning, in base agli input necessari. Un componente può contenere un particolare algoritmo o eseguire un'attività importante in Machine Learning, ad esempio la sostituzione di valori mancanti o l'analisi statistica.

Per assistenza nella scelta degli algoritmi, vedere:

Suggerimento

In qualsiasi pipeline della finestra di progettazione è possibile ottenere informazioni su un componente specifico. Selezionare il collegamento Altre informazioni nella scheda componente quando si passa il puntatore del mouse sul componente nell'elenco dei componenti o nel riquadro destro del componente.

Componenti di preparazione dei dati

Funzionalità	Descrizione	component
Dati di input e di output	Spostano i dati da origini cloud nella pipeline. Scrivere i risultati o i dati intermedi in Archiviazione di Azure o database SQL durante l'esecuzione di una pipeline o usare l'archiviazione cloud per scambiare dati tra pipeline.	Enter Data Manually (Immissione manuale dei dati) Esportazione dei dati Importazione dei dati
Trasformazioni dei dati	Operazioni su dati specifici per l'apprendimento automatico, ad esempio la normalizzazione o il binning dei dati, la riduzione della dimensionalità e la conversione dei dati tra vari formati di file.	Aggiungi colonne Add Rows (Aggiungi righe) Apply Math Operation (Applica operazione matematica) Apply SQL Transformation (Applica trasformazione SQL) Clean Missing Data (Pulisci dati mancanti) Clip Values (Ritaglia valori) Convert to CSV (Converti in CSV) Convert to Dataset (Converti in set di dati) Convert to Indicator Values (Converti in valori indicatore) Edit Metadata (Modifica metadati) Group Data into Bins (Raggruppa dati in contenitori) Join Data (Unisci dati) Normalize Data (Normalizza dati) Partition and Sample (Crea partizioni ed esegui campionamenti) Remove Duplicate Rows (Rimuovi righe duplicate) SMOTE Select Columns Transform (Seleziona trasformazione colonne) Select Columns in Dataset (Seleziona colonne nel set di dati) Dividere dati
Selezione funzionalità	Selezionare un subset di funzionalità pertinenti e utili da usare per creare un modello analitico.	Filter Based Feature Selection (Selezione caratteristiche basata su filtro) Permutation Feature Importance (Importanza caratteristica permutazione)
Funzioni di statistiche	Offrono un'ampia gamma di metodi statistici correlati al data science.	Summarize Data (Riepiloga dati)

Algoritmi di apprendimento automatico

Funzionalità	Descrizione	component
Regressione	Prevede un valore.	Boosted Decision Tree Regression (Regressione albero delle decisioni con boosting) Decision Forest Regression (Regressione foresta delle decisioni) Regressione quantile della foresta veloce Linear Regression (Regressione lineare) Neural Network Regression (Regressione rete neurale) Regressione poisson
Clustering	Raggruppa i dati.	Clustering K-Means
Classificazione	Prevedono una classe. Scegliere tra algoritmi binari (a due classi) o multiclasse.	Albero delle decisioni incrementato a più classi Foresta delle decisioni multiclasse Regressione logistica multiclasse Rete neurale multiclasse Una e tutte le multiclassi Uno e uno multiclasse Percettrone medio a due classi Albero delle decisioni incrementato a due classi Foresta delle decisioni a due classi Regressione logistica a due classi Rete neurale a due classi Two Class Support Vector Machine (Macchina a vettori di supporto a due classi)

Componenti per la compilazione e la valutazione di modelli

Funzionalità	Descrizione	component
Training del modello	Eseguono i dati tramite l'algoritmo.	Train Clustering Model (Training del modello di clustering) Eseguire il training del modello Eseguire il training del modello Pytorch Tune Model Hyperparameters (Ottimizza iperparametri del modello)
Valutazione e assegnazione di punteggi al modello	Misurano l'accuratezza del modello sottoposto a training.	Applica trasformazione Assign Data to Clusters (Assegna dati ai cluster) Cross Validate Model (Convalida incrociata modello) Evaluate Model (Valuta modello) Score Image Model Score Model (Punteggio modello)
Linguaggio di Python	Scrivere codice e incorporarlo in un componente per integrare Python con la pipeline.	Create Python Model (Crea modello Python) Execute Python Script (Esegui script Python)
Linguaggio di R	Scrivere codice e incorporarlo in un componente per integrare R con la pipeline.	Execute R Script (Esegui script R)
Analisi del testo	Forniscono strumenti di calcolo specializzati per usare testo strutturato e non strutturato.	Convert Word to Vector (Converti parola in vettore) Extract N Gram Features from Text (Estrai caratteristiche n-gramma da testo) Hashing di funzioni Preprocess Text (Preelabora il testo) Latent Dirichlet Allocation (Allocazione Dirichlet latente) Score Vowpal Wabbit Model Eseguire il training del modello Vowpal Wabbit
Visione artificiale	Pre-elaborazione dei dati delle immagini e componenti correlati al riconoscimento delle immagini.	Applica trasformazione immagine Converti in directory di immagini Trasformazione Immagine Init Split Image Directory DenseNet ResNet
Elemento consigliato	Creano modelli di raccomandazione.	Evaluate Recommender (Valuta modelo di raccomandazione) Score SVD Recommender (Punteggio modulo di raccomandazione SVD) Punteggio wide e deep recommender Train SVD Recommender (Training modulo di raccomandazione SVD) Train Wide and Deep Recommender
Rilevamento di anomalie	Creano modelli di rilevamento delle anomalie.	PCA-Based Anomaly Detection (Rilevamento anomalie basato su PCA) Train Anomaly Detection Model (Training modello di rilevamento anomalie)

Servizio Web

Informazioni sui componenti del servizio Web necessari per l'inferenza in tempo reale nella finestra di progettazione di Azure Machine Learning.

Messaggi di errore

Informazioni sui messaggi di errore e sui codici di eccezione che possono verificarsi usando i componenti nella finestra di progettazione di Azure Machine Learning.

Ambiente componenti

Tutti i componenti predefiniti della finestra di progettazione verranno eseguiti in un ambiente fisso fornito da Microsoft.

In precedenza questo ambiente era basato su Python 3.6 e ora è stato aggiornato a Python 3.8. Questo aggiornamento è trasparente, in quanto i componenti verranno eseguiti automaticamente nell'ambiente Python 3.8 senza alcun intervento dell'utente. L'aggiornamento dell'ambiente può influire sugli output dei componenti e sulla distribuzione di endpoint in tempo reale da un'inferenza in tempo reale, vedere le sezioni seguenti per altre informazioni.

Gli output dei componenti sono diversi dai risultati precedenti

Dopo l'aggiornamento della versione di Python dalla versione 3.6 alla versione 3.8, le dipendenze dei componenti predefiniti possono essere aggiornate di conseguenza. Di conseguenza, è possibile che alcuni output dei componenti siano diversi dai risultati precedenti.

Se si usa il componente Execute Python Script e si dispone di pacchetti precedentemente installati associati a Python 3.6, è possibile che si verifichino errori come:

"Impossibile trovare una versione che soddisfi il requisito".
"Nessuna distribuzione corrispondente trovata". Sarà quindi necessario specificare la versione del pacchetto adattata a Python 3.8 ed eseguire di nuovo la pipeline.

Distribuire un endpoint in tempo reale da un problema di pipeline di inferenza in tempo reale

Se si distribuisce direttamente l'endpoint in tempo reale da una pipeline di inferenza in tempo reale completata precedente, potrebbero verificarsi errori.

Raccomandazione: clonare la pipeline di inferenza e inviarla di nuovo, quindi eseguire la distribuzione nell'endpoint in tempo reale.

Passaggi successivi

Esercitazione: Creare un modello nella finestra di progettazione per stimare i prezzi automatici