Informazioni di riferimento sui dati di Azure Machine Learning per il monitoraggio

Informazioni sui dati e sulle risorse raccolti dai Monitoraggio di Azure dall'area Azure Machine Learning lavoro. Vedere Monitoraggio Azure Machine Learning per informazioni dettagliate sulla raccolta e sull'analisi dei dati di monitoraggio.

Metriche

Questa sezione elenca tutte le metriche della piattaforma raccolte automaticamente per Azure Machine Learning. Il provider di risorse per queste metriche è Microsoft.MachineLearningServices/workspaces.

Modello

Metrica Unità Descrizione
Model Register Succeeded (Registrazione di modelli riuscita) Conteggio Numero di registrazioni del modello riuscite in questa area di lavoro
Model Register Failed (Registrazione di modelli non riuscita) Conteggio Numero di registrazioni del modello non riuscite in questa area di lavoro
Model Deploy Started (Distribuzione di modelli avviata) Conteggio Numero di distribuzioni di modelli avviate in questa area di lavoro
Model Deploy Succeeded (Distribuzione di modelli riuscita) Conteggio Numero di distribuzioni di modelli riuscite in questa area di lavoro
Model Deploy Failed (Distribuzione di modelli non riuscita) Conteggio Numero di distribuzioni di modelli non riuscite in questa area di lavoro

Quota

Le informazioni sulla quota sono solo Azure Machine Learning calcolo.

Metrica Unità Descrizione
Totale nodi Conteggio Numero di nodi totali. Questo totale include alcuni nodi attivi, nodi inattivi, nodi inutilizzabili, nodi preempted, nodi in uscita
Active Nodes (Nodi attivi) Conteggio Numero di nodi attivi. Nodi che eseguono attivamente un processo.
Idle Nodes (Nodi inattivi) Conteggio Numero di nodi inattivi. I nodi inattivi sono i nodi che non eseguono processi, ma possono accettare un nuovo processo, se disponibile.
Unusable Nodes (Nodi non utilizzabili) Conteggio Numero di nodi inutilizzabili. I nodi inutilizzabili non sono funzionali a causa di un problema non risolvibile. Azure riciclerà questi nodi.
Preempted Nodes (Nodi superati) Conteggio Numero di nodi preempted. Questi nodi sono i nodi con priorità bassa che vengono prelevati dal pool di nodi disponibile.
Leaving Nodes (Nodi di uscita) Conteggio Numero di nodi in uscita. I nodi in uscita sono i nodi che hanno appena terminato l'elaborazione di un processo e passano allo stato Inattivo.
Core totali Conteggio Numero di core totali
Active Cores (Core attivi) Conteggio Numero di core attivi
Idle Cores (Core inattivi) Conteggio Numero di core inattivi
Unusable Cores (Core non utilizzabili) Conteggio Numero di core inutilizzabili
Preempted Cores (Core superati) Conteggio Numero di core preempted
Leaving Cores (Core di uscita) Conteggio Numero di core in uscita
Quota Utilization Percentage (Percentuale di utilizzo quota) Conteggio Percentuale di quota utilizzata

Risorsa

Metrica Unità Descrizione
CpuUtilization Conteggio Percentuale di utilizzo in un nodo CPU. L'utilizzo viene segnalato a intervalli di un minuto.
GpuUtilization Conteggio Percentuale di utilizzo in un nodo GPU. L'utilizzo viene segnalato a intervalli di un minuto.
GpuMemoryUtilization Conteggio Percentuale di utilizzo della memoria in un nodo GPU. L'utilizzo viene segnalato a intervalli di un minuto.
GpuEnergyJoules Conteggio Intervallo di energia in Joules in un nodo GPU. L'energia viene segnalata a intervalli di un minuto.

Esegui

Informazioni sulle esecuzioni di training per l'area di lavoro.

Metrica Unità Descrizione
Esecuzioni annullate Conteggio Numero di esecuzioni annullate per questa area di lavoro. Il conteggio viene aggiornato quando un'esecuzione viene annullata correttamente.
Annullare le esecuzioni richieste Conteggio Numero di esecuzioni in cui è stato richiesto l'annullamento per questa area di lavoro. Il conteggio viene aggiornato quando è stata ricevuta una richiesta di annullamento per un'esecuzione.
Esecuzioni completate Conteggio Numero di esecuzioni completate correttamente per questa area di lavoro. Il conteggio viene aggiornato quando un'esecuzione è stata completata e l'output è stato raccolto.
Esecuzioni non riuscite Conteggio Numero di esecuzioni non riuscite per questa area di lavoro. Il conteggio viene aggiornato quando un'esecuzione ha esito negativo.
Finalizzazione delle esecuzioni Conteggio Numero di esecuzioni immesse nello stato di finalizzazione per questa area di lavoro. Il conteggio viene aggiornato al completamento di un'esecuzione, ma la raccolta di output è ancora in corso.
Esecuzioni non risponde Conteggio Numero di esecuzioni che non rispondono per questa area di lavoro. Il conteggio viene aggiornato quando un'esecuzione entra nello stato Non risponde.
Esecuzioni non avviate Conteggio Numero di esecuzioni nello stato Non avviato per questa area di lavoro. Il conteggio viene aggiornato quando viene ricevuta una richiesta di creazione di un'esecuzione, ma le informazioni sull'esecuzione non sono ancora state popolate.
Preparazione delle esecuzioni Conteggio Numero di esecuzioni in preparazione per questa area di lavoro. Il conteggio viene aggiornato quando un'esecuzione entra nello stato Preparazione durante la preparazione dell'ambiente di esecuzione.
Esecuzioni del provisioning Conteggio Numero di esecuzioni di cui viene eseguito il provisioning per questa area di lavoro. Il conteggio viene aggiornato quando un'esecuzione è in attesa della creazione o del provisioning della destinazione di calcolo.
Esecuzioni in coda Conteggio Numero di esecuzioni accodati per questa area di lavoro. Il conteggio viene aggiornato quando un'esecuzione viene accodata nella destinazione di calcolo. Può verificarsi quando si attende che i nodi di calcolo necessari siano pronti.
Esecuzioni avviate Conteggio Numero di esecuzioni in esecuzione per questa area di lavoro. Il conteggio viene aggiornato all'avvio dell'esecuzione sulle risorse necessarie.
Avvio di esecuzioni Conteggio Numero di esecuzioni avviate per questa area di lavoro. Il conteggio viene aggiornato dopo che è stata popolata la richiesta di creazione di informazioni di esecuzione ed esecuzione, ad esempio l'ID esecuzione
Errors Conteggio Numero di errori di esecuzione in questa area di lavoro. Il conteggio viene aggiornato ogni volta che l'esecuzione rileva un errore.
Avvisi Conteggio Numero di avvisi di esecuzione in questa area di lavoro. Il conteggio viene aggiornato ogni volta che un'esecuzione rileva un avviso.

Dimensioni delle metriche

Per altre informazioni sulle dimensioni delle metriche, vedere Metriche multidimensionali.

Azure Machine Learning le dimensioni seguenti sono associate alle metriche.

Dimensione Descrizione
Cluster Name Nome della risorsa cluster di calcolo. Disponibile per tutte le metriche di quota.
Nome della famiglia di macchine virtuali Nome della famiglia di macchine virtuali usata dal cluster. Disponibile per la percentuale di utilizzo della quota.
Priorità macchina virtuale Priorità della macchina virtuale. Disponibile per la percentuale di utilizzo della quota.
CreatedTime Disponibile solo per CpuUtilization e GpuUtilization.
DeviceId ID del dispositivo (GPU). Disponibile solo per GpuUtilization.
NodeId ID del nodo creato in cui è in esecuzione il processo. Disponibile solo per CpuUtilization e GpuUtilization.
RunId ID dell'esecuzione/processo. Disponibile solo per CpuUtilization e GpuUtilization.
ComputeType Tipo di calcolo usato dall'esecuzione. Disponibile solo per le esecuzioni completate, le esecuzioni non riuscite e le esecuzioni avviate.
PipelineStepType Tipo di PipelineStep usato nell'esecuzione. Disponibile solo per le esecuzioni completate, le esecuzioni non riuscite e le esecuzioni avviate.
PublishedPipelineId ID della pipeline pubblicata usata nell'esecuzione. Disponibile solo per le esecuzioni completate, le esecuzioni non riuscite e le esecuzioni avviate.
RunType Tipo di esecuzione. Disponibile solo per le esecuzioni completate, le esecuzioni non riuscite e le esecuzioni avviate.

I valori validi per la dimensione RunType sono:

Valore Descrizione
Esperimento Esecuzioni non pipeline.
PipelineRun Un'esecuzione della pipeline, che è l'elemento padre di un oggetto StepRun.
StepRun Esecuzione per un passaggio della pipeline.
ReusedStepRun Esecuzione per un passaggio della pipeline che riutilizza un'esecuzione precedente.

Log attività

Nella tabella seguente sono elencate le operazioni Azure Machine Learning che possono essere create nel log attività.

Operazione Descrizione
Crea o aggiorna un'area Machine Learning lavoro È stata creata o aggiornata un'area di lavoro
CheckComputeNameAvailability Controllare se un nome di calcolo è già in uso
Crea o aggiorna le risorse di calcolo Una risorsa di calcolo è stata creata o aggiornata
Elimina le risorse di calcolo Una risorsa di calcolo è stata eliminata
List secrets Nell'operazione sono elencati i segreti per un'Machine Learning di lavoro

Log risorse

Questa sezione elenca i tipi di log delle risorse che è possibile raccogliere per l Azure Machine Learning workspace.

Provider di risorse e tipo: Microsoft.MachineLearningServices/workspace.

Category Nome visualizzato
AmlComputeClusterEvent AmlComputeClusterEvent
AmlComputeClusterNodeEvent AmlComputeClusterNodeEvent
AmlComputeCpuGpuUtilization AmlComputeCpuGpuUtilization
AmlComputeJobEvent AmlComputeJobEvent
AmlRunStatusChangedEvent AmlRunStatusChangedEvent
ModelsChangeEvent ModelsChangeEvent
ModelsReadEvent ModelsReadEvent
ModelsActionEvent ModelsActionEvent
DeploymentReadEvent DeploymentReadEvent
DeploymentEventACI DeploymentEventACI
DeploymentEventAKS DeploymentEventAKS
Inferenza diOperationAKS Inferenza diOperationAKS
InferencingOperationACI InferencingOperationACI
EnvironmentChangeEvent EnvironmentChangeEvent
EnvironmentReadEvent EnvironmentReadEvent
DataLabelChangeEvent DataLabelChangeEvent
DataLabelReadEvent DataLabelReadEvent
ComputeInstanceEvent ComputeInstanceEvent
DataStoreChangeEvent DataStoreChangeEvent
DataStoreReadEvent DataStoreReadEvent
DataSetChangeEvent DataSetChangeEvent
DataSetReadEvent DataSetReadEvent
PipelineChangeEvent PipelineChangeEvent
PipelineReadEvent PipelineReadEvent
RunEvent RunEvent
RunReadEvent RunReadEvent

Schemi

Gli schemi seguenti vengono utilizzati da Azure Machine Learning

Tabella AmlComputeJobEvent

Proprietà Descrizione
TimeGenerated Ora in cui è stata generata la voce di log
OperationName Nome dell'operazione associata all'evento del log
Category Nome dell'evento del log, AmlComputeClusterNodeEvent
JobId ID del processo inviato
ExperimentId ID dell'esperimento
ExperimentName Nome dell'esperimento
CustomerSubscriptionId SubscriptionId in cui l'esperimento e il processo vengono inviati
WorkspaceName Nome dell'area di lavoro di Machine Learning
ClusterName Nome del cluster
ProvisioningState Stato dell'invio del processo
ResourceGroupName Nome del gruppo di risorse
JobName Nome del processo
ClusterId ID del cluster
EventType Tipo dell'evento Job. Ad esempio, JobSubmitted, JobRunning, JobFailed, JobSucceeded.
ExecutionState Stato del processo (esecuzione). Ad esempio, Queued, Running, Succeeded, Failed
ErrorDetails Dettagli dell'errore del processo
CreationApiVersion Versione dell'API usata per creare il processo
ClusterResourceGroupName Nome del gruppo di risorse del cluster
TFWorkerCount Conteggio dei worker TF
TFParameterServerCount Conteggio del server dei parametri TF
ToolType Tipo di strumento usato
RunInContainer Flag che descrive se il processo deve essere eseguito all'interno di un contenitore
JobErrorMessage Messaggio dettagliato dell'errore del processo
NodeId ID del nodo creato in cui è in esecuzione il processo

Tabella AmlComputeClusterEvent

Proprietà Descrizione
TimeGenerated Ora in cui è stata generata la voce di log
OperationName Nome dell'operazione associata all'evento del log
Category Nome dell'evento del log, AmlComputeClusterNodeEvent
ProvisioningState Stato del provisioning del cluster
ClusterName Nome del cluster
ClusterType Tipo di cluster
CreatedBy Utente che ha creato il cluster
CoreCount Conteggio dei core nel cluster
VmSize Dimensioni della macchina virtuale del cluster
VmPriority Priorità dei nodi creati all'interno di un cluster Dedicato/LowPriority
ScalingType Tipo di ridimensionamento manuale/automatico del cluster
InitialNodeCount Conteggio iniziale dei nodi del cluster
MinimumNodeCount Numero minimo di nodi del cluster
MaximumNodeCount Numero massimo di nodi del cluster
NodeDeallocationOption Come deallocare il nodo
Publisher Publisher del tipo di cluster
Offerta Offerta con cui viene creato il cluster
Sku SKU del nodo/macchina virtuale creato all'interno del cluster
Versione Versione dell'immagine usata durante la creazione di Node/VM
SubnetId SubnetId del cluster
AllocationState Stato di allocazione del cluster
CurrentNodeCount Numero corrente di nodi del cluster
TargetNodeCount Numero di nodi di destinazione del cluster durante il ridimensionamento verso l'alto/verso il basso
EventType Tipo di evento durante la creazione del cluster.
NodeIdleTimeSecondsBeforeScaleDown Tempo di inattività in secondi prima che il cluster venga ridimensionato
PreemptedNodeCount Numero di nodi preempted del cluster
IsResizeGrow Flag che indica che il cluster sta scalando verso l'alto
VmFamilyName Nome della famiglia di macchine virtuali dei nodi che è possibile creare all'interno del cluster
LeavingNodeCount Lasciando il numero di nodi del cluster
UnusableNodeCount Numero di nodi inutilizzabili del cluster
IdleNodeCount Numero di nodi inattivi del cluster
RunningNodeCount Numero di nodi in esecuzione del cluster
PreparingNodeCount Preparazione del numero di nodi del cluster
QuotaAllocated Quota allocata al cluster
QuotaUtilized Quota utilizzata del cluster
AllocationStateTransitionTime Tempo di transizione da uno stato a un altro
ClusterErrorCodes Codice di errore ricevuto durante la creazione o il ridimensionamento del cluster
CreationApiVersion Versione API usata durante la creazione del cluster

Tabella AmlComputeClusterNodeEvent

Proprietà Descrizione
TimeGenerated Ora di generazione della voce di log
OperationName Nome dell'operazione associata all'evento di log
Category Nome dell'evento di log, AmlComputeClusterNodeEvent
ClusterName Nome del cluster
NodeId ID del nodo del cluster creato
VmSize Dimensioni della macchina virtuale del nodo
VmFamilyName Famiglia di macchine virtuali a cui appartiene il nodo
VmPriority Priorità del nodo creato dedicated/lowPriority
Publisher Publisher dell'immagine della macchina virtuale. Ad esempio, microsoft-dsvm
Offerta Offerta associata alla creazione della macchina virtuale
Sku SKU del nodo o della macchina virtuale creata
Versione Versione dell'immagine usata durante la creazione del nodo o della macchina virtuale
ClusterCreationTime Ora di creazione del cluster
ResizeStartTime Ora di avvio della scalabilità verticale/verticale del cluster
ResizeEndTime Ora di fine della scalabilità verticale/verticale del cluster
NodeAllocationTime Ora di allocazione del nodo
NodeBootTime Ora di avvio del nodo
StartTaskStartTime Ora di assegnazione e avvio dell'attività a un nodo
StartTaskEndTime Ora di fine dell'attività assegnata a un nodo
TotalE2ETimeInSeconds Tempo totale di attività del nodo

Tabella AmlComputeInstanceEvent

Proprietà Descrizione
Type Nome dell'evento di log, AmlComputeInstanceEvent
TimeGenerated Ora (UTC) in cui è stata generata la voce di log
Level Il livello di gravità dell'evento. Deve essere di tipo Informativo, Avviso, Errore o Critico.
ResultType Lo stato dell'evento. I valori tipici includono: Started, In Progress, Succeeded, Failed, Active e Resolved.
CorrelationId GUID utilizzato per raggruppare un set di eventi correlati, se applicabile.
OperationName Nome dell'operazione associata alla voce di log
Identità Identità dell'utente o dell'applicazione che ha eseguito l'operazione.
AadTenantId ID AAD tenant per cui è stata inviata l'operazione.
AmlComputeInstanceName "Nome dell'istanza di calcolo associata alla voce di log.

Tabella AmlDataLabelEvent

Proprietà Descrizione
Type Nome dell'evento di log, AmlDataLabelEvent
TimeGenerated Ora (UTC) in cui è stata generata la voce di log
Level Il livello di gravità dell'evento. Deve essere di tipo Informativo, Avviso, Errore o Critico.
ResultType Lo stato dell'evento. I valori tipici includono: Started, In Progress, Succeeded, Failed, Active e Resolved.
CorrelationId GUID utilizzato per raggruppare un set di eventi correlati, se applicabile.
OperationName Nome dell'operazione associata alla voce di log
Identità Identità dell'utente o dell'applicazione che ha eseguito l'operazione.
AadTenantId ID AAD tenant per cui è stata inviata l'operazione.
AmlProjectId Identificatore univoco del AML progetto.
AmlProjectName Nome del progetto AML progetto.
AmlLabelNames Nomi delle classi dell'etichetta creati per il progetto.
AmlDataStoreName Nome dell'archivio dati in cui sono archiviati i dati del progetto.

Tabella AmlDataSetEvent

Proprietà Descrizione
Type Nome dell'evento di log, AmlDataSetEvent
TimeGenerated Ora (UTC) in cui è stata generata la voce di log
Level Il livello di gravità dell'evento. Deve essere di tipo Informativo, Avviso, Errore o Critico.
ResultType Lo stato dell'evento. I valori tipici includono: Started, In Progress, Succeeded, Failed, Active e Resolved.
AmlWorkspaceId GUID e ID univoco dell'area AML lavoro.
OperationName Nome dell'operazione associata alla voce di log
Identità Identità dell'utente o dell'applicazione che ha eseguito l'operazione.
AadTenantId ID AAD tenant per cui è stata inviata l'operazione.
AmlDatasetId ID del set AML dati.
AmlDatasetName Nome del set AML dati.

Tabella AmlDataStoreEvent

Proprietà Descrizione
Type Nome dell'evento di log, AmlDataStoreEvent
TimeGenerated Ora (UTC) in cui è stata generata la voce di log
Level Il livello di gravità dell'evento. Deve essere di tipo Informativo, Avviso, Errore o Critico.
ResultType Lo stato dell'evento. I valori tipici includono: Started, In Progress, Succeeded, Failed, Active e Resolved.
AmlWorkspaceId GUID e ID univoco dell'area AML lavoro.
OperationName Nome dell'operazione associata alla voce di log
Identità Identità dell'utente o dell'applicazione che ha eseguito l'operazione.
AadTenantId ID AAD tenant per cui è stata inviata l'operazione.
AmlDatastoreName Nome dell'AML dati.

Tabella AmlDeploymentEvent

Proprietà Descrizione
Type Nome dell'evento di log, AmlDeploymentEvent
TimeGenerated Ora (UTC) in cui è stata generata la voce di log
Level Il livello di gravità dell'evento. Deve essere di tipo Informativo, Avviso, Errore o Critico.
ResultType Lo stato dell'evento. I valori tipici includono: Started, In Progress, Succeeded, Failed, Active e Resolved.
OperationName Nome dell'operazione associata alla voce di log
Identità Identità dell'utente o dell'applicazione che ha eseguito l'operazione.
AadTenantId ID AAD tenant per cui è stata inviata l'operazione.
AmlServiceName Nome del servizio AML servizio.

Tabella AmlInferencingEvent

Proprietà Descrizione
Type Nome dell'evento di log, AmlInferencingEvent
TimeGenerated Ora (UTC) in cui è stata generata la voce di log
Level Il livello di gravità dell'evento. Deve essere di tipo Informativo, Avviso, Errore o Critico.
ResultType Lo stato dell'evento. I valori tipici includono: Started, In Progress, Succeeded, Failed, Active e Resolved.
OperationName Nome dell'operazione associata alla voce di log
Identità Identità dell'utente o dell'applicazione che ha eseguito l'operazione.
AadTenantId ID AAD tenant per cui è stata inviata l'operazione.
AmlServiceName Nome del servizio AML servizio.

Tabella AmlModelsEvent

Proprietà Descrizione
Type Nome dell'evento del log, AmlModelsEvent
TimeGenerated Ora (UTC) in cui è stata generata la voce di log
Level Il livello di gravità dell'evento. Deve essere di tipo Informativo, Avviso, Errore o Critico.
ResultType Lo stato dell'evento. I valori tipici includono: Started, In Progress, Succeeded, Failed, Active e Resolved.
OperationName Nome dell'operazione associata alla voce di log
Identità Identità dell'utente o dell'applicazione che ha eseguito l'operazione.
AadTenantId ID AAD tenant per cui è stata inviata l'operazione.
ResultSignature Codice di stato HTTP dell'evento. I valori tipici includono 200, 201, 202 e così via.
AmlModelName Nome del modello AML.

Tabella AmlPipelineEvent

Proprietà Descrizione
Type Nome dell'evento del log, AmlPipelineEvent
TimeGenerated Ora (UTC) in cui è stata generata la voce di log
Level Il livello di gravità dell'evento. Deve essere di tipo Informativo, Avviso, Errore o Critico.
ResultType Lo stato dell'evento. I valori tipici includono: Started, In Progress, Succeeded, Failed, Active e Resolved.
AmlWorkspaceId GUID e ID univoco dell'area AML lavoro.
AmlWorkspaceId Nome dell'area AML lavoro.
OperationName Nome dell'operazione associata alla voce di log
Identità Identità dell'utente o dell'applicazione che ha eseguito l'operazione.
AadTenantId ID AAD tenant per cui è stata inviata l'operazione.
AmlModuleId GUID e ID univoco del modulo.
AmlModelName Nome del modello AML.
AmlPipelineId ID della pipeline AML.
AmlParentPipelineId ID della pipeline di AML padre (in caso di clonazione).
AmlPipelineDraftId ID della bozza AML pipeline.
AmlPipelineDraftName Nome della bozza AML pipeline.
AmlPipelineEndpointId ID dell'endpoint AML pipeline.
AmlPipelineEndpointName Nome dell'endpoint AML pipeline.

Tabella AmlRunEvent

Proprietà Descrizione
Type Nome dell'evento di log, AmlRunEvent
TimeGenerated Ora (UTC) in cui è stata generata la voce di log
Level Il livello di gravità dell'evento. Deve essere di tipo Informativo, Avviso, Errore o Critico.
ResultType Lo stato dell'evento. I valori tipici includono: Started, In Progress, Succeeded, Failed, Active e Resolved.
OperationName Nome dell'operazione associata alla voce di log
AmlWorkspaceId GUID e ID univoco dell'area AML lavoro.
Identità Identità dell'utente o dell'applicazione che ha eseguito l'operazione.
AadTenantId ID AAD tenant per cui è stata inviata l'operazione.
RunId ID univoco dell'elaborazione.

Tabella AmlEnvironmentEvent

Proprietà Descrizione
Type Nome dell'evento di log, AmlEnvironmentEvent
TimeGenerated Ora (UTC) in cui è stata generata la voce di log
Level Il livello di gravità dell'evento. Deve essere di tipo Informativo, Avviso, Errore o Critico.
OperationName Nome dell'operazione associata alla voce di log
Identità Identità dell'utente o dell'applicazione che ha eseguito l'operazione.
AadTenantId ID AAD tenant per cui è stata inviata l'operazione.
AmlEnvironmentName Nome della configurazione AML'ambiente.
AmlEnvironmentVersion Nome della versione AML configurazione dell'ambiente.

Vedi anche