Övervaka data referens för Azure Machine LearningMonitoring Azure machine learning data reference
Lär dig mer om de data och resurser som samlats in av Azure Monitor från arbets ytan Azure Machine Learning.Learn about the data and resources collected by Azure Monitor from your Azure Machine Learning workspace. Mer information om hur du samlar in och analyserar övervaknings data finns i övervaknings Azure Machine Learning .See Monitoring Azure Machine Learning for details on collecting and analyzing monitoring data.
MåttMetrics
I det här avsnittet visas alla automatiskt insamlade plattforms mått som samlas in för Azure Machine Learning.This section lists all the automatically collected platform metrics collected for Azure Machine Learning. Resurs leverantören för dessa mått är Microsoft. MachineLearningServices/arbets ytor.The resource provider for these metrics is Microsoft.MachineLearningServices/workspaces.
ModellModel
MetricMetric | EnhetUnit | BeskrivningDescription |
---|---|---|
Modell registreringen har slutförtsModel Register Succeeded | AntalCount | Antal modell registreringar som har slutförts på den här arbets ytanNumber of model registrations that succeeded in this workspace |
Modell registreringen misslyckadesModel Register Failed | AntalCount | Antal modell registreringar som misslyckades på den här arbets ytanNumber of model registrations that failed in this workspace |
Modelldistribution StartadModel Deploy Started | AntalCount | Antal modell distributioner som startats på den här arbets ytanNumber of model deployments started in this workspace |
Modelldistribution lyckadesModel Deploy Succeeded | AntalCount | Antal modell distributioner som har slutförts på den här arbets ytanNumber of model deployments that succeeded in this workspace |
Modelldistribution misslyckadesModel Deploy Failed | AntalCount | Antal modell distributioner som misslyckades på den här arbets ytanNumber of model deployments that failed in this workspace |
KvotQuota
Kvot information gäller endast för Azure Machine Learning beräkning.Quota information is for Azure Machine Learning compute only.
MetricMetric | EnhetUnit | BeskrivningDescription |
---|---|---|
Totalt antal noderTotal Nodes | AntalCount | Totalt antal noder.Number of total nodes. Den här summan innehåller några aktiva noder, inaktiva noder, oanvändbara noder, vilande noder, lämnar noderThis total includes some of Active Nodes, Idle Nodes, Unusable Nodes, Preempted Nodes, Leaving Nodes |
Aktiva noderActive Nodes | AntalCount | Antal aktiva noder.Number of Active nodes. De noder som aktivt kör ett jobb.The nodes that are actively running a job. |
Inaktiva noderIdle Nodes | AntalCount | Antal inaktiva noder.Number of idle nodes. Inaktiva noder är noder som inte kör några jobb, men som kan ta emot nya jobb om de är tillgängliga.Idle nodes are the nodes that are not running any jobs but can accept new job if available. |
Oanvändbara noderUnusable Nodes | AntalCount | Antal oanvändbara noder.Number of unusable nodes. Oanvändbara noder fungerar inte på grund av ett problem som inte kan matchas.Unusable nodes are not functional due to some unresolvable issue. De här noderna återanvänds av Azure.Azure will recycle these nodes. |
Misslyckade noderPreempted Nodes | AntalCount | Antal noder som har åsidosatts.Number of preempted nodes. De här noderna är de noder med låg prioritet som tas bort från den tillgängliga Node-poolen.These nodes are the low-priority nodes that are taken away from the available node pool. |
Lämnar noderLeaving Nodes | AntalCount | Antal noder som lämnar.Number of leaving nodes. Att lämna noder är de noder som precis har avslutat bearbetningen av ett jobb och kommer att gå in i inaktivt läge.Leaving nodes are the nodes that just finished processing a job and will go to Idle state. |
Totalt antal kärnorTotal Cores | AntalCount | Antal total kärnorNumber of total cores |
Aktiva kärnorActive Cores | AntalCount | Antal aktiva kärnorNumber of active cores |
Inaktiva kärnorIdle Cores | AntalCount | Antal inaktiva kärnorNumber of idle cores |
Oanvändbara kärnorUnusable Cores | AntalCount | Antal oanvändbara kärnorNumber of unusable cores |
Blockerade kärnorPreempted Cores | AntalCount | Antal blockerade kärnorNumber of preempted cores |
Lämnar kärnorLeaving Cores | AntalCount | Antal lämnar kärnorNumber of leaving cores |
Kvot användning i procentQuota Utilization Percentage | AntalCount | Procent av kvoten som användsPercent of quota utilized |
ResursResource
MetricMetric | EnhetUnit | BeskrivningDescription |
---|---|---|
CpuUtilizationCpuUtilization | AntalCount | Procent andel användning på en processor nod.Percentage of utilization on a CPU node. Användningen rapporteras med en minuters intervall.Utilization is reported at one-minute intervals. |
GpuUtilizationGpuUtilization | AntalCount | Procent andel användning på en GPU-nod.Percentage of utilization on a GPU node. Användningen rapporteras med en minuters intervall.Utilization is reported at one-minute intervals. |
GpuMemoryUtilizationGpuMemoryUtilization | AntalCount | Procent andel minnes användning på en GPU-nod.Percentage of memory utilization on a GPU node. Användningen rapporteras med en minuters intervall.Utilization is reported at one-minute intervals. |
GpuEnergyJoulesGpuEnergyJoules | AntalCount | Intervall energi i joules på en GPU-nod.Interval energy in Joules on a GPU node. Energi rapporteras med en minuters intervall.Energy is reported at one-minute intervals. |
KörRun
Information om utbildningar körs för arbets ytan.Information on training runs for the workspace.
MetricMetric | EnhetUnit | BeskrivningDescription |
---|---|---|
Avbrutna körningarCancelled Runs | AntalCount | Antalet körningar som har avbrutits för den här arbets ytan.Number of runs canceled for this workspace. Antalet uppdateras när en körning har avbrutits.Count is updated when a run is successfully canceled. |
Avbryt begärda körningarCancel Requested Runs | AntalCount | Antal körningar där Cancel begärdes för den här arbets ytan.Number of runs where cancel was requested for this workspace. Antalet uppdateras när en avbrottsbegäran tas emot för en körning.Count is updated when cancellation request has been received for a run. |
Slutförda körningarCompleted Runs | AntalCount | Antalet körningar har slutförts för den här arbets ytan.Number of runs completed successfully for this workspace. Antalet uppdateras när en körning har slutförts och utdata har samlats in.Count is updated when a run has completed and output has been collected. |
Misslyckade körningarFailed Runs | AntalCount | Antalet körningar som misslyckades för den här arbets ytan.Number of runs failed for this workspace. Antalet uppdateras när en körning Miss lyckas.Count is updated when a run fails. |
Slutför körningarFinalizing Runs | AntalCount | Antal körningar som har angetts i slutfört tillstånd för den här arbets ytan.Number of runs entered finalizing state for this workspace. Antalet uppdateras när en körning har slutförts men insamlingen fortfarande pågår.Count is updated when a run has completed but output collection still in progress. |
Svarar inte körningarNot Responding Runs | AntalCount | Antal körningar som inte svarar på den här arbets ytan.Number of runs not responding for this workspace. Antalet uppdateras när en körning inte övergår i tillstånd.Count is updated when a run enters Not Responding state. |
Inte startade körningarNot Started Runs | AntalCount | Antal körningar i inte start läge för den här arbets ytan.Number of runs in Not Started state for this workspace. Antalet uppdateras när en begäran tas emot för att skapa en körning men körnings information ännu inte har fyllts i.Count is updated when a request is received to create a run but run information has not yet been populated. |
Förbereder körningarPreparing Runs | AntalCount | Antal körningar som förbereds för den här arbets ytan.Number of runs that are preparing for this workspace. Antalet uppdateras när en körning går in i förberedelse tillstånd medan körnings miljön förbereds.Count is updated when a run enters Preparing state while the run environment is being prepared. |
Etablerings körningarProvisioning Runs | AntalCount | Antal körningar som håller på att etablering för den här arbets ytan.Number of runs that are provisioning for this workspace. Antalet uppdateras när en körning väntar på skapande eller etablering av beräknings mål.Count is updated when a run is waiting on compute target creation or provisioning. |
Köade körningarQueued Runs | AntalCount | Antal körningar som har placerats i kö för den här arbets ytan.Number of runs that are queued for this workspace. Antalet uppdateras när en körning placeras i kö i beräknings mål.Count is updated when a run is queued in compute target. Kan inträffa vid väntan på att nödvändiga datornoder ska vara klara.Can occur when waiting for required compute nodes to be ready. |
Startade körningarStarted Runs | AntalCount | Antal körningar som körs för den här arbets ytan.Number of runs running for this workspace. Antalet uppdateras när körningen börjar köras på nödvändiga resurser.Count is updated when run starts running on required resources. |
Startar körningarStarting Runs | AntalCount | Antal körningar som har startats för den här arbets ytan.Number of runs started for this workspace. Antalet uppdateras när begäran om att skapa körnings-och körnings information, till exempel körnings-ID, har fyllts iCount is updated after request to create run and run info, such as the Run ID, has been populated |
FelErrors | AntalCount | Antal körnings fel i den här arbets ytan.Number of run errors in this workspace. Antalet uppdateras när körningen påträffar ett fel.Count is updated whenever run encounters an error. |
VarningarWarnings | AntalCount | Antal körnings varningar i den här arbets ytan.Number of run warnings in this workspace. Antalet uppdateras när en körning påträffar en varning.Count is updated whenever a run encounters a warning. |
Mått dimensionerMetric dimensions
Mer information om vilka mått dimensioner som finns i flerdimensionella mått.For more information on what metric dimensions are, see Multi-dimensional metrics.
Azure Machine Learning har följande dimensioner kopplade till sina mått.Azure Machine Learning has the following dimensions associated with its metrics.
DimensionDimension | BeskrivningDescription |
---|---|
KlusternamnCluster Name | Namnet på beräknings kluster resursen.The name of the compute cluster resource. Tillgängligt för alla kvot mått.Available for all quota metrics. |
Namn på virtuell dator familjVm Family Name | Namnet på den VM-serie som används av klustret.The name of the VM family used by the cluster. Tillgängligt för kvot användning i procent.Available for quota utilization percentage. |
VM-prioritetVm Priority | Den virtuella datorns prioritet.The priority of the VM. Tillgängligt för kvot användning i procent.Available for quota utilization percentage. |
CreatedTimeCreatedTime | Endast tillgängligt för CpuUtilization och GpuUtilization.Only available for CpuUtilization and GpuUtilization. |
DeviceIdDeviceId | ID för enheten (GPU).ID of the device (GPU). Endast tillgängligt för GpuUtilization.Only available for GpuUtilization. |
NodeIdNodeId | ID för noden som skapades där jobbet körs.ID of the node created where job is running. Endast tillgängligt för CpuUtilization och GpuUtilization.Only available for CpuUtilization and GpuUtilization. |
RunIdRunId | ID för körning/jobb.ID of the run/job. Endast tillgängligt för CpuUtilization och GpuUtilization.Only available for CpuUtilization and GpuUtilization. |
ComputeTypeComputeType | Den beräknings typ som används för körningen.The compute type that the run used. Endast tillgängligt för slutförda körningar, misslyckade körningar och startade körningar.Only available for Completed runs, Failed runs, and Started runs. |
PipelineStepTypePipelineStepType | Den typ av PipelineStep som används i körningen.The type of PipelineStep used in the run. Endast tillgängligt för slutförda körningar, misslyckade körningar och startade körningar.Only available for Completed runs, Failed runs, and Started runs. |
PublishedPipelineIdPublishedPipelineId | ID för den publicerade pipelinen som används i körningen.The ID of the published pipeline used in the run. Endast tillgängligt för slutförda körningar, misslyckade körningar och startade körningar.Only available for Completed runs, Failed runs, and Started runs. |
RunTypeRunType | Typ av körning.The type of run. Endast tillgängligt för slutförda körningar, misslyckade körningar och startade körningar.Only available for Completed runs, Failed runs, and Started runs. |
Giltiga värden för dimensionen RunType är:The valid values for the RunType dimension are:
VärdeValue | BeskrivningDescription |
---|---|
ExperimentExperiment | Icke-pipeline körs.Non-pipeline runs. |
PipelineRunPipelineRun | En pipeline-körning som är överordnad en StepRun.A pipeline run, which is the parent of a StepRun. |
StepRunStepRun | En körning för en pipeline-åtgärd.A run for a pipeline step. |
ReusedStepRunReusedStepRun | En körning för ett pipeline-steg som återanvänder en tidigare körning.A run for a pipeline step that reuses a previous run. |
AktivitetsloggActivity log
I följande tabell visas de åtgärder som är relaterade till Azure Machine Learning som kan skapas i aktivitets loggen.The following table lists the operations related to Azure Machine Learning that may be created in the Activity log.
ÅtgärdOperation | BeskrivningDescription |
---|---|
Skapar eller uppdaterar en Machine Learning arbets ytaCreates or updates a Machine Learning workspace | En arbets yta har skapats eller uppdateratsA workspace was created or updated |
CheckComputeNameAvailabilityCheckComputeNameAvailability | Kontrol lera om ett beräknings namn redan användsCheck if a compute name is already in use |
Skapar eller uppdaterar beräknings resursernaCreates or updates the compute resources | En beräknings resurs har skapats eller uppdateratsA compute resource was created or updated |
Tar bort beräknings resursernaDeletes the compute resources | En beräknings resurs har tagits bortA compute resource was deleted |
Visa en lista över hemligheterList secrets | På åtgärd som har listats hemligheter för en Machine Learning arbets ytaOn operation listed secrets for a Machine Learning workspace |
ResursloggarResource logs
I det här avsnittet visas de typer av resurs loggar som du kan samla in för Azure Machine Learning arbets ytan.This section lists the types of resource logs you can collect for Azure Machine Learning workspace.
Resource Provider och typ: Microsoft. MachineLearningServices/Workspace.Resource Provider and Type: Microsoft.MachineLearningServices/workspace.
KategoriCategory | VisningsnamnDisplay Name |
---|---|
AmlComputeClusterEventAmlComputeClusterEvent | AmlComputeClusterEventAmlComputeClusterEvent |
AmlComputeClusterNodeEventAmlComputeClusterNodeEvent | AmlComputeClusterNodeEventAmlComputeClusterNodeEvent |
AmlComputeCpuGpuUtilizationAmlComputeCpuGpuUtilization | AmlComputeCpuGpuUtilizationAmlComputeCpuGpuUtilization |
AmlComputeJobEventAmlComputeJobEvent | AmlComputeJobEventAmlComputeJobEvent |
AmlRunStatusChangedEventAmlRunStatusChangedEvent | AmlRunStatusChangedEventAmlRunStatusChangedEvent |
SchemanSchemas
Följande scheman används i Azure Machine LearningThe following schemas are in use by Azure Machine Learning
AmlComputeJobEvents-tabellAmlComputeJobEvents table
EgenskapProperty | BeskrivningDescription |
---|---|
TimeGeneratedTimeGenerated | Tid när logg posten skapadesTime when the log entry was generated |
OperationNameOperationName | Namnet på åtgärden som är associerad med logg händelsenName of the operation associated with the log event |
KategoriCategory | Namnet på logg händelsen, AmlComputeClusterNodeEventName of the log event, AmlComputeClusterNodeEvent |
JobIdJobId | ID för jobbet som skickatsID of the Job submitted |
ExperimentIdExperimentId | ID för experimentetID of the Experiment |
ExperimentNameExperimentName | Experimentets namnName of the Experiment |
CustomerSubscriptionIdCustomerSubscriptionId | SubscriptionId där experiment och jobb skickas inSubscriptionId where Experiment and Job as submitted |
WorkspaceNameWorkspaceName | Namnet på Machine Learning-arbetsytanName of the machine learning workspace |
ClusterNameClusterName | Namn på klustretName of the Cluster |
ProvisioningStateProvisioningState | Tillstånd för jobb sändningenState of the Job submission |
ResourceGroupNameResourceGroupName | Namnet på resurs gruppenName of the resource group |
JobNameJobName | Jobbets namnName of the Job |
ClusterIdClusterId | ID för klustretID of the cluster |
TypEventType | Typ av jobb händelse.Type of the Job event. Till exempel JobSubmitted, JobRunning, JobFailed, JobSucceeded.For example, JobSubmitted, JobRunning, JobFailed, JobSucceeded. |
ExecutionStateExecutionState | Status för jobbet (körningen).State of the job (the Run). Till exempel i kö, körs, lyckades, misslyckadesFor example, Queued, Running, Succeeded, Failed |
ErrorDetailsErrorDetails | Information om jobbfelDetails of job error |
CreationApiVersionCreationApiVersion | API-version som används för att skapa jobbetApi version used to create the job |
ClusterResourceGroupNameClusterResourceGroupName | Resurs grupps namn för klustretResource group name of the cluster |
TFWorkerCountTFWorkerCount | Antal TF-arbetareCount of TF workers |
TFParameterServerCountTFParameterServerCount | Antal TF-parameter ServerCount of TF parameter server |
ToolTypeToolType | Typ av verktyg som användsType of tool used |
RunInContainerRunInContainer | Flagga som beskriver om jobb ska köras inuti en behållareFlag describing if job should be run inside a container |
JobErrorMessageJobErrorMessage | detaljerat meddelande vid jobbfeldetailed message of Job error |
NodeIdNodeId | ID för noden som skapades där jobbet körsID of the node created where job is running |
AmlComputeClusterEvents-tabellAmlComputeClusterEvents table
EgenskapProperty | BeskrivningDescription |
---|---|
TimeGeneratedTimeGenerated | Tid när logg posten skapadesTime when the log entry was generated |
OperationNameOperationName | Namnet på åtgärden som är associerad med logg händelsenName of the operation associated with the log event |
KategoriCategory | Namnet på logg händelsen, AmlComputeClusterNodeEventName of the log event, AmlComputeClusterNodeEvent |
ProvisioningStateProvisioningState | Etablerings status för klustretProvisioning state of the cluster |
ClusterNameClusterName | Namn på klustretName of the cluster |
ClusterTypeClusterType | Typ av klusterType of the cluster |
CreatedByCreatedBy | Användare som skapade klustretUser who created the cluster |
CoreCountCoreCount | Antal kärnor i klustretCount of the cores in the cluster |
VmSizeVmSize | Klustrets virtuella dator storlekVm size of the cluster |
VmPriorityVmPriority | Prioritet för de noder som skapats i ett dedikerat kluster/LowPriorityPriority of the nodes created inside a cluster Dedicated/LowPriority |
ScalingTypeScalingType | Typ av kluster skalning manuellt/automatisktType of cluster scaling manual/auto |
InitialNodeCountInitialNodeCount | Antal inledande noder i klustretInitial node count of the cluster |
MinimumNodeCountMinimumNodeCount | Lägsta antal noder i klustretMinimum node count of the cluster |
MaximumNodeCountMaximumNodeCount | Maximalt antal noder för klustretMaximum node count of the cluster |
NodeDeallocationOptionNodeDeallocationOption | Hur noden ska frigörasHow the node should be deallocated |
PublisherPublisher | Utgivare av kluster typenPublisher of the cluster type |
ErbjudandeOffer | Erbjudande som klustret skapas medOffer with which the cluster is created |
SkuSku | SKU för den nod/VM som skapats i klustretSku of the Node/VM created inside cluster |
VersionVersion | Versionen av avbildningen som används när nod/VM skapasVersion of the image used while Node/VM is created |
SubnetIdSubnetId | SubnetId för klustretSubnetId of the cluster |
AllocationStateAllocationState | Kluster tilldelnings statusCluster allocation state |
CurrentNodeCountCurrentNodeCount | Aktuellt antal noder för klustretCurrent node count of the cluster |
TargetNodeCountTargetNodeCount | Antalet mål noder i klustret vid skalning upp/nedTarget node count of the cluster while scaling up/down |
TypEventType | Typ av händelse när klustret skapas.Type of event during cluster creation. |
NodeIdleTimeSecondsBeforeScaleDownNodeIdleTimeSecondsBeforeScaleDown | Inaktiv tid i sekunder innan klustret skalas nedIdle time in seconds before cluster is scaled down |
PreemptedNodeCountPreemptedNodeCount | Antal misslyckade noder i klustretPreempted node count of the cluster |
IsResizeGrowIsResizeGrow | Flagga som indikerar att klustret skalas uppFlag indicating that cluster is scaling up |
VmFamilyNameVmFamilyName | Namn på VM-serien för de noder som kan skapas i klustretName of the VM family of the nodes that can be created inside cluster |
LeavingNodeCountLeavingNodeCount | Lämnar klustrets antal noderLeaving node count of the cluster |
UnusableNodeCountUnusableNodeCount | Klustret har oanvändbart antal noderUnusable node count of the cluster |
IdleNodeCountIdleNodeCount | Antal inaktiva noder i klustretIdle node count of the cluster |
RunningNodeCountRunningNodeCount | Antal noder i klustret som körsRunning node count of the cluster |
PreparingNodeCountPreparingNodeCount | Antalet noder i klustret förberedsPreparing node count of the cluster |
QuotaAllocatedQuotaAllocated | Allokerad kvot till klustretAllocated quota to the cluster |
QuotaUtilizedQuotaUtilized | Använd kvot för klustretUtilized quota of the cluster |
AllocationStateTransitionTimeAllocationStateTransitionTime | Över gångs tid från ett tillstånd till ett annatTransition time from one state to another |
ClusterErrorCodesClusterErrorCodes | Felkod som togs emot vid skapande eller skalning av klusterError code received during cluster creation or scaling |
CreationApiVersionCreationApiVersion | API-version som används när klustret skapasApi version used while creating the cluster |
AmlComputeClusterNodeEvents-tabellAmlComputeClusterNodeEvents table
EgenskapProperty | BeskrivningDescription |
---|---|
TimeGeneratedTimeGenerated | Tid när logg posten skapadesTime when the log entry was generated |
OperationNameOperationName | Namnet på åtgärden som är associerad med logg händelsenName of the operation associated with the log event |
KategoriCategory | Namnet på logg händelsen, AmlComputeClusterNodeEventName of the log event, AmlComputeClusterNodeEvent |
ClusterNameClusterName | Namn på klustretName of the cluster |
NodeIdNodeId | ID för klusternoden som skapadesID of the cluster node created |
VmSizeVmSize | Nodens VM-storlekVm size of the node |
VmFamilyNameVmFamilyName | VM-serien som noden tillhörVm family to which the node belongs |
VmPriorityVmPriority | Prioritet för noden som skapade dedikerad/LowPriorityPriority of the node created Dedicated/LowPriority |
PublisherPublisher | Utgivare av VM-avbildningen.Publisher of the vm image. Till exempel Microsoft-dsvmFor example, microsoft-dsvm |
ErbjudandeOffer | Erbjudande som är associerat med skapande av virtuell datorOffer associated with the VM creation |
SkuSku | SKU för den nod/VM som skapatsSku of the Node/VM created |
VersionVersion | Versionen av avbildningen som används när nod/VM skapasVersion of the image used while Node/VM is created |
ClusterCreationTimeClusterCreationTime | Tid när klustret skapadesTime when cluster was created |
ResizeStartTimeResizeStartTime | Tid när kluster skalar upp/ned startasTime when cluster scale up/down started |
ResizeEndTimeResizeEndTime | Tid när kluster skalar upp/ned avslutasTime when cluster scale up/down ended |
NodeAllocationTimeNodeAllocationTime | Tid när noden allokeradesTime when Node was allocated |
NodeBootTimeNodeBootTime | Tid när noden startadesTime when Node was booted up |
StartTaskStartTimeStartTaskStartTime | Tid när uppgiften tilldelades till en nod och startadesTime when task was assigned to a node and started |
StartTaskEndTimeStartTaskEndTime | Tid när uppgiften som tilldelats till en nod slutadeTime when task assigned to a node ended |
TotalE2ETimeInSecondsTotalE2ETimeInSeconds | Noden total tid var aktivTotal time node was active |
Se ävenSee also
- En beskrivning av övervaknings Azure Machine Learning finns i övervaknings Azure Machine Learning .See Monitoring Azure Machine Learning for a description of monitoring Azure Machine Learning.
- Mer information om övervakning av Azure-resurser finns i övervaka Azure-resurser med Azure Monitor .See Monitoring Azure resources with Azure Monitor for details on monitoring Azure resources.