Delen via


Gegevensverzameling van modellen in productie

VAN TOEPASSING OP:Azure CLI ml extension v2 (current)Python SDK azure-ai-ml v2 (current)

In dit artikel leert u meer over het verzamelen van gegevens van modellen die zijn geïmplementeerd op online-eindpunten van Azure Machine Learning.

Azure Machine Learning-gegevensverzamelaar biedt realtime logboekregistratie van invoer- en uitvoergegevens van modellen die zijn geïmplementeerd op beheerde online-eindpunten of Kubernetes Online-eindpunten. Azure Machine Learning slaat de vastgelegde deductiegegevens op in Azure Blob Storage. Deze gegevens kunnen vervolgens naadloos worden gebruikt voor modelbewaking, foutopsporing of controle, waardoor waarneembaarheid wordt geboden in de prestaties van uw geïmplementeerde modellen.

Gegevensverzamelaar biedt:

  • Logboekregistratie van deductiegegevens naar een centrale locatie (Azure Blob Storage)
  • Ondersteuning voor beheerde online-eindpunten en Kubernetes-online-eindpunten
  • Definitie op implementatieniveau, waardoor de configuratie maximaal kan worden gewijzigd
  • Ondersteuning voor zowel payload als aangepaste logboekregistratie

Logboekregistratiemodi

Gegevensverzamelaar biedt twee logboekregistratiemodi: logboekregistratie van nettoladingen en aangepaste logboekregistratie. Met logboekregistratie van nettoladingen kunt u de HTTP-aanvraag- en antwoordpayloadgegevens van uw geïmplementeerde modellen verzamelen. Met aangepaste logboekregistratie biedt Azure Machine Learning u een Python SDK voor het rechtstreeks vastleggen van pandas DataFrames vanuit uw scorescript. Met behulp van de Python SDK voor aangepaste logboekregistratie kunt u modelinvoer- en uitvoergegevens vastleggen, naast gegevens vóór, tijdens en na eventuele gegevenstransformaties (of voorverwerking).

Configuratie van gegevensverzamelaar

Gegevensverzamelaar kan worden geconfigureerd op implementatieniveau en de configuratie wordt opgegeven tijdens de implementatie. U kunt de Azure Blob Storage-bestemming configureren die de verzamelde gegevens ontvangt. U kunt ook de steekproeffrequentie (variërend van 0 tot 100%) van de gegevens configureren die moeten worden verzameld.

Beperkingen

Gegevensverzamelaar heeft de volgende beperkingen:

  • Gegevensverzamelaar ondersteunt alleen logboekregistratie voor online (of realtime) Azure Machine Learning-eindpunten (beheerd of Kubernetes).
  • De Python SDK voor gegevensverzamelaar biedt alleen ondersteuning voor het vastleggen van tabelgegevens via pandas DataFrames.