Distributionsfasen i livscykeln för Team Datavetenskap Process

Den här artikeln beskriver mål, uppgifter och slutprodukt som är associerade med distributionen av Team Datavetenskap Process (TDSP). Den här processen ger en rekommenderad livscykel som ditt team kan använda för att strukturera dina datavetenskapsprojekt. Livscykeln beskriver de viktigaste stegen som ditt team utför, ofta iterativt:

  • Affärsförstelse
  • Datainsamling och förståelse
  • Modellering
  • Distribution
  • Kundgodkännande

Här är en visuell representation av TDSP-livscykeln:

Diagram that shows the stages of the TDSP lifecycle.

Goal

Målet med distributionssteget är att distribuera modeller med en datapipeline till en produktions- eller produktionsliknande miljö för slutlig kundgodkännande.

Så här slutför du uppgiften

Huvuduppgiften för den här fasen är att operationalisera modellen. Distribuera modellen och pipelinen till en produktions- eller produktionsliknande miljö för programförbrukning.

Operationalisera en modell

När du har en uppsättning modeller som fungerar bra kan ditt team operationalisera dem så att andra program kan använda dem. Beroende på affärskraven görs förutsägelser antingen i realtid eller i batch. Om du vill distribuera modeller exponerar du dem med ett API-gränssnitt. Med ett gränssnitt kan användarna enkelt använda modellen från olika program, till exempel:

  • Webbplatser
  • Kalkylblad
  • Instrumentpaneler
  • Verksamhetsspecifika appar
  • Serverdelsprogram

Exempel på modelldriftsättning med Azure Machine Learning finns i Distribuera maskininlärningsmodeller till Azure. Det är en bra idé att bygga in övervakning i produktionsmodellen och den datapipeline som du distribuerar. Den här metoden hjälper till med efterföljande systemstatusrapportering och felsökning.

Integrera med MLflow

För att stödja den här fasen kan du använda följande Azure Machine Learning-funktioner:

  • Modellhantering: För att förbereda en distribution placerar du en modell i en produktions- eller driftmiljö. MLflow hanterar och versioner distributionsklara modeller, vilket hjälper till att förbättra driftsättningen.

  • Modellservering och distribution: MLflows modell som betjänar funktioner underlättar distributionsprocessen, så att du enkelt kan hantera modeller i olika miljöer.

Artifacts

I det här skedet levererar ditt team:

  • En statusinstrumentpanel som visar systemets hälsotillstånd och nyckelmått. Vi rekommenderar att du använder Power BI för att skapa en instrumentpanel.

  • En slutlig modelleringsrapport med distributionsinformation.

  • Ett slutligt lösningsarkitekturdokument.

Peer-granskad litteratur

Forskare publicerar studier om TDSP i peer-granskad litteratur. Citaten ger en möjlighet att undersöka andra program eller liknande idéer som TDSP, inklusive distributionens livscykelfas.

Deltagare

Den här artikeln underhålls av Microsoft. Det har ursprungligen skrivits av följande medarbetare.

Huvudförfattare:

Om du vill se icke-offentliga LinkedIn-profiler loggar du in på LinkedIn.

I de här artiklarna beskrivs de andra stegen i TDSP-livscykeln: