Roller och uppgifter i Team Datavetenskap Process

Team Datavetenskap Process (TDSP) är ett ramverk som utvecklats av Microsoft och som tillhandahåller en strukturerad metod för att effektivt skapa förutsägelseanalyslösningar och intelligenta program. Den här artikeln beskriver viktiga personalroller och associerade uppgifter för ett datavetenskapsteam som standardiserar den här processen.

En Git-kompatibel miljö föreslås komplettera MLflow-artefakterna som lagras i Azure Machine Learning. Azure Machine Learning integreras med Git-lagringsplatser, så du kan använda många git-kompatibla tjänster, till exempel GitHub, GitLab, Bitbucket, Azure DevOps eller någon annan Git-kompatibel tjänst.

Struktur för datavetenskapsgrupper och team

Datavetenskapsfunktioner i företag organiseras ofta i följande hierarki:

  • Datavetenskapsgrupp
  • Datavetenskapsteam inom gruppen

I en sådan struktur finns gruppleads och gruppleads. Vanligtvis utför ett datavetenskapsteam ett datavetenskapsprojekt. Datavetenskapsteam har projektledare för projektlednings- och styrningsuppgifter samt enskilda dataforskare och tekniker för att utföra projektets datavetenskaps- och datateknikdelar. Grupp-, grupp- eller projektledarna utför den inledande projektkonfigurationen och styrningen.

Definition och uppgifter för de fyra TDSP-rollerna

Med antagandet att datavetenskapsenheten består av team inom en grupp finns det fyra distinkta roller för TDSP-personal:

  • Gruppchef: Hanterar hela datavetenskapsenheten i ett företag. En datavetenskapsenhet kan ha flera team, som var och en arbetar med flera datavetenskapsprojekt inom olika affärsområden. En gruppchef kan delegera sina uppgifter till en surrogat, men de uppgifter som är associerade med rollen ändras inte.

  • Teamledare: Hanterar ett team i datavetenskapsenheten i ett företag. Ett team består av dataforskare. För en liten datavetenskapsenhet kan gruppchefen och gruppledaren vara samma person.

  • Projektledare: Hanterar de dagliga aktiviteterna för enskilda dataforskare i ett specifikt datavetenskapsprojekt.

  • Projektdeltagare: Dataforskare, affärsanalytiker, datatekniker, arkitekter och andra som kör ett datavetenskapsprojekt.

Kommentar

Beroende på företagets struktur och storlek kan en enskild person ha mer än en roll, eller så kan fler än en person fylla en roll.

Uppgifter för de fyra rollerna

Följande diagram visar uppgifter på den översta nivån för varje TDSP-roll. Den här översikten och följande detaljerade beskrivning av uppgifter för varje TDSP-roll kan hjälpa dig att välja den självstudie som du behöver baserat på ditt ansvar.

Diagram that shows an overview of the roles and tasks.

Gruppchefsuppgifter

Grupphanteraren eller en utsedd TDSP-systemadministratör utför följande uppgifter för att införa TDSP:

  • Skapar en Azure DevOps-organisation och ett gruppprojekt inom organisationen.

  • Skapar en lagringsplats för projektmallar i Azure DevOps-gruppprojektet och skapar den från den projektmallslagringsplats som utvecklats av Microsoft TDSP-teamet. Microsoft TDSP-projektmalllagringsplatsen innehåller:

    • En standardiserad katalogstruktur, inklusive kataloger för data, kod och dokument.
    • En uppsättning standardiserade dokumentmallar som vägleder en effektiv datavetenskapsprocess.
  • Skapar en lagringsplats för verktyget och skapar den från den verktygslagringsplats som utvecklats av Microsoft TDSP-teamet. TDSP-verktygslagringsplatsen från Microsoft tillhandahåller en uppsättning användbara verktyg för att göra dataexpertens arbete mer effektivt. Microsofts lagringsplats för verktyg innehåller verktyg för interaktiv datautforskning, analys, rapportering och baslinjemodellering och rapportering.

  • Konfigurerar säkerhetskontrollprincipen för organisationskontot.

Mer information finns i Gruppchefsuppgifter för ett datavetenskapsteam.

Teamledningsuppgifter

Teamledningen eller en utsedd projektadministratör utför följande uppgifter för att införa TDSP:

  • Skapar ett teamprojekt i gruppens Azure DevOps-organisation.

  • Skapar projektmallens lagringsplats i projektet och skapar den från lagringsplatsen för gruppprojektmallen som har konfigurerats av grupphanteraren eller ombudet.

  • Skapar lagringsplatsen för teamverktyg, skapar den från gruppverktygslagringsplatsen och lägger till teamspecifika verktyg på lagringsplatsen.

  • Du kan också skapa Azure-fillagring för att lagra användbara datatillgångar för teamet. Andra teammedlemmar kan montera det här delade molnfilarkivet på sina analysskrivbord.

  • Du kan också montera Azure-fillagringen på teamets virtuella dator för datavetenskap och lägga till teamdatatillgångar i den.

  • Konfigurerar säkerhetskontroll genom att lägga till gruppmedlemmar och konfigurera deras behörigheter.

Mer information finns i Team lead tasks for a data science team(Team lead tasks for a data science team).

Projektledningsuppgifter

Projektledningen utför följande uppgifter för att införa TDSP:

  • Skapar en projektlagringsplats i teamprojektet och skapar den från lagringsplatsen för projektmallen.

  • Du kan också skapa Azure-fillagring för att lagra projektets datatillgångar.

  • Du kan också montera Azure-fillagringen på den virtuella datavetenskapsdatorn och lägga till projektdatatillgångar i den.

  • Konfigurerar säkerhetskontroll genom att lägga till projektmedlemmar och konfigurera deras behörigheter.

Mer information finns i Projektledningsaktiviteter för ett datavetenskapsteam.

Projektuppgifter för enskilda deltagare

Projektdeltagaren, vanligtvis en dataexpert, utför följande uppgifter med hjälp av TDSP:

  • Klonar projektlagringsplatsen som konfigurerats av projektledningen.

  • Du kan också montera det delade teamet och projicera Azure-fillagring på deras virtuella dator för datavetenskap.

  • Kör projektet.

Mer information finns i Project individual contributor tasks for a data science team (Projekt för enskilda deltagaruppgifter för ett datavetenskapsteam).

Arbetsflöde för datavetenskapsprojektkörning

Dataforskare, projektledare och teamledare kan skapa arbetsobjekt för att spåra alla uppgifter och steg för projektet från början till slut. Följande bild beskriver TDSP-arbetsflödet för projektkörning:

Diagram that shows the typical data science project workflow.

Arbetsflödesstegen kan grupperas i tre aktiviteter:

  • Projektledare genomför sprintplanering.

  • Dataforskare utvecklar artefakter på git grenar för att hantera arbetsobjekt.

  • Projektledare eller andra teammedlemmar gör kodgranskningar och sammanfogar arbetsgrenar till den primära grenen.

Deltagare

Den här artikeln underhålls av Microsoft. Det har ursprungligen skrivits av följande medarbetare.

Huvudförfattare:

Om du vill se icke-offentliga LinkedIn-profiler loggar du in på LinkedIn.