Process roller och uppgifter för team data vetenskapTeam Data Science Process roles and tasks

TDSP (Team data science process) är ett ramverk som utvecklats av Microsoft och som ger en strukturerad metod för att effektivt bygga förutsägelse analys lösningar och intelligenta program.The Team Data Science Process (TDSP) is a framework developed by Microsoft that provides a structured methodology to efficiently build predictive analytics solutions and intelligent applications. Den här artikeln beskriver viktiga personal roller och associerade uppgifter för ett data vetenskaps team som är standardiserat för den här processen.This article outlines the key personnel roles and associated tasks for a data science team standardizing on this process.

Den här inledande artikeln länkar till självstudier om hur du konfigurerar TDSP-miljön.This introductory article links to tutorials on how to set up the TDSP environment. Självstudierna innehåller detaljerad information om hur du använder Azure DevOps Projects, Azure databaser-databaser och Azure-kort.The tutorials provide detailed guidance for using Azure DevOps Projects, Azure Repos repositories, and Azure Boards. Det motivbaserade målet flyttas från konceptet genom modellering och till distribution.The motivating goal is moving from concept through modeling and into deployment.

Självstudierna använder Azure-DevOps eftersom det är så här implementerar du TDSP på Microsoft.The tutorials use Azure DevOps because that is how to implement TDSP at Microsoft. Azure-DevOps fören klar samarbetet genom att integrera rollbaserad säkerhet, hantering av arbets objekt, spårning och kod värdskap, delning och käll kontroll.Azure DevOps facilitates collaboration by integrating role-based security, work item management and tracking, and code hosting, sharing, and source control. Självstudierna använder också en Azure data science Virtual Machine (DSVM) som Analytics Desktop, som har flera populära data vetenskaps verktyg förkonfigurerade och integrerade med Microsoft-programvara och Azure-tjänster.The tutorials also use an Azure Data Science Virtual Machine (DSVM) as the analytics desktop, which has several popular data science tools pre-configured and integrated with Microsoft software and Azure services.

Du kan använda självstudierna för att implementera TDSP med andra kod värdar, smidiga planerings verktyg och utvecklingsverktyg, men vissa funktioner kanske inte är tillgängliga.You can use the tutorials to implement TDSP using other code-hosting, agile planning, and development tools and environments, but some features may not be available.

Struktur för data vetenskaps grupper och teamStructure of data science groups and teams

Data vetenskaps funktioner i företag organiseras ofta i följande hierarki:Data science functions in enterprises are often organized in the following hierarchy:

  • Data vetenskaps gruppData science group
    • Data vetenskaps team/s inom gruppenData science team/s within the group

I en sådan struktur finns grupp ledare och grupp ledare.In such a structure, there are group leads and team leads. Ett data vetenskaps projekt utförs vanligt vis av ett data vetenskaps team.Typically, a data science project is done by a data science team. Data vetenskaps team har projekt som leder till projekt hanterings-och styrnings aktiviteter och enskilda data forskare och tekniker för att utföra data vetenskaps-och data tekniks delar i projektet.Data science teams have project leads for project management and governance tasks, and individual data scientists and engineers to perform the data science and data engineering parts of the project. Den första projekt konfigurationen och styrningen utförs av gruppen, teamet eller projekt leads.The initial project setup and governance is done by the group, team, or project leads.

Definition och uppgifter för de fyra TDSP-rollernaDefinition and tasks for the four TDSP roles

Med antagandet att data vetenskaps enheten består av team i en grupp finns det fyra olika roller för TDSP-personal:With the assumption that the data science unit consists of teams within a group, there are four distinct roles for TDSP personnel:

  1. Grupp hanterare: hanterar hela data vetenskaps enheten i ett företag.Group Manager: Manages the entire data science unit in an enterprise. En data vetenskaps enhet kan ha flera team, där var och en arbetar med flera data vetenskaps projekt i olika affärs lodräta.A data science unit might have multiple teams, each of which is working on multiple data science projects in distinct business verticals. En grupp hanterare kan delegera sina uppgifter till ett surrogat, men de uppgifter som är associerade med rollen ändras inte.A Group Manager might delegate their tasks to a surrogate, but the tasks associated with the role do not change.

  2. Grupp ledare: hanterar ett team i en företags data vetenskaps enhet.Team Lead: Manages a team in the data science unit of an enterprise. Ett team består av flera data forskare.A team consists of multiple data scientists. För en liten data vetenskaps enhet kan grupp chefen och teamets lead vara samma person.For a small data science unit, the Group Manager and the Team Lead might be the same person.

  3. Projekt ledare: hanterar dagliga aktiviteter för enskilda data forskare i ett visst data vetenskaps projekt.Project Lead: Manages the daily activities of individual data scientists on a specific data science project.

  4. Projicera enskilda bidrags givare: data experter, affärsanalytiker, data tekniker, arkitekter och andra som kör ett data vetenskaps projekt.Project Individual Contributors: Data Scientists, Business Analysts, Data Engineers, Architects, and others who execute a data science project.

Anteckning

Beroende på företagets struktur och storlek kan en enskild person spela mer än en roll, eller så kan mer än en person fylla i en roll.Depending on the structure and size of an enterprise, a single person may play more than one role, or more than one person may fill a role.

Aktiviteter som ska utföras av de fyra rollernaTasks to be completed by the four roles

I följande diagram visas toppnivå aktiviteter för varje team data vetenskaps process roll.The following diagram shows the top-level tasks for each Team Data Science Process role. Det här schemat och följande, mer detaljerad översikt över aktiviteter för varje TDSP-roll kan hjälpa dig att välja den själv studie kurs du behöver utifrån dina ansvars områden.This schema and the following, more detailed outline of tasks for each TDSP role can help you choose the tutorial you need based on your responsibilities.

Översikt över roller och aktiviteter

Grupp hanterings uppgifterGroup Manager tasks

Grupp hanteraren eller en utsedd TDSP system administratör utför följande uppgifter för att anta TDSP:The Group Manager or a designated TDSP system administrator completes the following tasks to adopt the TDSP:

  • Skapar en Azure DevOps- organisation och ett grupp projekt i organisationen.Creates an Azure DevOps organization and a group project within the organization.
  • Skapar en lagrings plats för projekt mal len i Azure DevOps Group-projektet och dirigerar den från lagrings platsen för projekt mal len som har utvecklats av Microsoft TDSP-teamet.Creates a project template repository in the Azure DevOps group project, and seeds it from the project template repository developed by the Microsoft TDSP team. Microsoft TDSP Project Template-lagringsplatsen innehåller:The Microsoft TDSP project template repository provides:
    • En standardiserad katalog struktur, inklusive kataloger för data, kod och dokument.A standardized directory structure, including directories for data, code, and documents.
    • En uppsättning standardiserade dokumentmallar som hjälper dig att skapa en effektiv data vetenskaps process.A set of standardized document templates to guide an efficient data science process.
  • Skapar en verktygs lagrings plats och dirigerar den från verktygets lagrings plats som utvecklats av Microsoft TDSP-teamet.Creates a utility repository, and seeds it from the utility repository developed by the Microsoft TDSP team. TDSP Utility-lagringsplatsen från Microsoft tillhandahåller en uppsättning användbara verktyg för att göra arbetet i en data expert mer effektivt.The TDSP utility repository from Microsoft provides a set of useful utilities to make the work of a data scientist more efficient. Microsoft-verktygets lagrings plats innehåller verktyg för interaktiv data utforskning, analys, rapportering och bas linje modellering och rapportering.The Microsoft utility repository includes utilities for interactive data exploration, analysis, reporting, and baseline modeling and reporting.
  • Konfigurerar säkerhets kontroll principen för organisations kontot.Sets up the security control policy for the organization account.

Detaljerade anvisningar finns i grupp chefs aktiviteter för ett data vetenskaps team.For detailed instructions, see Group Manager tasks for a data science team.

Grupp ledar uppgifterTeam Lead tasks

Team ledare eller en utsedd projekt administratör utför följande uppgifter för att anta TDSP:The Team Lead or a designated project administrator completes the following tasks to adopt the TDSP:

  • Skapar ett team projekt i gruppens Azure DevOps-organisation.Creates a team project in the group's Azure DevOps organization.
  • Skapar lagrings platsen för projekt mal len i projektet och dirigerar den från den grupp projekt mal len lagrings plats som ställts in av grupp hanteraren eller ombudet.Creates the project template repository in the project, and seeds it from the group project template repository set up by the Group Manager or delegate.
  • Skapar team Utility-lagringsplatsen, dirigerar den från grupp verktygs lagrings platsen och lägger till Team-/regionsspecifika verktyg i lagrings platsen.Creates the team utility repository, seeds it from the group utility repository, and adds team-specific utilities to the repository.
  • Du kan också skapa Azure File Storage för att lagra användbara data till gångar för teamet.Optionally creates Azure file storage to store useful data assets for the team. Andra grupp medlemmar kan montera det här delade moln fil arkivet på sina Analytics-datorer.Other team members can mount this shared cloud file store on their analytics desktops.
  • Du kan också montera Azure File Storage på teamets DSVM och lägga till Team data till gångar.Optionally mounts the Azure file storage on the team's DSVM and adds team data assets to it.
  • Ställer in säkerhets kontroll genom att lägga till team medlemmar och konfigurera deras behörigheter.Sets up security control by adding team members and configuring their permissions.

Detaljerade anvisningar finns i grupp ledar aktiviteter för ett data vetenskaps team.For detailed instructions, see Team Lead tasks for a data science team.

Projekt ledar uppgifterProject Lead tasks

Projektets lead Slutför följande uppgifter för att anta TDSP:The Project Lead completes the following tasks to adopt the TDSP:

  • Skapar en projekt databas i team projektet och dirigerar den från lagrings platsen för projekt mal len.Creates a project repository in the team project, and seeds it from the project template repository.
  • Du kan också skapa Azure File Storage för att lagra projektets data till gångar.Optionally creates Azure file storage to store the project's data assets.
  • Du kan också montera Azure File Storage i DSVM och lägga till projekt data till gångar.Optionally mounts the Azure file storage to the DSVM and adds project data assets to it.
  • Ställer in säkerhets kontroll genom att lägga till projekt medlemmar och konfigurera deras behörigheter.Sets up security control by adding project members and configuring their permissions.

Detaljerade anvisningar finns i projekt ledar aktiviteter för ett data vetenskaps team.For detailed instructions, see Project Lead tasks for a data science team.

Projicera enskilda bidrags uppgifterProject Individual Contributor tasks

Projektets enskilda deltagare, vanligt vis en data expert, utför följande uppgifter med hjälp av TDSP:The Project Individual Contributor, usually a Data Scientist, conducts the following tasks using the TDSP:

  • Klonar projekt databasen som har skapats av projektets lead.Clones the project repository set up by the project lead.
  • Du kan också montera det delade teamet och Project Azure File Storage på sina data science Virtual Machine (DSVM).Optionally mounts the shared team and project Azure file storage on their Data Science Virtual Machine (DSVM).
  • Kör projektet.Executes the project.

Detaljerade anvisningar om hur du registrerar dig på ett projekt finns i projekt enskilda deltagar uppgifter för ett data vetenskaps team.For detailed instructions for onboarding onto a project, see Project Individual Contributor tasks for a data science team.

Arbets flöde för data vetenskaps projekt körningData science project execution workflow

Genom att följa relevanta självstudier, data tekniker, projekt ledare och grupp ledare kan du skapa arbets objekt för att spåra alla aktiviteter och faser för projektet från början till slut.By following the relevant tutorials, data scientists, project leads, and team leads can create work items to track all tasks and stages for project from beginning to end. Med Azure databaser kan du främja samarbetet mellan data experter och se till att artefakterna som genereras vid projekt körningen är versioner som styrs och delas av alla projekt medlemmar.Using Azure Repos promotes collaboration among data scientists and ensures that the artifacts generated during project execution are version controlled and shared by all project members. Med Azure DevOps kan du länka dina Azure-kort till dina Azure databaser-lagringsplatser och enkelt spåra vad som har gjorts för ett arbets objekt.Azure DevOps lets you link your Azure Boards work items with your Azure Repos repository branches and easily track what has been done for a work item.

Följande bild beskriver TDSP-arbetsflödet för projekt körning:The following figure outlines the TDSP workflow for project execution:

Arbets flöde för vanliga data vetenskaps projekt

Arbets flödes stegen kan grupperas i tre aktiviteter:The workflow steps can be grouped into three activities:

  • Projekt ledare utför Sprint planeringProject Leads conduct sprint planning
  • Data forskare utvecklar artefakter på git grenar för att ta itu med arbets objektData Scientists develop artifacts on git branches to address work items
  • Projekt ledare eller andra grupp medlemmar gör kod granskningar och sammanfogar arbets grenar till den primära grenenProject Leads or other team members do code reviews and merge working branches to the primary branch

Detaljerade anvisningar om arbets flödet för projekt körning finns i smidig utveckling av data vetenskaps projekt.For detailed instructions on project execution workflow, see Agile development of data science projects.

TDSP-projektmallTDSP project template repository

Använd Microsoft TDSP-teamets mall för projekt mal len för att stödja effektiv projekt körning och samarbete.Use the Microsoft TDSP team's project template repository to support efficient project execution and collaboration. Lagrings platsen innehåller en standardiserad katalog struktur och dokumentmallar som du kan använda för dina egna TDSP-projekt.The repository gives you a standardized directory structure and document templates you can use for your own TDSP projects.

Nästa stegNext steps

Utforska mer detaljerade beskrivningar av de roller och uppgifter som definierats av team data science-processen:Explore more detailed descriptions of the roles and tasks defined by the Team Data Science Process: