Role a úkoly v procesu týmového Datová Věda

TDSP (Team Datová Věda Process) je architektura vyvinutá Microsoftem, která poskytuje strukturovanou metodologii pro efektivní vytváření řešení prediktivní analýzy a inteligentních aplikací. Tento článek popisuje klíčové role pracovníků a přidružené úlohy pro tým datových věd, který v tomto procesu standardizuje.

Navrhuje se doplnit artefakty MLflow uložené ve službě Azure Machine Učení, které je kompatibilní s Gitem. Azure Machine Učení integruje s úložišti Git, takže můžete používat mnoho služeb kompatibilních s Gitem, jako je GitHub, GitLab, Bitbucket, Azure DevOps nebo jakákoli jiná služba kompatibilní s Gitem.

Struktura skupin a týmů datových věd

Funkce datových věd v podnicích jsou často uspořádány v následující hierarchii:

  • Skupina datových věd
  • Týmy datových věd v rámci skupiny

V takové struktuře existují vedoucí skupiny a vedoucí týmu. Tým datových věd obvykle provádí projekt datových věd. Týmy datových věd mají vedoucí projektů pro úlohy řízení projektů a zásad správného řízení a jednotlivé datové vědce a techniky k provádění datových věd a datových inženýrů v rámci projektu. Vedoucí skupiny, týmu nebo projektu provádějí počáteční nastavení a zásady správného řízení projektu.

Definice a úkoly pro čtyři role TDSP

Předpokládá se, že jednotka datových věd se skládá z týmů v rámci skupiny, existují čtyři různé role pro pracovníky TDSP:

  • Správce skupin: Spravuje celou jednotku datových věd v podniku. Jednotka datových věd může mít více týmů, z nichž každá pracuje na několika projektech datových věd v různých obchodních oblastech. Správce skupiny může své úkoly delegovat na náhradní, ale úkoly přidružené k roli se nemění.

  • Vedoucí týmu: Spravuje tým v jednotce datových věd podniku. Tým se skládá z datových vědců. V případě malé jednotky datových věd může být vedoucí skupiny a vedoucí týmu stejnou osobou.

  • Vedoucí projektu: Spravuje každodenní aktivity jednotlivých datových vědců na konkrétním projektu datových věd.

  • Jednotliví přispěvatelé projektu: Datoví vědci, obchodní analytici, datoví inženýři, architekti a další, kteří provádějí projekt datových věd.

Poznámka:

V závislosti na struktuře a velikosti podniku může mít jedna osoba více než jednu roli nebo více než jedna osoba může vyplnit roli.

Úkoly pro čtyři role

Následující diagram znázorňuje úlohy nejvyšší úrovně pro každou roli TDSP. Tento přehled a následující podrobný přehled úkolů pro každou roli TDSP vám může pomoct zvolit požadovaný kurz na základě vašich zodpovědností.

Diagram that shows an overview of the roles and tasks.

Úlohy správce skupin

Správce skupiny nebo určený správce systému TDSP provede následující úlohy, aby přijal TDSP:

  • Vytvoří organizaci Azure DevOps a skupinový projekt v rámci organizace.

  • Vytvoří úložiště šablon projektu v projektu skupiny Azure DevOps a vytvoří ho z úložiště šablon projektu vyvinutého týmem Microsoft TDSP. Úložiště šablon projektu Microsoft TDSP poskytuje:

    • Standardizovaná adresářová struktura, včetně adresářů pro data, kód a dokumenty.
    • Sada standardizovaných šablon dokumentů pro vedení efektivního procesu datových věd.
  • Vytvoří úložiště nástrojů a vytvoří ho z úložiště nástrojů vyvinutého týmem Microsoft TDSP. Úložiště nástrojů TDSP od Microsoftu poskytuje sadu užitečných nástrojů pro efektivnější práci datového vědce. Úložiště nástrojů Microsoftu zahrnuje nástroje pro interaktivní zkoumání dat, analýzu, vytváření sestav a základní modelování a vytváření sestav.

  • Nastaví zásady řízení zabezpečení pro účet organizace.

Další informace najdete v tématu Úlohy vedoucí skupiny pro tým datových věd.

Úkoly vedoucího týmu

Vedoucí týmu nebo určený správce projektu dokončí následující úkoly a přijme TDSP:

  • Vytvoří týmový projekt v organizaci Azure DevOps skupiny.

  • Vytvoří v projektu úložiště šablony projektu a vytvoří ho z úložiště šablony skupinového projektu nastaveného manažerem skupiny nebo delegátem.

  • Vytvoří týmové úložiště nástrojů, zasadí ho z úložiště nástrojů skupiny a přidá do úložiště nástroje specifické pro tým.

  • Volitelně můžete vytvořit úložiště souborů Azure pro ukládání užitečných datových prostředků pro tým. Ostatní členové týmu můžou toto sdílené cloudové úložiště souborů připojit ke svým analytickým desktopům.

  • Volitelně připojí úložiště souborů Azure na virtuální počítač datové vědy týmu a přidá do něj datové prostředky týmu.

  • Nastaví řízení zabezpečení přidáním členů týmu a konfigurací jejich oprávnění.

Další informace najdete v tématu Týmové úkoly vedoucího týmu pro datové vědy.

Úkoly vedoucího projektu

Vedoucí projektu dokončí následující úkoly a přijme TDSP:

  • Vytvoří v týmovém projektu úložiště projektu a vytvoří ho z úložiště šablon projektu.

  • Volitelně můžete vytvořit úložiště souborů Azure pro ukládání datových prostředků projektu.

  • Volitelně připojí úložiště souborů Azure k virtuálnímu počítači pro datové vědy a přidá do něj datové prostředky projektu.

  • Nastaví řízení zabezpečení přidáním členů projektu a konfigurací jejich oprávnění.

Další informace najdete v tématu Vedoucí úkoly projektu pro tým datových věd.

Úkoly jednotlivých přispěvatelů projektu

Jednotliví přispěvatelé projektu, obvykle datový vědec, provádí následující úlohy pomocí TDSP:

  • Naklonuje úložiště projektu nastavené vedoucím projektu.

  • Volitelně připojí sdílený tým a projektové úložiště souborů Azure na virtuálním počítači pro datové vědy.

  • Spustí projekt.

Další informace najdete v tématu Úkoly jednotlivých přispěvatelů projectu pro tým datových věd.

Pracovní postup provádění projektu datových věd

Datoví vědci, vedoucí projektů a vedoucí týmu můžou vytvářet pracovní položky pro sledování všech úkolů a fází projektu od začátku do konce. Následující obrázek popisuje pracovní postup TDSP pro provádění projektu:

Diagram that shows the typical data science project workflow.

Kroky pracovního postupu je možné seskupit do tří aktivit:

  • Vedoucí projectu provádějí plánování sprintů.

  • Datoví vědci vyvíjejí artefakty ve git větvích pro řešení pracovních položek.

  • Vedoucí projektu nebo jiní členové týmu dělají kontroly kódu a slučují pracovní větve do primární větve.

Přispěvatelé

Tento článek spravuje Microsoft. Původně byla napsána následujícími přispěvateli.

Hlavní autor:

Pokud chcete zobrazit neveřejné profily LinkedIn, přihlaste se na LinkedIn.