Szerepkörök és feladatok a csapat Adattudomány folyamatában

A Team Adattudomány Process (TDSP) a Microsoft által kifejlesztett keretrendszer, amely strukturált módszertant biztosít a prediktív elemzési megoldások és intelligens alkalmazások hatékony létrehozásához. Ez a cikk az adatelemzési csapat fő személyzeti szerepköreit és kapcsolódó feladatait ismerteti, amelyek szabványosítják ezt a folyamatot.

Git-kompatibilis környezet javasolt az Azure Machine Tanulás tárolt MLflow-összetevők kiegészítésére. Az Azure Machine Tanulás integrálható a Git-adattárakkal, így számos Git-kompatibilis szolgáltatást használhat, például a GitHubot, a GitLabetet, a Bitbucketet, az Azure DevOpsot vagy bármely más Git-kompatibilis szolgáltatást.

Adatelemzési csoportok és csoportok felépítése

A vállalatok adatelemzési funkciói gyakran a következő hierarchiában vannak rendszerezve:

  • Adatelemzési csoport
  • A csoport adatelemzési csapatai

Ilyen struktúrában csoportos érdeklődők és csoportvezetők vannak. Az adatelemzési csapat általában adatelemzési projektet végez. Az adatelemzési csapatok projektvezetőkkel rendelkeznek a projektirányítási és -szabályozási feladatokhoz, valamint egyéni adattudósok és mérnökök, akik elvégzik a projekt adatelemzési és adatmérnöki részeit. A csoport, a csapat vagy a projekt érdeklődői végrehajtják a kezdeti projektbeállítást és -szabályozást.

A négy TDSP-szerepkör definíciója és feladatai

Azzal a feltételezéssel, hogy az adatelemzési egység csoporton belüli csapatokból áll, a TDSP-személyzet négy különböző szerepkörrel rendelkezik:

  • Csoportmenedzser: Egy vállalat teljes adatelemzési egységét kezeli. Egy adatelemzési egység több csapatból állhat, amelyek mindegyike több adatelemzési projekten dolgozik különböző üzleti területeken. Előfordulhat, hogy a csoportmenedzser helyettesnek delegálja a feladatait, de a szerepkörhöz társított feladatok nem változnak.

  • Csapatvezető: Egy vállalat adatelemzési egységében lévő csapatot felügyel. A csapat adattudósokból áll. Egy kis adatelemzési egység esetében a csoportmenedzser és a csoportvezető ugyanaz a személy lehet.

  • Projektvezető: Egy adott adatelemzési projekt egyes adatelemzőinek napi tevékenységeit kezeli.

  • Egyéni közreműködők: Adattudósok, üzleti elemzők, adatmérnökök, építészek és más adatelemzési projekteket végrehajtó személyek.

Feljegyzés

A vállalat szerkezetétől és méretétől függően egyetlen személy több szerepkörrel is rendelkezhet, vagy egynél több személy tölthet be egy szerepkört.

A négy szerepkör feladatai

Az alábbi ábrán az egyes TDSP-szerepkörök legfelső szintű feladatai láthatók. Ez az áttekintés és az egyes TDSP-szerepkörök tevékenységeinek alábbi részletes vázlata segíthet kiválasztani a szükséges oktatóanyagot a feladatai alapján.

Diagram that shows an overview of the roles and tasks.

Csoportmenedzseri feladatok

A csoportmenedzser vagy a kijelölt TDSP-rendszergazda a következő feladatokat hajtja végre a TDSP bevezetéséhez:

  • Létrehoz egy Azure DevOps-szervezetet és egy csoportprojektet a szervezeten belül.

  • Létrehoz egy projektsablon-adattárat az Azure DevOps-csoport projektjében, és a Microsoft TDSP csapata által kifejlesztett projektsablon-adattárból magozza. A Microsoft TDSP-projektsablon-adattár a következőt biztosítja:

    • Szabványosított címtárstruktúra, beleértve az adatok, kódok és dokumentumok könyvtárait.
    • Szabványosított dokumentumsablonok halmaza, amely hatékony adatelemzési folyamatot mutat be.
  • Létrehoz egy segédprogram-adattárat, amelyet a Microsoft TDSP csapata által kifejlesztett segédprogram-adattárból hoz létre. A Microsoft TDSP segédprogram-adattára hasznos segédprogramok készletét biztosítja az adattudósok munkájának hatékonyabbá tétele érdekében. A Microsoft segédprogram-adattára interaktív adatfeltárási, elemzési, jelentéskészítési és alapkonfigurációs modellezési és jelentéskészítési segédprogramokat tartalmaz.

  • Beállítja a szervezeti fiók biztonsági vezérlési szabályzatát .

További információ: Csoportmenedzseri feladatok egy adatelemzési csapat számára.

Csapatvezetői feladatok

A csapatvezető vagy egy kijelölt projektadminisztrátor a következő feladatokat hajtja végre a TDSP bevezetéséhez:

  • Csoportprojektet hoz létre a csoport Azure DevOps-szervezetében.

  • Létrehozza a projektsablon-adattárat a projektben, és a csoportmenedzser vagy delegált által beállított csoportprojektsablon-adattárból hozza létre.

  • Létrehozza a csoport segédprogram-adattárát, magozza a csoport segédprogram-adattárából, és hozzáadja a csoportspecifikus segédprogramokat az adattárhoz.

  • Ha szeretné, létrehozhat azure-fájltárolót, hogy hasznos adategységeket tároljon a csapat számára. A többi csapattag csatlakoztathatja ezt a megosztott felhőbeli fájltárolót az elemzési asztalaikra.

  • Opcionálisan csatlakoztatja az Azure-fájltárolót a csapat adatelemzési virtuális gépére, és hozzáadja a csapat adategységeit.

  • Beállítja a biztonsági vezérlést a csapattagok hozzáadásával és az engedélyek konfigurálásával.

További információ: Csapatvezetői feladatok egy adatelemzési csapat számára.

Projektvezetési tevékenységek

A projektvezető a következő feladatokat hajtja végre a TDSP bevezetéséhez:

  • Létrehoz egy projektadattárat a csapatprojektben, és a projektsablon-adattárból magozza.

  • Igény szerint létrehoz egy Azure-fájltárolót a projekt adategységeinek tárolásához.

  • Opcionálisan csatlakoztatja az Azure-fájltárolót az adatelemzési virtuális géphez , és hozzáadja hozzá a projektadat-objektumokat.

  • A biztonsági vezérlés beállítása a projekttagok hozzáadásával és az engedélyük konfigurálásával.

További információ: Project lead tasks for a data science team.

Egyéni közreműködői tevékenységek projektje

A projekt egyéni közreműködője, általában adatelemző, a következő feladatokat végzi a TDSP használatával:

  • Klónozza a projekt érdeklődője által beállított projektadattárat .

  • Opcionálisan csatlakoztatja a megosztott csapatot és az Azure-fájltárolót az adatelemzési virtuális gépükre.

  • Végrehajtja a projektet.

További információ: Project individual contributor tasks for a data science team.

Adatelemzési projekt végrehajtási munkafolyamata

Az adattudósok, a projektvezetők és a csapatvezetők munkaelemeket hozhatnak létre a projekt összes tevékenységének és fázisának nyomon követéséhez az elejétől a végéig. Az alábbi ábra a projektvégrehajtás TDSP-munkafolyamatát mutatja be:

Diagram that shows the typical data science project workflow.

A munkafolyamat lépései három tevékenységbe csoportosíthatók:

  • A projektvezetők sprinttervezést végeznek.

  • Az adattudósok munkaelemek kezelésére fejlesztenek összetevőket az ágakon git .

  • A projektvezetők vagy más csapattagok kód-felülvizsgálatokat végeznek, és munkaágakat egyesítenek az elsődleges ággal.

Közreműködők

Ezt a cikket a Microsoft tartja karban. Eredetileg a következő közreműködők írták.

Fő szerző:

A nem nyilvános LinkedIn-profilok megtekintéséhez jelentkezzen be a LinkedInbe.