Takım Veri Bilimi İşlemindeki roller ve görevler

Team Veri Bilimi Process (TDSP), Microsoft tarafından geliştirilen ve tahmine dayalı analiz çözümlerini ve akıllı uygulamaları verimli bir şekilde oluşturmak için yapılandırılmış bir metodoloji sağlayan bir çerçevedir. Bu makalede, bu süreci standartlaştıran bir veri bilimi ekibi için temel personel rolleri ve ilişkili görevler özetlenmiştir.

Azure Machine Learning'de depolanan MLflow yapıtlarını desteklemek için Git uyumlu bir ortam önerilir. Azure Machine Learning , Git depolarıyla tümleştirilir, böylece GitHub, GitLab, Bitbucket, Azure DevOps veya diğer Git uyumlu hizmetler gibi git uyumlu birçok hizmeti kullanabilirsiniz.

Veri bilimi gruplarının ve ekiplerinin yapısı

Kuruluşlardaki veri bilimi işlevleri genellikle aşağıdaki hiyerarşide düzenlenir:

  • Veri bilimi grubu
  • Grup içindeki veri bilimi ekipleri

Böyle bir yapıda grup liderleri ve ekip liderleri vardır. Genellikle veri bilimi ekibi bir veri bilimi projesi yürütür. Veri bilimi ekiplerinin proje yönetimi ve idare görevleri için proje liderleri ve projenin veri bilimi ve veri mühendisliği bölümlerini gerçekleştirmek için tek tek veri bilimciler ve mühendisleri vardır. İlk proje kurulumunu ve idaresini grup, ekip veya proje liderleri gerçekleştirir.

Dört TDSP rolü için tanım ve görevler

Veri bilimi biriminin bir grup içindeki ekiplerden oluştuğu varsayımıyla, TDSP personeli için dört ayrı rol vardır:

  • Grup yöneticisi: Bir kuruluştaki veri bilimi biriminin tamamını yönetir. Veri bilimi biriminin, her biri farklı iş alanlarındaki birden çok veri bilimi projesi üzerinde çalışan birden çok ekibi olabilir. Bir grup yöneticisi görevlerini vekile devredebilir, ancak rolle ilişkili görevler değişmez.

  • Ekip lideri: Bir kuruluşun veri bilimi birimindeki bir ekibi yönetir. Bir ekip, veri bilim adamlarından oluşur. Küçük bir veri bilimi birimi için grup yöneticisi ve ekip lideri aynı kişi olabilir.

  • Proje lideri: Belirli bir veri bilimi projesindeki tek tek veri bilimciler için günlük etkinlikleri yönetir.

  • Projede bireysel katkıda bulunanlar: Veri bilimcileri, iş analistleri, veri mühendisleri, mimarlar ve veri bilimi projesi yürüten diğerleri.

Not

Bir kuruluşun yapısına ve boyutuna bağlı olarak, tek bir kişinin birden fazla rolü olabilir veya birden fazla kişi bir rolü doldurabilir.

Dört rol için görevler

Aşağıdaki diyagramda her TDSP rolü için üst düzey görevler gösterilmektedir. Bu genel bakış ve her TDSP rolü için aşağıdaki ayrıntılı görev ana hattı, sorumluluklarınıza göre ihtiyacınız olan öğreticiyi seçmenize yardımcı olabilir.

Diagram that shows an overview of the roles and tasks.

Grup yöneticisi görevleri

Grup yöneticisi veya belirlenmiş bir TDSP sistem yöneticisi, TDSP'yi benimsemek için aşağıdaki görevleri tamamlar:

  • Bir Azure DevOps kuruluşu ve kuruluş içinde bir grup projesi oluşturur.

  • Azure DevOps grup projesinde bir proje şablonu deposu oluşturur ve bunu Microsoft TDSP ekibi tarafından geliştirilen proje şablonu deposundan tohumlar. Microsoft TDSP proje şablonu deposu aşağıdakileri sağlar:

    • Veri , kod ve belgeler için dizinler de dahil olmak üzere standartlaştırılmış dizin yapısı.
    • Verimli bir veri bilimi sürecine yol gösteren standartlaştırılmış belge şablonları kümesi.
  • Bir yardımcı program deposu oluşturur ve bunu Microsoft TDSP ekibi tarafından geliştirilen yardımcı program deposundan tohumlar. Microsoft'un TDSP yardımcı programı deposu, bir veri bilimcisinin çalışmasını daha verimli hale getirmek için bir dizi yararlı yardımcı program sağlar. Microsoft yardımcı programı deposu etkileşimli veri keşfi, analiz, raporlama ve temel modelleme ve raporlama için yardımcı programlar içerir.

  • Kuruluş hesabı için güvenlik denetimi ilkesini ayarlar.

Daha fazla bilgi için bkz . Veri bilimi ekibi için grup yöneticisi görevleri.

Ekip lideri görevleri

Ekip lideri veya belirlenen proje yöneticisi, TDSP'yi benimsemek için aşağıdaki görevleri tamamlar:

  • Grubun Azure DevOps kuruluşunda bir ekip projesi oluşturur.

  • Projede proje şablonu deposunu oluşturur ve grup yöneticisi veya temsilci tarafından ayarlanan grup projesi şablonu deposundan bunu tohumlar.

  • Ekip yardımcı programı deposunu oluşturur, grup yardımcı programı deposundan tohumlar ve depoya takıma özgü yardımcı programlar ekler.

  • İsteğe bağlı olarak, ekip için yararlı veri varlıklarını depolamak için Azure dosya depolama alanı oluşturur. Diğer ekip üyeleri bu paylaşılan bulut dosya depolarını analiz masaüstlerine bağlayabilir.

  • İsteğe bağlı olarak Azure dosya depolama alanını ekibin veri bilimi sanal makinesine bağlar ve takım veri varlıklarını ekler.

  • Ekip üyelerini ekleyerek ve izinlerini yapılandırarak güvenlik denetimini ayarlar.

Daha fazla bilgi için bkz . Veri bilimi ekibi için ekip lideri görevleri.

Proje müşteri adayı görevleri

Proje lideri, TDSP'yi benimsemek için aşağıdaki görevleri tamamlar:

  • Takım projesinde bir proje deposu oluşturur ve bunu proje şablonu deposundan tohumlar.

  • İsteğe bağlı olarak projenin veri varlıklarını depolamak için Azure dosya depolama alanı oluşturur.

  • İsteğe bağlı olarak Azure dosya depolama alanını veri bilimi sanal makinesine bağlar ve buna proje veri varlıkları ekler.

  • Proje üyelerini ekleyerek ve izinlerini yapılandırarak güvenlik denetimini ayarlar.

Daha fazla bilgi için bkz . Veri bilimi ekibi için proje lideri görevleri.

Tek tek katkıda bulunan görevleri projele

Genellikle veri bilimcisi olan proje katılımcısı, TDSP'yi kullanarak aşağıdaki görevleri yürütür:

  • Proje sorumlusu tarafından ayarlanan proje deposunu klonlar.

  • İsteğe bağlı olarak paylaşılan ekibi bağlar ve Azure dosya depolama alanını veri bilimi sanal makinesine ekler.

  • Projeyi yürütür.

Daha fazla bilgi için bkz . Veri bilimi ekibi için bireysel katkıda bulunan görevleri yansıtma.

Veri bilimi projesi yürütme iş akışı

Veri bilimciler, proje müşteri adayları ve ekip liderleri, projenin tüm görevlerini ve aşamalarını baştan sona izlemek için iş öğeleri oluşturabilir. Aşağıdaki şekilde proje yürütme için TDSP iş akışı özetlenmiştir:

Diagram that shows the typical data science project workflow.

İş akışı adımları üç etkinlik halinde gruplandırılabilir:

  • Proje liderleri sprint planlaması yürütür.

  • Veri bilimciler, iş öğelerini ele almak için dallarda git yapıtlar geliştirir.

  • Proje liderleri veya diğer ekip üyeleri kod incelemeleri yapar ve çalışma dallarını birincil dalla birleştirir.

Katkıda Bulunanlar

Bu makale Microsoft tarafından yönetilir. Başlangıçta aşağıdaki katkıda bulunanlar tarafından yazılmıştır.

Asıl yazar:

Genel olmayan LinkedIn profillerini görmek için LinkedIn'de oturum açın.