Takım Veri Bilimi İşlemindeki roller ve görevler
Team Veri Bilimi Process (TDSP), Microsoft tarafından geliştirilen ve tahmine dayalı analiz çözümlerini ve akıllı uygulamaları verimli bir şekilde oluşturmak için yapılandırılmış bir metodoloji sağlayan bir çerçevedir. Bu makalede, bu süreci standartlaştıran bir veri bilimi ekibi için temel personel rolleri ve ilişkili görevler özetlenmiştir.
Azure Machine Learning'de depolanan MLflow yapıtlarını desteklemek için Git uyumlu bir ortam önerilir. Azure Machine Learning , Git depolarıyla tümleştirilir, böylece GitHub, GitLab, Bitbucket, Azure DevOps veya diğer Git uyumlu hizmetler gibi git uyumlu birçok hizmeti kullanabilirsiniz.
Veri bilimi gruplarının ve ekiplerinin yapısı
Kuruluşlardaki veri bilimi işlevleri genellikle aşağıdaki hiyerarşide düzenlenir:
- Veri bilimi grubu
- Grup içindeki veri bilimi ekipleri
Böyle bir yapıda grup liderleri ve ekip liderleri vardır. Genellikle veri bilimi ekibi bir veri bilimi projesi yürütür. Veri bilimi ekiplerinin proje yönetimi ve idare görevleri için proje liderleri ve projenin veri bilimi ve veri mühendisliği bölümlerini gerçekleştirmek için tek tek veri bilimciler ve mühendisleri vardır. İlk proje kurulumunu ve idaresini grup, ekip veya proje liderleri gerçekleştirir.
Dört TDSP rolü için tanım ve görevler
Veri bilimi biriminin bir grup içindeki ekiplerden oluştuğu varsayımıyla, TDSP personeli için dört ayrı rol vardır:
Grup yöneticisi: Bir kuruluştaki veri bilimi biriminin tamamını yönetir. Veri bilimi biriminin, her biri farklı iş alanlarındaki birden çok veri bilimi projesi üzerinde çalışan birden çok ekibi olabilir. Bir grup yöneticisi görevlerini vekile devredebilir, ancak rolle ilişkili görevler değişmez.
Ekip lideri: Bir kuruluşun veri bilimi birimindeki bir ekibi yönetir. Bir ekip, veri bilim adamlarından oluşur. Küçük bir veri bilimi birimi için grup yöneticisi ve ekip lideri aynı kişi olabilir.
Proje lideri: Belirli bir veri bilimi projesindeki tek tek veri bilimciler için günlük etkinlikleri yönetir.
Projede bireysel katkıda bulunanlar: Veri bilimcileri, iş analistleri, veri mühendisleri, mimarlar ve veri bilimi projesi yürüten diğerleri.
Not
Bir kuruluşun yapısına ve boyutuna bağlı olarak, tek bir kişinin birden fazla rolü olabilir veya birden fazla kişi bir rolü doldurabilir.
Dört rol için görevler
Aşağıdaki diyagramda her TDSP rolü için üst düzey görevler gösterilmektedir. Bu genel bakış ve her TDSP rolü için aşağıdaki ayrıntılı görev ana hattı, sorumluluklarınıza göre ihtiyacınız olan öğreticiyi seçmenize yardımcı olabilir.
Grup yöneticisi görevleri
Grup yöneticisi veya belirlenmiş bir TDSP sistem yöneticisi, TDSP'yi benimsemek için aşağıdaki görevleri tamamlar:
Bir Azure DevOps kuruluşu ve kuruluş içinde bir grup projesi oluşturur.
Azure DevOps grup projesinde bir proje şablonu deposu oluşturur ve bunu Microsoft TDSP ekibi tarafından geliştirilen proje şablonu deposundan tohumlar. Microsoft TDSP proje şablonu deposu aşağıdakileri sağlar:
- Veri , kod ve belgeler için dizinler de dahil olmak üzere standartlaştırılmış dizin yapısı.
- Verimli bir veri bilimi sürecine yol gösteren standartlaştırılmış belge şablonları kümesi.
Bir yardımcı program deposu oluşturur ve bunu Microsoft TDSP ekibi tarafından geliştirilen yardımcı program deposundan tohumlar. Microsoft'un TDSP yardımcı programı deposu, bir veri bilimcisinin çalışmasını daha verimli hale getirmek için bir dizi yararlı yardımcı program sağlar. Microsoft yardımcı programı deposu etkileşimli veri keşfi, analiz, raporlama ve temel modelleme ve raporlama için yardımcı programlar içerir.
Kuruluş hesabı için güvenlik denetimi ilkesini ayarlar.
Daha fazla bilgi için bkz . Veri bilimi ekibi için grup yöneticisi görevleri.
Ekip lideri görevleri
Ekip lideri veya belirlenen proje yöneticisi, TDSP'yi benimsemek için aşağıdaki görevleri tamamlar:
Grubun Azure DevOps kuruluşunda bir ekip projesi oluşturur.
Projede proje şablonu deposunu oluşturur ve grup yöneticisi veya temsilci tarafından ayarlanan grup projesi şablonu deposundan bunu tohumlar.
Ekip yardımcı programı deposunu oluşturur, grup yardımcı programı deposundan tohumlar ve depoya takıma özgü yardımcı programlar ekler.
İsteğe bağlı olarak, ekip için yararlı veri varlıklarını depolamak için Azure dosya depolama alanı oluşturur. Diğer ekip üyeleri bu paylaşılan bulut dosya depolarını analiz masaüstlerine bağlayabilir.
İsteğe bağlı olarak Azure dosya depolama alanını ekibin veri bilimi sanal makinesine bağlar ve takım veri varlıklarını ekler.
Ekip üyelerini ekleyerek ve izinlerini yapılandırarak güvenlik denetimini ayarlar.
Daha fazla bilgi için bkz . Veri bilimi ekibi için ekip lideri görevleri.
Proje müşteri adayı görevleri
Proje lideri, TDSP'yi benimsemek için aşağıdaki görevleri tamamlar:
Takım projesinde bir proje deposu oluşturur ve bunu proje şablonu deposundan tohumlar.
İsteğe bağlı olarak projenin veri varlıklarını depolamak için Azure dosya depolama alanı oluşturur.
İsteğe bağlı olarak Azure dosya depolama alanını veri bilimi sanal makinesine bağlar ve buna proje veri varlıkları ekler.
Proje üyelerini ekleyerek ve izinlerini yapılandırarak güvenlik denetimini ayarlar.
Daha fazla bilgi için bkz . Veri bilimi ekibi için proje lideri görevleri.
Tek tek katkıda bulunan görevleri projele
Genellikle veri bilimcisi olan proje katılımcısı, TDSP'yi kullanarak aşağıdaki görevleri yürütür:
Proje sorumlusu tarafından ayarlanan proje deposunu klonlar.
İsteğe bağlı olarak paylaşılan ekibi bağlar ve Azure dosya depolama alanını veri bilimi sanal makinesine ekler.
Projeyi yürütür.
Daha fazla bilgi için bkz . Veri bilimi ekibi için bireysel katkıda bulunan görevleri yansıtma.
Veri bilimi projesi yürütme iş akışı
Veri bilimciler, proje müşteri adayları ve ekip liderleri, projenin tüm görevlerini ve aşamalarını baştan sona izlemek için iş öğeleri oluşturabilir. Aşağıdaki şekilde proje yürütme için TDSP iş akışı özetlenmiştir:
İş akışı adımları üç etkinlik halinde gruplandırılabilir:
Proje liderleri sprint planlaması yürütür.
Veri bilimciler, iş öğelerini ele almak için dallarda
git
yapıtlar geliştirir.Proje liderleri veya diğer ekip üyeleri kod incelemeleri yapar ve çalışma dallarını birincil dalla birleştirir.
Katkıda Bulunanlar
Bu makale Microsoft tarafından yönetilir. Başlangıçta aşağıdaki katkıda bulunanlar tarafından yazılmıştır.
Asıl yazar:
- Mark Tabladillo | Üst Düzey Bulut Çözümü Mimarı
Genel olmayan LinkedIn profillerini görmek için LinkedIn'de oturum açın.
İlgili kaynaklar
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin