Opracowywanie projektów analizy danych

W tym dokumencie opisano sposób, w jaki deweloperzy mogą wykonywać projekt analizy danych w systematyczny, kontrolowanym przez siebie zakresie i współpracy w zespole projektu przy użyciu procesu nauki o danych zespołowych (przetwarzania TDSP). PRZETWARZANIA TDSP to struktura opracowana przez firmę Microsoft, która oferuje strukturalną sekwencję działań do wydajnego wykonywania rozwiązań analizy predykcyjnej opartych na chmurze. Aby zapoznać się z ogólnymi rolami i zadaniami, które są obsługiwane przez zespół ds. analizy danych na przetwarzania TDSP, zobacz temat role i zadania zespołowego procesu nauki danych.

Ten artykuł zawiera instrukcje dotyczące:

  • Wykonaj Planowanie przebiegu dla elementów roboczych związanych z projektem.
  • Dodaj elementy robocze do przebiegów.
  • Utwórz i Użyj szablonu elementu pracy pochodnego Agile , który jest wyrównany do etapów cyklu życia przetwarzania TDSP.

Poniższe instrukcje przedstawiają kroki niezbędne do skonfigurowania środowiska zespołu przetwarzania TDSP przy użyciu Azure Boards i Azure Repos na platformie Azure DevOps. Instrukcje korzystają z usługi Azure DevOps, ponieważ jest to implementacja przetwarzania TDSP w firmie Microsoft. Jeśli grupa używa innej platformy hostingu kodu, zadania lidera zespołu zwykle nie zmieniają się, ale sposób na ukończenie zadań jest inny. Na przykład łączenie elementu pracy z gałęzią git może nie być takie samo w przypadku usługi GitHub, ponieważ jest ona Azure Repos.

Na poniższej ilustracji przedstawiono typowe Planowanie przebiegu, kodowanie i przepływ pracy kontroli źródła dla projektu analizy danych:

Zespołowe przetwarzanie danych dla celów naukowych

Typy elementów roboczych

W środowisku planowania przetwarzania TDSP przebiegu są cztery często używane typy elementów roboczych : funkcje, historie użytkowników, zadania i Błędy. Zaległość wszystkich elementów roboczych jest na poziomie projektu, a nie na poziomie repozytorium git.

Poniżej przedstawiono definicje typów elementów roboczych:

  • Funkcja: funkcja odpowiada zakontraktowaniu projektu. Różne zaangażowanie z klientem to różne funkcje i najlepiej wziąć pod uwagę różne etapy projektu jako różne funkcje. W przypadku wybrania schematu, takiego jak <ClientName>-<EngagementName> nazwa funkcji, można łatwo rozpoznać kontekst projektu i zaangażowania z samych nazw.

  • Scenariusz użycia: historie użytkownika są elementami roboczymi, które są konieczne do zakończenia funkcji. Przykładami scenariuszy użycia są:

    • Pobieranie danych
    • Eksplorowanie danych
    • Generuj funkcje
    • Tworzenie modeli
    • Operacjonalizowanie modeli
    • Ponowne szkolenie modeli
  • Zadanie: zadania są możliwy do przypisania elementy robocze, które należy wykonać w celu ukończenia określonego scenariusza użytkownika. Na przykład zadania w scenariuszu użytkownika pobieranie danych mogą być następujące:

    • Pobierz poświadczenia SQL Server
    • Przekazywanie danych do usługi Azure Synapse Analytics
  • Usterka: usterki są problemy w istniejącym kodzie lub dokumentach, które muszą zostać naprawione, aby można było ukończyć zadanie. Jeśli usterki są spowodowane brakującymi elementami roboczymi, mogą one być eskalacją do scenariuszy użytkownika lub zadań.

Analityki danych mogą być bardziej wygodne przy użyciu szablonu Agile, który zastąpi funkcje, historie użytkownika i zadania z etapami cyklu życia przetwarzania TDSP i podetapami. Aby utworzyć szablon pochodny Agile, który jest zgodny z etapami cyklu życia przetwarzania TDSP, zobacz Korzystanie z szablonu pracy Agile przetwarzania TDSP.

Uwaga

PRZETWARZANIA TDSP pożyczy się pojęciami dotyczącymi funkcji, historii użytkowników, zadań i błędów w ramach zarządzania kodem oprogramowania (SCM). Koncepcje przetwarzania TDSP mogą się nieco różnić od ich tradycyjnych definicji SCM.

Planowanie przebiegów

Wielu analityków danych jest zaangażowanych w wiele projektów, co może potrwać miesiąc i kontynuować w różnych tępy. Planowanie przebiegu jest przydatne w przypadku priorytetyzacji projektów oraz planowania i alokacji zasobów. W Azure Boards można łatwo tworzyć i śledzić elementy robocze oraz zarządzać nimi, a także przeprowadzać Planowanie przebiegu, aby upewnić się, że projekty są przesuwane w oczekiwany sposób.

Aby uzyskać więcej informacji na temat planowania przebiegu, zobacz przebiegi Scrum.

Aby uzyskać więcej informacji o planowaniu przebiegu w Azure Boards, zobacz przypisywanie elementów zaległości do przebiegu.

Dodawanie funkcji do zaległości

Po utworzeniu projektu i repozytorium kodu projektu można dodać funkcję do zaległości, aby reprezentować prace dla projektu.

  1. Na stronie projektu wybierz pozycję płyty > zaległości na lewym pasku nawigacyjnym.

  2. Na karcie zaległości , jeśli typ elementu pracy na górnym pasku to historie, lista rozwijana i wybierz pozycję funkcje. Następnie wybierz pozycję nowy element roboczy.

    Wybierz nowy element roboczy

  3. Wprowadź tytuł dla funkcji, zazwyczaj nazwę projektu, a następnie wybierz pozycję Dodaj do góry.

    Wprowadź tytuł i wybierz pozycję Dodaj do góry

  4. Z listy zaległości wybierz i Otwórz nową funkcję. Wypełnij pola Opis, przypisz członka zespołu i ustaw parametry planowania.

    Możesz również połączyć funkcję z repozytorium kodu Azure Repos projektu, wybierając pozycję Dodaj link w sekcji programowanie .

    Po edytowaniu funkcji wybierz pozycję zapisz & Zamknij.

    Edytuj funkcję i wybierz pozycję Zapisz & Zamknij

Dodawanie scenariusza użytkownika do funkcji

W ramach tej funkcji można dodać historie użytkowników, aby opisać najważniejsze kroki niezbędne do ukończenia projektu.

Aby dodać nową historię użytkownika do funkcji:

  1. Na karcie zaległości wybierz pozycję + z lewej strony funkcji.

    Dodaj nową historię użytkownika w ramach funkcji

  2. Nadaj użytkownikowi tytułowi i edytuj szczegóły, takie jak przypisanie, stan, opis, komentarze, planowanie i priorytet.

    Możesz również połączyć scenariusz użytkownika z gałęzią Azure Repos repozytorium kodu projektu, wybierając pozycję Dodaj link w sekcji programowanie . Wybierz repozytorium i gałąź, do której chcesz połączyć element roboczy, a następnie wybierz przycisk OK.

    Dodaj łącze

  3. Po zakończeniu edycji scenariusza użytkownika wybierz pozycję zapisz & Zamknij.

Dodawanie zadania do scenariusza użytkownika

Zadania są szczegółowymi krokami, które są niezbędne do wykonania każdego scenariusza użytkownika. Po zakończeniu wszystkich zadań ze scenariusza użytkownika należy wykonać również ukończenie scenariusza użytkownika.

Aby dodać zadanie do scenariusza użytkownika, zaznacz + obok elementu scenariusz użytkownika i wybierz zadanie. Wypełnij tytuł i inne informacje w zadaniu.

Dodawanie zadania do scenariusza użytkownika

Po utworzeniu funkcji, historii użytkownika i zadaniach można je wyświetlić w widokach zaległości lub tablice w celu śledzenia ich stanu.

Widok zaległości

Widok tablic

Korzystanie z szablonu pracy przetwarzania TDSP Agile

Analityki danych mogą być bardziej wygodne przy użyciu szablonu Agile, który zastąpi funkcje, historie użytkownika i zadania z etapami cyklu życia przetwarzania TDSP i podetapami. W Azure Boards można utworzyć szablon pochodny Agile, który używa etapów cyklu życia przetwarzania TDSP do tworzenia i śledzenia elementów roboczych. Poniższe kroki przedstawiają Konfigurowanie szablonu procesu Agile specyficznego dla analizy danych i tworzenie elementów roboczych analizy danych opartych na szablonie.

Konfigurowanie szablonu procesu analizy danych Agile

  1. Na stronie głównej organizacji usługi Azure DevOps wybierz pozycję Ustawienia organizacji w obszarze nawigacji po lewej stronie.

  2. W lewym panelu nawigacyjnym Ustawienia organizacji w obszarze płyty wybierz pozycję proces.

  3. W okienku wszystkie procesy wybierz pozycję ... obok metody Agile, a następnie wybierz pozycję Utwórz Dziedziczony proces.

    Utwórz Dziedziczony proces z Agile

  4. W oknie dialogowym Tworzenie dziedziczonego procesu z Agile wprowadź nazwę AgileDataScienceProcess i wybierz pozycję Utwórz proces.

    Utwórz proces AgileDataScienceProcess

  5. We wszystkich procesach wybierz nowy AgileDataScienceProcess.

  6. Na karcie typy elementów roboczych Wyłącz epiku, funkcję, historię użytkownika i zadanie , wybierając pozycję ... obok każdego elementu, a następnie wybierz pozycję Wyłącz.

    Wyłącz typy elementów roboczych

  7. We wszystkich procesach wybierz kartę poziomy zaległości . W obszarze zaległości portfolio wybierz pozycję ... obok pozycji epiku (wyłączone), a następnie wybierz pozycję Edytuj/Zmień nazwę.

  8. W oknie dialogowym Edytowanie poziomu zaległości :

    1. W obszarze Nazwa Zastąp epiku projektami przetwarzania TDSP.
    2. W obszarze typy elementów roboczych na tym poziomie zaległości wybierz pozycję nowy typ elementu pracy, wprowadź projekt przetwarzania TDSP i wybierz pozycję Dodaj.
    3. W obszarze domyślny typ elementu pracy rozwiń listę rozwijaną i wybierz pozycję projekt przetwarzania TDSP.
    4. Wybierz pozycję Zapisz.

    Ustaw poziom zaległości portfolio

  9. Wykonaj te same kroki, aby zmienić nazwy funkcji na etapy przetwarzania TDSP i dodać następujące nowe typy elementów roboczych:

    • Zrozumienie biznesowe
    • Pozyskiwanie danych
    • Modelowanie
    • Wdrożenie
  10. W obszarze zaległości wymagania Zmień nazwy wątków na podetapy przetwarzania TDSP, Dodaj nowy typ elementu pracy przetwarzania TDSP podetapu i ustaw domyślny typ elementu pracy na podetap przetwarzania TDSP.

  11. W obszarze zaległości iteracji Dodaj nowy typ elementu pracy przetwarzania TDSP zadania i ustaw go jako domyślny typ elementu pracy.

Po wykonaniu tych kroków poziomy zaległości powinny wyglądać następująco:

Poziomy zaległości szablonu przetwarzania TDSP

Tworzenie elementów roboczych procesu nauki o danych Agile

Za pomocą szablonu procesu analizy danych można tworzyć projekty przetwarzania TDSP i śledzić elementy robocze, które odpowiadają etapom cyklu życia przetwarzania TDSP.

  1. Na stronie głównej organizacji usługi Azure DevOps wybierz pozycję Nowy projekt.

  2. W oknie dialogowym Utwórz nowy projekt Nadaj projektowi nazwę, a następnie wybierz pozycję Zaawansowane.

  3. W obszarze proces elementu pracy rozwiń listę rozwijaną i wybierz pozycję AgileDataScienceProcess, a następnie wybierz pozycję Utwórz.

    Tworzenie projektu przetwarzania TDSP

  4. W nowo utworzonym projekcie wybierz pozycję płyty > zaległości na lewym pasku nawigacyjnym.

  5. Aby wyświetlić przetwarzania TDSP projekty, wybierz ikonę Konfiguruj ustawienia zespołu . Na ekranie Ustawienia zaznacz pole wyboru projekty przetwarzania TDSP , a następnie wybierz pozycję Zapisz i Zamknij.

    Zaznacz pole wyboru projekty przetwarzania TDSP

  6. Aby utworzyć projekt przetwarzania TDSP specyficzny dla analizy danych, wybierz pozycję projekty przetwarzania TDSP na górnym pasku, a następnie wybierz pozycję nowy element roboczy.

  7. W oknie podręcznym Nadaj nazwę elementowi roboczemu projektu przetwarzania TDSP, a następnie wybierz pozycję Dodaj do góry.

    Utwórz element roboczy projektu analizy danych

  8. Aby dodać element roboczy w ramach projektu przetwarzania TDSP, zaznacz + obok projektu, a następnie wybierz typ elementu pracy do utworzenia.

    Wybierz typ elementu pracy analizy danych

  9. Wypełnij szczegóły w nowym elemencie roboczym, a następnie wybierz pozycję zapisz & Zamknij.

  10. Kontynuuj Wybieranie + symboli obok elementów roboczych, aby dodać nowe etapy przetwarzania TDSP, podetapów i zadań.

Oto przykład sposobu wyświetlania elementów roboczych projektu analizy danych w widoku zaległości :

18

Następne kroki

Programowanie do współpracy przy użyciu narzędzia Git zawiera opis sposobu wykonywania współpracy w zakresie tworzenia kodu dla projektów analizy danych przy użyciu narzędzia Git jako struktury tworzenia kodu współdzielonego oraz sposobu łączenia tych działań kodowania z pracą zaplanowaną z procesem Agile.

W przykładowych przewodnikach przedstawiono wskazówki dotyczące konkretnych scenariuszy, z linkami i opisami miniatur. Połączone scenariusze ilustrują sposób łączenia narzędzi i usług w chmurze i lokalnych z przepływami pracy lub potokami w celu tworzenia inteligentnych aplikacji.

Dodatkowe zasoby dotyczące procesów Agile: