Lebenszyklus des Team Data Science-Prozesses

Der Team Data Science-Prozess (TDSP) stellt einen Lebenszyklus bereit, den Ihr Team zur Strukturierung Ihrer Data Science-Projekte verwenden kann. Der Lebenszyklus beschreibt die Schritte, die Sie ausführen können, um ein Projekt erfolgreich abzuschließen.

Sie sollten diesen Lebenszyklus verwenden, wenn Sie an einem Data Science-Projekt arbeiten, das Teil einer intelligenten Anwendung ist. Intelligente Anwendungen stellen Machine-Learning- oder KI-Modelle für Predictive Analytics bereit. Sie können diesen Prozess auch für explorative Data Science-Projekte und improvisierte Analyseprojekte verwenden. Bei diesen Projekten müssen Sie jedoch möglicherweise nicht jeden Schritt des Lebenszyklus implementieren.

Ihr Team kann den aufgabenbasierten TDSP mit anderen Data Science-Lebenszyklen kombinieren, z. B. dem branchenübergreifenden Standardprozess für Data Mining (Cross-Industry Standard Process for Data Mining, CRISP-DM), dem Prozess für die Entdeckung von Wissen in Datenbanken (Knowledge Discovery in Databases, KDD) oder auch benutzerdefinierten Prozessen Ihres Unternehmens.

Zweck und Glaubwürdigkeit

Der Zweck des TDSP besteht in der Optimierung und Standardisierung Ihres Ansatzes für Data Science- und KI-Projekte. Microsoft hat diese strukturierte Methodik bereits in Hunderten von Projekten angewendet. Forscher*innen haben den TDSP untersucht und ihre Ergebnisse in peer-geprüfter Literatur veröffentlicht. Das Architektur-Framework des TDSP wurde in vielen Bereichen gründlich getestet und hat sich als effektiv erwiesen.

Fünf Lebenszyklusphasen

Der TDSP-Lebenszyklus besteht aus fünf Hauptphasen, die von Ihrem Team immer wieder wiederholt werden. Diese Phasen umfassen:

Dies ist eine visuelle Darstellung des TDSP-Lebenszyklus:

Diagram that shows the stages of the TDSP lifecycle.

Der TDSP-Lebenszyklus ist eine Folge von Schritten, die Anleitungen für die Erstellung von Vorhersagemodellen bereitstellen. Ihr Team stellt die Vorhersagemodelle in einer Produktionsumgebung bereit, in der Sie intelligente Anwendungen entwickeln möchten. Das Ziel dieses Prozesslebenszyklus besteht darin, ein Data Science-Projekt zu einem klar definierten Endpunkt zu steuern. Data Science ist eine Aufgabe bei Forschung und Entwicklung. Wenn Sie einen gut definierten Prozess für die Kommunikation der Aufgaben an Ihr Team verwenden, verbessern Sie die Erfolgschancen Ihres Data Science-Projekts.

Für jede Phase gibt es einen eigenen Artikel, der Folgendes beschreibt:

  • Ziele: die Ziele der jeweiligen Phase.
  • Vorgehensweise: eine Beschreibung der Aufgaben, die in der jeweiligen Phase ausgeführt werden, und eine Anleitung für ihre Ausführung.
  • Artefakte: die Ergebnisse, die während der jeweiligen Phase erzielt werden müssen, und die Ressourcen, die hierfür verwendet werden können.

Peer-geprüfte Referenzen

Forscher*innen veröffentlichen Peer-geprüfte Literatur zum TDSP. In den folgenden Referenzen finden Sie Informationen zu TDSP-Features und -Anwendungen.

Beitragende

Dieser Artikel wird von Microsoft gepflegt. Er wurde ursprünglich von folgenden Mitwirkenden geschrieben:

Hauptautor:

Melden Sie sich bei LinkedIn an, um nicht öffentliche LinkedIn-Profile anzuzeigen.