Azure KI-Leitfaden für Predictive Maintenance-LösungenAzure AI guide for predictive maintenance solutions

ZusammenfassungSummary

Predictive Maintenance (PdM) ist eine beliebte Anwendung aus dem Predictive Analytics-Bereich, mit der Unternehmen verschiedener Branchen eine hohe Ressourcennutzung und Einsparungen bei den Betriebskosten erzielen können.Predictive maintenance (PdM) is a popular application of predictive analytics that can help businesses in several industries achieve high asset utilization and savings in operational costs. In diesem Leitfaden sind die geschäftlichen und analysebezogenen Richtlinien sowie die bewährten Methoden zusammengefasst, die für eine erfolgreiche Entwicklung und Bereitstellung von PdM-Lösungen über die Technologie der Microsoft Azure KI-Plattform eingesetzt werden.This guide brings together the business and analytical guidelines and best practices to successfully develop and deploy PdM solutions using the Microsoft Azure AI platform technology.

Zunächst werden in diesem Leitfaden branchenspezifische Geschäftsszenarien und der Prozess zur Qualifizierung dieser Szenarien für PdM vorgestellt.For starters, this guide introduces industry-specific business scenarios and the process of qualifying these scenarios for PdM. Außerdem werden die Datenanforderungen und Modellierungsverfahren für die Erstellung von PdM-Lösungen beschrieben.The data requirements and modeling techniques to build PdM solutions are also provided. Der Schwerpunkt des Leitfadens liegt auf dem Data Science-Prozess, der Schritte wie die Datenaufbereitung, Featureentwicklung, Modellerstellung und Modelloperationalisierung umfasst.The main content of the guide is on the data science process - including the steps of data preparation, feature engineering, model creation, and model operationalization. Als Ergänzung zu diesen wichtigen Konzepten ist in diesem Leitfaden ein Satz mit Lösungsvorlagen angegeben, die zur Beschleunigung bei der Entwicklung von PdM-Anwendungen dienen.To complement these key concepts, this guide lists a set of solution templates to help accelerate PdM application development. Zudem wird im Leitfaden auf nützliche Schulungsressourcen für die Praxis verwiesen, die weitere Informationen zu KI im Hintergrund der Data Science-Komponenten enthalten.The guide also points to useful training resources for the practitioner to learn more about the AI behind the data science.

Data Science-Leitfaden – Übersicht und ZielgruppeData Science guide overview and target audience

In der ersten Hälfte dieses Leitfadens werden typische geschäftliche Probleme und die Vorteile der PdM-Implementierung zur Behebung dieser Probleme beschrieben und häufige Anwendungsfälle aufgeführt.The first half of this guide describes typical business problems, the benefits of implementing PdM to address these problems, and lists some common use cases. Diese Inhalte sind für Personen hilfreich, die in Unternehmen geschäftliche Entscheidungen treffen (Business Decision Makers, BDMs).Business decision makers (BDMs) will benefit from this content. Im zweiten Teil wird die Data Science-Technologie beschrieben, auf der PdM basiert, und eine Liste mit PdM-Lösungen bereitgestellt, die anhand der in diesem Leitfaden beschriebenen Prinzipien erstellt wurden.The second half explains the data science behind PdM, and provides a list of PdM solutions built using the principles outlined in this guide. Außerdem sind Lernpfade und Verweise auf Schulungsmaterial angegeben.It also provides learning paths and pointers to training material. Diese Inhalte sind für Personen hilfreich, die in Unternehmen technische Entscheidungen treffen (Technical Decision Makers, TDMs).Technical decision makers (TDMs) will find this content useful.

Empfohlener AbschnittStart with ... ZielgruppeIf you are ...
Business Case für Predictive MaintenanceBusiness case for predictive maintenance Business Decision Makers (BDMs), die Ausfallzeiten und Betriebskosten senken und die Nutzungsdauer der Ausrüstung verbessern möchtena business decision maker (BDM) looking to reduce downtime and operational costs, and improve utilization of equipment
Data Science für Predictive MaintenanceData Science for predictive maintenance Technical Decision Makers (TDMs), die die PdM-Technologie evaluieren, um die einzigartigen Datenverarbeitungs- und KI-Anforderungen in Bezug auf Predictive Maintenance zu verstehena technical decision maker (TDM) evaluating PdM technologies to understand the unique data processing and AI requirements for predictive maintenance
Lösungsvorlagen für Predictive MaintenanceSolution templates for predictive maintenance Softwarearchitekten oder KI-Entwickler, die in kurzer Zeit eine Demo oder ein Proof-of-Concept-Dokument erstellen möchtena software architect or AI Developer looking to quickly stand up a demo or a proof-of-concept
Schulungsressourcen für Predictive MaintenanceTraining resources for predictive maintenance Alle obigen Personen, die sich über die Grundlagen der Data Science-Technologie, Tools und Verfahren informieren möchtenany or all of the above, and want to learn the foundational concepts behind the data science, tools, and techniques.

VorkenntnissePrerequisite knowledge

In Bezug auf die BDM-Inhalte wird nicht vorausgesetzt, dass der Leser bereits über Data Science-Vorkenntnisse verfügt.The BDM content does not expect the reader to have any prior data science knowledge. In Bezug auf die TDM-Inhalte sind Grundkenntnisse in den Bereichen Statistik und Data Science hilfreich.For the TDM content, basic knowledge of statistics and data science is helpful. Kenntnisse in den Bereichen Azure-Daten- und KI-Dienste, Python, R, XML und JSON sind empfehlenswert.Knowledge of Azure Data and AI services, Python, R, XML, and JSON is recommended. KI-Verfahren werden in Form von Python- und R-Paketen implementiert.AI techniques are implemented in Python and R packages. Lösungsvorlagen werden mithilfe von Azure-Diensten, Entwicklungstools und SDKs implementiert.Solution templates are implemented using Azure services, development tools, and SDKs.

Business Case für Predictive MaintenanceBusiness case for predictive maintenance

Für Unternehmen ist es erforderlich, dass die kritische Ausrüstung mit der bestmöglichen Effizienz und Auslastung betrieben wird, damit sich die getätigten Investitionen rentieren.Businesses require critical equipment to be running at peak efficiency and utilization to realize their return on capital investments. Bei diesen Ressourcen kann es sich um Flugzeugtriebwerke, Turbinen, Aufzüge oder Industriekühlanlagen, für die die Kosten im Millionenbereich liegen, oder auch um Alltagsgeräte wie Fotokopierer, Kaffeemaschinen oder Wasserkühler handeln.These assets could range from aircraft engines, turbines, elevators, or industrial chillers - that cost millions - down to everyday appliances like photocopiers, coffee machines, or water coolers.

  • Standardmäßig nutzen die meisten Unternehmen den Ansatz der Instandsetzung, bei dem Teile ausgetauscht werden, wenn sie kaputtgehen.By default, most businesses rely on corrective maintenance, where parts are replaced as and when they fail. Mit der Instandsetzung wird sichergestellt, dass die Lebensdauer der Teile vollständig genutzt wird (und keine Restnutzungszeit verschenkt wird), aber für das Unternehmen fallen Stillstandszeiten, Arbeitszeit und ungeplanter Wartungsaufwand an (zu ungewöhnlichen Zeiten oder an schwer erreichbaren Standorten).Corrective maintenance ensures parts are used completely (therefore not wasting component life), but costs the business in downtime, labor, and unscheduled maintenance requirements (off hours, or inconvenient locations).
  • Die nächsthöhere Ebene für Unternehmen ist die vorbeugende Wartung, bei der die Lebensdauer eines Teils bestimmt wird und vor einem Ausfall eine Wartung oder ein Austausch durchgeführt wird.At the next level, businesses practice preventive maintenance, where they determine the useful lifespan for a part, and maintain or replace it before a failure. Durch die vorbeugende Wartung werden ungeplante und zu Katastrophen führende Ausfälle vermieden.Preventive maintenance avoids unscheduled and catastrophic failures. Die hohen Kosten für geplante Stillstandszeiten, eine zu geringe Ausnutzung der Lebensdauer von Komponenten und der Aufwand an Arbeitszeit lassen sich hierdurch aber nicht beseitigen.But the high costs of scheduled downtime, under-utilization of the component before its full lifetime of use, and labor still remain.
  • Das Ziel von Predictive Maintenance besteht darin, eine optimale Balance zwischen der Instandsetzung und der vorbeugenden Wartung zu erzielen, indem ein Just-in-Time-Austausch von Komponenten ermöglicht wird.The goal of predictive maintenance is to optimize the balance between corrective and preventative maintenance, by enabling just in time replacement of components. Bei diesem Ansatz werden die Komponenten nur ausgetauscht, wenn ein Ausfall kurz bevorsteht.This approach only replaces those components when they are close to a failure. Indem die Lebensdauer von Komponenten (im Vergleich zur vorbeugenden Wartung) verlängert wird und die Kosten für ungeplante Wartung und Arbeitszeit reduziert werden (im Vergleich zur Instandsetzung), können Unternehmen Kosteneinsparungen und Wettbewerbsvorteile erzielen.By extending component lifespans (compared to preventive maintenance) and reducing unscheduled maintenance and labor costs (over corrective maintenance), businesses can gain cost savings and competitive advantages.

Geschäftsprobleme in Bezug auf PdMBusiness problems in PdM

Für Unternehmen besteht ein hohes Betriebsrisiko aufgrund von unerwarteten Ausfällen, und bei komplexen Systemen können die Grundursachen häufig nur sehr eingeschränkt erkannt werden.Businesses face high operational risk due to unexpected failures and have limited insight into the root cause of problems in complex systems. Einige wichtige Aufgaben für Unternehmen sind:Some of the key business questions are:

  • Erkennen von Anomalien bei der Ausrüstung oder der Systemleistung bzw. FunktionalitätDetect anomalies in equipment or system performance or functionality.
  • Vorhersagen des Ausfalls einer Ressource in naher ZukunftPredict whether an asset may fail in the near future.
  • Schätzen der Restlebensdauer einer RessourceEstimate the remaining useful life of an asset.
  • Identifizieren der Grundursachen für den Ausfall einer RessourceIdentify the main causes of failure of an asset.
  • Identifizieren, welche Wartungsaktionen zu welchen Zeitpunkten für eine Ressource durchgeführt werden müssenIdentify what maintenance actions need to be done, by when, on an asset.

Typische Zielsetzungen für PdM sind:Typical goal statements from PdM are:

  • Reduzieren des Betriebsrisikos für unternehmenskritische AusrüstungReduce operational risk of mission critical equipment.
  • Steigern der Rendite für Ressourcen, indem Fehler vor ihrem Auftreten erkannt werdenIncrease rate of return on assets by predicting failures before they occur.
  • Kontrollieren der Wartungskosten durch die Ermöglichung von Just-in-Time-WartungsvorgängenControl cost of maintenance by enabling just-in-time maintenance operations.
  • Reduzieren von Kundenverlusten, Verbessern des Markenimage und Verringern von UmsatzeinbußenLower customer attrition, improve brand image, and lost sales.
  • Verringern der Lagerkosten durch Reduzierung der Lagerbestände, indem der Zeitpunkt der Nachbestellung vorhergesagt wirdLower inventory costs by reducing inventory levels by predicting the reorder point.
  • Erkennen von Grundmustern verschiedener WartungsproblemeDiscover patterns connected to various maintenance problems.
  • Angeben von KPIs (Key Performance Indicators), z.B. Integritätsbewertungen, für den RessourcenzustandProvide KPIs (key performance indicators) such as health scores for asset conditions.
  • Schätzen der Restlebensdauer von RessourcenEstimate remaining lifespan of assets.
  • Empfehlen von rechtzeitigen WartungsaktivitätenRecommend timely maintenance activities.
  • Einrichten eines Just-in-Time-Lagerbestands, indem Bestelldaten für den Austausch von Teilen geschätzt werdenEnable just in time inventory by estimating order dates for replacement of parts.

Diese Zielsetzungen sind die Ausgangspunkte für folgende Personen:These goal statements are the starting points for:

  • Data Scientists, um bestimmte Vorhersageprobleme zu analysieren und zu lösendata scientists to analyze and solve specific predictive problems.
  • Cloudarchitekten und -entwickler, um eine End-to-End-Lösung zu erstellencloud architects and developers to put together an end to end solution.

Qualifizierungsprobleme für Predictive MaintenanceQualifying problems for predictive maintenance

Es ist wichtig, darauf hinzuweisen, dass per Predictive Maintenance nicht alle Anwendungsfälle oder Geschäftsprobleme effektiv gelöst werden können.It is important to emphasize that not all use cases or business problems can be effectively solved by PdM. Es gibt drei wichtige Qualifizierungskriterien, die bei der Problemauswahl berücksichtigt werden müssen:There are three important qualifying criteria that need to be considered during problem selection:

  • Das Problem muss vorhersagbar sein. Das heißt, es muss ein Ziel oder Ergebnis vorhanden sein, das vorhergesagt werden kann.The problem has to be predictive in nature; that is, there should be a target or an outcome to predict. Außerdem sollte für das Problem ein eindeutiger Aktionspfad gelten, mit dem Fehler verhindert werden können, wenn sie erkannt werden.The problem should also have a clear path of action to prevent failures when they are detected.
  • Das Problem sollte einen Datensatz zum Betriebsverlauf der Ausrüstung aufweisen, der sowohl positive als auch negative Ergebnisse enthält.The problem should have a record of the operational history of the equipment that contains both good and bad outcomes. Die Aktionen, die zur Behandlung negativer Ergebnisse durchgeführt werden, sollten im Rahmen dieser Datensätze ebenfalls angegeben sein.The set of actions taken to mitigate bad outcomes should also be available as part of these records. Wichtig sind auch Fehlerberichte, Wartungsprotokolle zum Leistungsabfall, Reparaturprotokolle und Austauschprotokolle.Error reports, maintenance logs of performance degradation, repair, and replace logs are also important. Darüber hinaus sind Angaben zu Reparaturen, die mit dem Ziel der Verbesserung durchgeführt wurden, und Datensätze zu Austauschvorgängen nützlich.In addition, repairs undertaken to improve them, and replacement records are also useful.
  • Der aufgezeichnete Verlauf sollte mit relevanten Daten widergespiegelt werden, deren Qualität ausreichend hoch ist, um als Unterstützung für den Anwendungsfall zu dienen.The recorded history should be reflected in relevant data that is of sufficient enough quality to support the use case. Weitere Informationen zur Relevanz und Eignung der Daten finden Sie unter Datenanforderungen für Predictive Maintenance.For more information about data relevance and sufficiency, see Data requirements for predictive maintenance.
  • Schließlich sollte das Unternehmen auch über Domänenexperten verfügen, denen das jeweilige Problem vollständig klar ist.Finally, the business should have domain experts who have a clear understanding of the problem. Diese Personen sollten mit den internen Prozessen und Methoden vertraut sein, damit der Analyst die Daten verstehen und interpretieren kann.They should be aware of the internal processes and practices to be able to help the analyst understand and interpret the data. Außerdem sollten sie die erforderlichen Änderungen an vorhandenen Geschäftsprozessen vornehmen können, um bei Bedarf die richtigen Daten für die Probleme sammeln zu können.They should also be able to make the necessary changes to existing business processes to help collect the right data for the problems, if needed.

Beispielanwendungsfälle für PdMSample PdM use cases

In diesem Abschnitt geht es um Anwendungsfälle für Predictive Maintenance aus mehreren Branchen, z.B. Luft- und Raumfahrt, Versorgungsunternehmen und Transport.This section focuses on a collection of PdM use cases from several industries such as Aerospace, Utilities, and Transportation. Jeder Abschnitt beginnt mit einem Geschäftsproblem, und anschließend werden die Vorteile von PdM, die für das Geschäftsproblem relevanten Daten und zuletzt die Vorteile einer PdM-Lösung beschrieben.Each section starts with a business problem, and discusses the benefits of PdM, the relevant data surrounding the business problem, and finally the benefits of a PdM solution.

GeschäftsproblemBusiness Problem Vorteile durch PdMBenefits from PdM
LuftfahrtAviation
Flugverspätungen und -ausfälle aufgrund von technischen Problemen.Flight delay and cancellations due to mechanical problems. Fehler, die nicht rechtzeitig behoben werden können, können dazu führen, dass Flüge ausfallen und eine Störung des Zeitplans und Betriebs bewirken.Failures that cannot be repaired in time may cause flights to be canceled, and disrupt scheduling and operations. Mit PdM-Lösungen kann eine Vorhersage getroffen werden, wie hoch die Wahrscheinlichkeit ist, dass der Start eines Flugzeug aufgrund eines technischen Fehlers verzögert wird oder nicht möglich ist.PdM solutions can predict the probability of an aircraft being delayed or canceled due to mechanical failures.
Fehler im Triebwerk eines Flugzeugs: Der Austausch von Teilen eines Flugzeugtriebwerks gehört zu den häufigsten Wartungsaufgaben in der Flugbranche.Aircraft engine parts failure: Aircraft engine part replacements are among the most common maintenance tasks within the airline industry. Bei Wartungslösungen ist eine sorgfältige Verwaltung der Lagerverfügbarkeit, Lieferung und Planung von Bauteilen unerlässlich.Maintenance solutions require careful management of component stock availability, delivery, and planning Die Möglichkeit, Daten zur Zuverlässigkeit von Bauteilen zu sammeln, führt zu einer erheblichen Verringerung der Investitionskosten.Being able to gather intelligence on component reliability leads to substantial reduction on investment costs.
FinanzenFinance
Ausfälle von Geldautomaten sind ein häufiges Problem in der Bankbranche.ATM failure is a common problem within the banking industry. Hierbei besteht das Problem darin, die Wahrscheinlichkeit zu ermitteln, mit der der Abhebevorgang von Geld am Automaten aufgrund eines Papierstaus oder eines Teilefehlers in der Ausgabeeinheit unterbrochen wird.The problem here is to report the probability that an ATM cash withdrawal transaction gets interrupted due to a paper jam or part failure in the cash dispenser. Basierend auf der Vorhersage von Fehlern bei diesen Transaktionen können Geldautomaten proaktiv gewartet werden, um das Auftreten von Fehlern zu verhindern.Based on predictions of transaction failures, ATMs can be serviced proactively to prevent failures from occurring. Anstatt zuzulassen, dass es während einer Transaktion zu einem Fehler im Automaten kommt, wird dieser so programmiert, dass die Transaktion aufgrund der Vorhersage verweigert wird.Rather than allow the machine to fail midway through a transaction, the desirable alternative is to program the machine to deny service based on the prediction.
EnergieversorgungEnergy
Ausfall von Windturbinen: Windturbinen sind in Ländern/Regionen, die auf eine umweltfreundliche Energieerzeugung achten, eine wichtige Energiequelle und mit hohem Investitionsaufwand verbunden.Wind turbine failures: Wind turbines are the main energy source in environmentally responsible countries/regions, and involve high capital costs. Eine Schlüsselkomponente von Windturbinen ist der Generatormotor.A key component in wind turbines is the generator motor. Wenn er ausfällt, kann die Turbine keine Energie mehr liefern.its failure renders the turbine ineffective. Außerdem ist die Reparatur sehr teuer.It is also highly expensive to fix. Durch das Vorhersagen von KPIs, z.B. die mittlere Zeitspanne bis zum Ausfall (Mean Time To Failure, MTTF), können Unternehmen der Windenergiebranche Ausfälle von Turbinen verhindern und die Ausfallzeiten gering halten.Predicting KPIs such as MTTF (mean time to failure) can help the energy companies prevent turbine failures, and ensure minimal downtime. Mit den Ausfallwahrscheinlichkeiten erhalten Techniker Informationen zur Überwachung von Turbinen, die voraussichtlich in Kürze ausfallen, sodass die zeitbasierte Wartung geplant werden kann.Failure probabilities will inform technicians to monitor turbines that are likely to fail soon, and schedule time-based maintenance regimes. Vorhersagemodelle liefern Erkenntnisse zu verschiedenen Faktoren, die zum Ausfall beitragen. Mit diesen Informationen können Techniker die Grundursachen von Problemen besser verstehen.Predictive models provide insights into different factors that contribute to the failure, which helps technicians better understand the root causes of problems.
Ausfälle von Leistungsschutzschaltern: Zur Versorgung von Wohnhäusern und Unternehmen mit Elektrizität müssen Stromleitungen jederzeit betriebsbereit sein, damit der Strom ankommt.Circuit breaker failures: Distribution of electricity to homes and businesses requires power lines to be operational at all times to guarantee energy delivery. Mithilfe von Leitungsschutzschaltern können Schäden an Stromleitungen bei Überlast oder schwierigen Wetterbedingungen eingeschränkt oder vermieden werden.Circuit breakers help limit or avoid damage to power lines during overloading or adverse weather conditions. Das Geschäftsproblem ist hierbei die Vorhersage von Ausfällen der Leistungsschutzschalter.The business problem here is to predict circuit breaker failures. PdM-Lösungen tragen zur Reduzierung von Reparaturkosten bei und verlängern die Lebensdauer von Ausrüstungsteilen, z.B. Leistungsschutzschaltern.PdM solutions help reduce repair costs and increase the lifespan of equipment such as circuit breakers. Sie verbessern die Qualität des Stromnetzwerks, indem unerwartete Fehler und Ausfälle reduziert werden.They help improve the quality of the power network by reducing unexpected failures and service interruptions.
Transport und LogistikTransportation and logistics
Ausfälle von Aufzugtüren: Große Anbieter von Aufzügen stellen einen umfassenden Service für Millionen von weltweit betriebenen Aufzügen bereit.Elevator door failures: Large elevator companies provide a full stack service for millions of functional elevators around the world. Die Hauptanliegen der Kunden sind die Sicherheit, die Zuverlässigkeit und der unterbrechungsfreie Betrieb der Aufzüge.Elevator safety, reliability, and uptime are the main concerns for their customers. Diese Unternehmen verfolgen diese und verschiedene andere Attribute über Sensoren, um Instandsetzungsmaßnahmen und die vorbeugende Wartung zu unterstützen.These companies track these and various other attributes via sensors, to help them with corrective and preventive maintenance. Bei einem Aufzug ist das häufigste Kundenproblem die Fehlfunktion der Aufzugtüren.In an elevator, the most prominent customer problem is malfunctioning elevator doors. Das Geschäftsproblem besteht in diesem Fall darin, eine Knowledge Base-Vorhersageanwendung bereitzustellen, mit der die potenziellen Ursachen von Türausfällen vorhergesagt werden können.The business problem in this case is to provide a knowledge base predictive application that predicts the potential causes of door failures. Aufzüge stellen meist Investitionen mit einer Lebensdauer von 20 bis 30 Jahren dar.Elevators are capital investments for potentially a 20-30 year lifespan. Jeder Verkaufsvorgang ist in der Regel also stark umkämpft, und die Erwartungen an den Service und Support sind hoch.So each potential sale can be highly competitive; hence expectations for service and support are high. Durch Predictive Maintenance können diese Unternehmen in Bezug auf die Produkt- und Serviceangebote einen Wettbewerbsvorteil gegenüber der Konkurrenz erzielen.Predictive maintenance can provide these companies with an advantage over their competitors in their product and service offerings.
Radfehler: Radfehler sind für die Hälfte aller Zugentgleisungen verantwortlich und bedeuten für die globale Bahnverkehrbranche Kosten in Milliardenhöhe.Wheel failures: Wheel failures account for half of all train derailments and cost billions to the global rail industry. Außerdem fördern Radfehler die Abnutzung von Schienen, was so weit gehen kann, dass die Schiene vorzeitig bricht.Wheel failures also cause rails to deteriorate, sometimes causing the rail to break prematurely. Das Brechen von Schienen führt zu katastrophalen Vorfällen, z.B. Entgleisungen.Rail breaks lead to catastrophic events such as derailments. Zur Vermeidung dieser Vorfälle überwachen Bahnunternehmen die Leistung der Räder und tauschen sie vorbeugend aus.To avoid such instances, railways monitor the performance of wheels and replace them in a preventive manner. Das Geschäftsproblem ist hierbei die Vorhersage von Radfehlern.The business problem here is the prediction of wheel failures. Indem Predictive Maintenance auf Räder angewendet wird, kann dafür der Just-in-Time-Austausch erfolgen.Predictive maintenance of wheels will help with just-in-time replacement of wheels
Ausfälle der Türen von U-Bahn-Zügen: Ein Hauptgrund für Verzögerungen im U-Bahn-Betrieb sind Ausfälle der Türen von Zügen.Subway train door failures: A major reason for delays in subway operations is door failures of train cars. Das Geschäftsproblem besteht hierbei darin, den Ausfall der Zugtüren vorherzusagen.The business problem here is to predict train door failures. Wenn ein bevorstehender Türausfall zu einem frühen Zeitpunkt bekannt ist (z.B. die Anzahl von Tagen bis zum Ausfall), kann das Unternehmen den Zeitplan für die Wartung der Zugtüren entsprechend optimieren.Early awareness of a door failure, or the number of days until a door failure, will help the business optimize train door servicing schedules.

Im nächsten Abschnitt sind die Details dazu enthalten, wie Sie die oben beschriebenen PdM-Vorteile realisieren können.The next section gets into the details of how to realize the PdM benefits discussed above.

Data Science für Predictive MaintenanceData Science for predictive maintenance

Dieser Abschnitt enthält allgemeine Richtlinien zu Data Science-Prinzipien und PdM-Methoden.This section provides general guidelines of data science principles and practice for PdM. Die Informationen sollen TDMs, Lösungsarchitekten und Entwicklern ein besseres Verständnis der Voraussetzungen und des Prozesses zum Entwickeln von End-to-End-KI-Anwendungen für PdM ermöglichen.It is intended to help a TDM, solution architect, or a developer understand the prerequisites and process for building end-to-end AI applications for PdM. Sie können beim Lesen dieses Abschnitts auch die Demos und Proof-of-Concept-Vorlagen unter Lösungsvorlagen für Predictive Maintenance nutzen.You can read this section along with a review of the demos and proof-of-concept templates listed in Solution Templates for predictive maintenance. Anschließend können Sie diese Prinzipien und bewährten Methoden verwenden, um Ihre PdM-Lösung in Azure zu implementieren.You can then use these principles and best practices to implement your PdM solution in Azure.

Hinweis

Ziel dieses Leitfadens ist es NICHT, den Leser in Bezug auf Data Science zu schulen.This guide is NOT intended to teach the reader Data Science. Im Abschnitt Schulungsressourcen für Predictive Maintenance finden Sie mehrere hilfreiche Quellen mit weiterem Lesematerial.Several helpful sources are provided for further reading in the section for training resources for predictive maintenance. Mit den in diesem Leitfaden angegebenen Lösungsvorlagen werden einige dieser KI-Verfahren für bestimmte PdM-Probleme veranschaulicht.The solution templates listed in the guide demonstrate some of these AI techniques for specific PdM problems.

Datenanforderungen für Predictive MaintenanceData requirements for predictive maintenance

Der Lernerfolg hängt stets von (a) der Qualität des Lerninhalts und (b) von den Fähigkeiten des Lernenden ab.The success of any learning depends on (a) the quality of what is being taught, and (b) the ability of the learner. Bei Vorhersagemodellen werden die Muster von Verlaufsdaten erlernt und zukünftige Ergebnisse basierend auf den beobachteten Mustern mit einer bestimmten Wahrscheinlichkeit vorhergesagt.Predictive models learn patterns from historical data, and predict future outcomes with certain probability based on these observed patterns. Die Vorhersagegenauigkeit eines Modells richtet sich nach der Relevanz, dem Umfang und der Qualität der Trainings- und Testdaten.A model's predictive accuracy depends on the relevancy, sufficiency, and quality of the training and test data. Die neuen Daten, die mit diesem Modell „bewertet“ werden, sollten über die gleichen Features und Schemas wie die Trainings- bzw. Testdaten verfügen.The new data that is 'scored' using this model should have the same features and schema as the training/test data. Die Featuremerkmale (Typ, Dichte, Verteilung usw.) der neuen Daten sollten mit den Merkmalen der Trainings- und Testdatasets übereinstimmen.The feature characteristics (type, density, distribution, and so on) of new data should match that of the training and test data sets. Der Schwerpunkt dieses Abschnitts liegt auf diesen Datenanforderungen.The focus of this section is on such data requirements.

Relevante DatenRelevant data

Erstens müssen die Daten für das Problem relevant sein.First, the data has to be relevant to the problem. Nehmen Sie den oben beschriebenen Anwendungsfall mit dem Radfehler als Beispiel. Die Trainingsdaten sollten Features in Bezug auf den Radbetrieb enthalten.Consider the wheel failure use case discussed above - the training data should contain features related to the wheel operations. Falls das Problem darin besteht, den Ausfall des Traktionssystems vorherzusagen, müssen die Trainingsdaten alle unterschiedlichen Komponenten des Traktionssystems abdecken.If the problem was to predict the failure of the traction system, the training data has to encompass all the different components for the traction system. Im ersten Fall geht es um eine bestimmte Komponente, während es im zweiten Fall um den Ausfall eines größeren Subsystems geht.The first case targets a specific component whereas the second case targets the failure of a larger subsystem. Die allgemeine Empfehlung lautet, Vorhersagesysteme für bestimmte Komponenten zu entwerfen, anstatt größere Subsysteme, da Letztere über stärker verteilte Daten verfügen.The general recommendation is to design prediction systems about specific components rather than larger subsystems, since the latter will have more dispersed data. Der Domänenexperte (siehe Qualifizierungsprobleme für Predictive Maintenance) sollte dabei behilflich sein, die relevantesten Teilmengen der Daten für die Analyse auszuwählen.The domain expert (see Qualifying problems for predictive maintenance) should help in selecting the most relevant subsets of data for the analysis. Die relevanten Datenquellen sind unter Datenaufbereitung für Predictive Maintenance ausführlicher beschrieben.The relevant data sources are discussed in greater detail in Data preparation for predictive maintenance.

Ausreichende DatenSufficient data

Zwei Fragen werden im Hinblick auf historische Fehlerdaten gestellt: (1) „Wie viele Fehlerereignisse sind zum Trainieren eines Modells erforderlich?“Two questions are commonly asked with regard to failure history data: (1) "How many failure events are required to train a model?" (2) „Wie viele Datensätze werden als ausreichend angesehen?“ Es gibt hierfür keine definitiven Antworten, sondern nur Faustregeln.(2) "How many records is considered as "enough"?" There are no definitive answers, but only rules of thumb. Für (1) gilt: Je höher die Anzahl von Fehlerereignissen, desto besser ist das Modell.For (1), more the number of failure events, better the model. Für (2) gilt: Die genaue Anzahl von Fehlerereignissen richtet sich nach den Daten und dem Kontext des zu lösenden Problems.For (2), and the exact number of failure events depends on the data and the context of the problem being solved. Es gilt aber auch: Wenn eine Maschine zu häufig ausfällt, wird sie vom Unternehmen ausgetauscht, und die Fehlerinstanzen werden reduziert.But on the flip side, if a machine fails too often then the business will replace it, which will reduce failure instances. Hierbei ist wiederum die Hilfe durch den Domänenexperten wichtig.Here again, the guidance from the domain expert is important. Es gibt aber auch Methoden zum Umgang mit seltenen Ereignissen.However, there are methods to cope with the issue of rare events. Diese werden im Abschnitt Behandeln von unausgeglichenen Daten beschrieben.They are discussed in the section Handling imbalanced data.

QualitätsdatenQuality data

Die Qualität der Daten ist entscheidend. Jeder Vorhersageattributwert muss in Bezug auf den Wert der Zielvariablen genau sein.The quality of the data is critical - each predictor attribute value must be accurate in conjunction with the value of the target variable. Die Datenqualität wird im Bereich der Statistik und Datenverwaltung eingehend untersucht und liegt daher außerhalb des Rahmens dieses Leitfadens.Data quality is a well-studied area in statistics and data management, and hence out of scope for this guide.

Hinweis

Es gibt verschiedene Ressourcen und Unternehmensprodukte zur Bereitstellung von Daten hoher Qualität.There are several resources and enterprise products to deliver quality data. Hier sind einige Referenzbeispiele angegeben:A sample of references is provided below:

Datenaufbereitung für Predictive MaintenanceData preparation for predictive maintenance

DatenquellenData sources

Zu den relevanten Datenquellen für Predictive Maintenance gehören beispielsweise:The relevant data sources for predictive maintenance include, but are not limited to:

  • FehlerverlaufFailure history
  • Wartungs-/ReparaturverlaufMaintenance/repair history
  • Betriebszustände von MaschinenMachine operating conditions
  • AusrüstungsdatenEquipment metadata

FehlerverlaufFailure history

Fehlerereignisse sind in PdM-Anwendungen selten.Failure events are rare in PdM applications. Beim Entwickeln von Vorhersagemodellen muss der Algorithmus aber das normale Betriebsmuster einer Komponente sowie die Fehlermuster erlernen.However, when building prediction models, the algorithm needs to learn about a component's normal operational pattern, as well as its failure patterns. Daher sollten die Trainingsdaten eine ausreichende Anzahl von Beispielen beider Kategorien enthalten.So the training data should contain sufficient number of examples from both categories. Wartungsdatensätze und der Verlauf des Austauschs von Teilen sind gute Quellen für die Ermittlung von Fehlerereignissen.Maintenance records and parts replacement history are good sources to find failure events. Mithilfe von Domänenwissen können Anomalien in den Trainingsdaten auch als Fehler definiert werden.With the help of some domain knowledge, anomalies in the training data can also be defined as failures.

Wartungs-/ReparaturverlaufMaintenance/repair history

Der Wartungsverlauf einer Ressource enthält Details zu ausgetauschten Komponenten, durchgeführten Reparaturvorgängen usw. Mit diesen Ereignissen werden Muster der Leistungsminderung aufgezeichnet.Maintenance history of an asset contains details about components replaced, repair activities performed etc. These events record degradation patterns. Das Fehlen dieser wichtigen Informationen in den Trainingsdaten kann zu irreführenden Modellergebnissen führen.Absence of this crucial information in the training data can lead to misleading model results. Der Fehlerverlauf kann auch in Form von speziellen Fehlercodes im Wartungsverlauf oder anhand des Datums von Teilebestellungen ermittelt werden.Failure history can also be found within maintenance history as special error codes, or order dates for parts. Zusätzliche Datenquellen, die einen Einfluss auf Fehlermuster haben, sollten von Domänenexperten untersucht und bereitgestellt werden.Additional data sources that influence failure patterns should be investigated and provided by domain experts.

Betriebszustände von MaschinenMachine operating conditions

Sensorbasierte (oder andere) Streamingdaten der Betriebsausrüstung stellen eine wichtige Datenquelle dar.Sensor based (or other) streaming data of the equipment in operation is an important data source. Eine wichtige Annahme in Bezug auf PdM ist, dass sich der Integritätsstatus einer Maschine während des routinemäßigen Betriebs im Laufe der Zeit verschlechtert.A key assumption in PdM is that a machine’s health status degrades over time during its routine operation. Die Daten sollten zeitbezogene Features enthalten, mit denen dieses Alterungsmuster und alle Anomalien erfasst werden, die zu einer Verschlechterung führen.The data is expected to contain time-varying features that capture this aging pattern, and any anomalies that leads to degradation. Der zeitliche Aspekt der Daten ist erforderlich, damit der Algorithmus die Fehlermuster und anderen Muster im Laufe der Zeit erlernen kann.The temporal aspect of the data is required for the algorithm to learn the failure and non-failure patterns over time. Basierend auf diesen Datenpunkten erlernt der Algorithmus das Verfahren zum Vorhersagen, wie viele Zeiteinheiten lang eine Maschine noch betrieben werden kann, bevor ein Fehler auftritt.Based on these data points, the algorithm learns to predict how many more units of time a machine can continue to work before it fails.

Daten zu statischen MerkmalenStatic feature data

Statische Merkmale sind Metadaten zur Ausrüstung.Static features are metadata about the equipment. Beispiele hierfür sind Typ, Modell, Herstellungsdatum, Datum des Betriebsstarts, Standort des Systems und andere technische Spezifikationen der Ausrüstung.Examples are the equipment make, model, manufactured date, start date of service, location of the system, and other technical specifications.

Beispiele für relevante Daten zu den PdM-Beispielanwendungsfällen sind in der Tabelle unten angegeben:Examples of relevant data for the sample PdM use cases are tabulated below:

AnwendungsfallUse Case Beispiele für relevante DatenExamples of relevant data
Verspätungen und Ausfälle von FlügenFlight delay and cancellations Flugrouteninformationen in Form von Teilstrecken und Page Logs.Flight route information in the form of flight legs and page logs. Zu den Daten für Teilstrecken gehören Routendetails wie Datum und Uhrzeit des Abflugs und der Ankunft, der Flughafen, Zwischenstopps usw. Page Logs enthalten verschiedene Fehler- und Wartungscodes, die vom Bodenpersonal aufgezeichnet werden.Flight leg data includes routing details such as departure/arrival date, time, airport, layovers etc. Page log includes a series of error and maintenance codes recorded by the ground maintenance personnel.
Fehler im Triebwerk eines FlugzeugsAircraft engine parts failure Dies sind Daten, die über Sensoren im Flugzeug ermittelt werden, um Informationen zum Zustand der einzelnen Teile zu liefern.Data collected from sensors in the aircraft that provide information on the condition of the various parts. Anhand von Wartungsprotokollen kann ermittelt werden, wann Komponentenfehler aufgetreten sind und wann diese ausgetauscht wurden.Maintenance records help identify when component failures occurred and when they were replaced.
Ausfälle von GeldautomatenATM Failure Sensormesswerte für jede Transaktion (Bargeld/Scheck) und die Ausgabe von Bargeld.Sensor readings for each transaction (depositing cash/check) and dispensing of cash. Informationen zur Messung des Abstands zwischen Banknoten, Dicke der Banknoten, Abstand der Banknotenbereitstellung, Scheckattribute usw. Wartungsdatensätze mit Fehlercodes, Reparaturinformationen, Angaben zur letzten Auffüllung des Geldautomaten.Information on gap measurement between notes, note thickness, note arrival distance, check attributes etc. Maintenance records that provide error codes, repair information, last time the cash dispenser was refilled.
Ausfall von WindturbinenWind turbine failure Mit Sensoren werden die Turbinenbedingungen überwacht, z.B. Temperatur, Windrichtung, erzeugter Strom, Generatorgeschwindigkeit usw. Daten werden von einer größeren Zahl von Windturbinen erfasst, die Teil von Windfarmen in verschiedenen Regionen sind.Sensors monitor turbine conditions such as temperature, wind direction, power generated, generator speed etc. Data is gathered from multiple wind turbines from wind farms located in various regions. Normalerweise verfügt jede Turbine über mehrere Sensormesswerte, sodass die Messungen nach einem festgelegten Zeitintervall bereitgestellt werden.Typically, each turbine will have multiple sensor readings relaying measurements at a fixed time interval.
Ausfälle von LeistungsschutzschalternCircuit breaker failures Wartungsprotokolle, die Informationen zu Korrektur-, Vorbeugungs- und Systemmaßnahmen enthalten.Maintenance logs that include corrective, preventive, and systematic actions. Betriebsdaten mit automatischen und manuellen Befehlen, die an Leistungsschutzschalter gesendet werden, z.B. zum Öffnen und Schließen.Operational data that includes automatic and manual commands sent to circuit breakers such as for open and close actions. Gerätemetadaten, z.B. Herstellungsdatum, Standort, Modell usw. Spezifikationen zu Leistungsschutzschaltern, z.B. Spannungsebenen, Geolocation und Umgebungsbedingungen.Device metadata such as date of manufacture, location, model, etc. Circuit breaker specifications such as voltage levels, geolocation, ambient conditions.
Ausfälle von AufzugtürenElevator door failures Aufzugmetadaten, z.B. Typ des Aufzugs, Herstellungsdatum, Wartungshäufigkeit, Gebäudetyp usw.Elevator metadata such as type of elevator, manufactured date, maintenance frequency, building type, and so on. Informationen zum Betrieb, z.B. Anzahl von Türzyklen, durchschnittliche Dauer des Schließvorgangs.Operational information such as number of door cycles, average door close time. Fehlerverlauf mit den dazugehörigen Ursachen.Failure history with causes.
RadfehlerWheel failures Sensordaten, über die Radbeschleunigung, Bremsaktionen, Laufleistung, Geschwindigkeit usw. gemessen werden. Informationen zu statischen Merkmalen der Räder, z.B. Hersteller, Herstellungsdatum.Sensor data that measures wheel acceleration, braking instances, driving distance, velocity etc. Static information on wheels like manufacturer, manufactured date. Aus der Datenbank für die Teilebestellung abgeleitete Fehlerdaten, die die nachverfolgten Bestelldaten und -mengen umfassen.Failure data inferred from part order database that track order dates and quantities.
Ausfälle der Türen von U-Bahn-ZügenSubway train door failures Dauer des Vorgangs zum Öffnen und Schließen der Türen sowie andere Betriebsdaten, z.B. der aktuelle Zustand der Zugtüren.Door opening and closing times, other operational data such as current condition of train doors. Zu den statischen Daten gehören Spalten mit der Ressourcen-ID, der Zeit und dem Zustandswert.Static data would include asset identifier, time, and condition value columns.

DatentypenData types

Basierend auf den obigen Datenquellen sind im PdM-Bereich die folgenden beiden Datentypen zu beobachten:Given the above data sources, the two main data types observed in PdM domain are:

  • Temporale Daten: Betriebstelemetrie, Maschinenzustand, Arbeitsauftragstypen, Prioritätscodes mit Zeitstempeln zum Aufzeichnungszeitpunkt.Temporal data: Operational telemetry, machine conditions, work order types, priority codes that will have timestamps at the time of recording. Für den Fehler-, Wartungs-/Reparatur- und Nutzungsverlauf werden jedem Ereignis ebenfalls Zeitstempel zugeordnet.Failure, maintenance/repair, and usage history will also have timestamps associated with each event.
  • Statische Daten: Bei Merkmalen von Maschinen und Bedienern handelt es sich um statische Daten, da hiermit die technischen Spezifikationen von Maschinen oder die Attribute von Bedienern beschrieben werden.Static data: Machine features and operator features in general are static since they describe the technical specifications of machines or operator attributes. Falls sich diese Merkmale im Laufe der Zeit ändern können, sollten sie auch mit Zeitstempeln versehen werden.If these features could change over time, they should also have timestamps associated with them.

Vorhersage- und Zielvariablen sollten je nach verwendetem Algorithmus vorverarbeitet bzw. in numerische, kategorische und andere Datentypen transformiert werden.Predictor and target variables should be preprocessed/transformed into numerical, categorical, and other data types depending on the algorithm being used.

Vorabaufbereitung der DatenData preprocessing

Eine Voraussetzung für die Featureentwicklung ist, dass Sie die Daten aus den verschiedenen Datenströmen aufbereiten müssen, um ein Schema zu erstellen, mit dem die Entwicklung von Features vereinfacht wird.As a prerequisite to feature engineering, prepare the data from various streams to compose a schema from which it is easy to build features. Visualisieren Sie die Daten zuerst in einer Tabelle mit Datensätzen.Visualize the data first as a table of records. Jede Zeile der Tabelle stellt eine Trainingsinstanz dar, und die Spalten stehen für die Features der Vorhersage (auch als unabhängige Attribute oder Variablen bezeichnet).Each row in the table represents a training instance, and the columns represent predictor features (also called independent attributes or variables). Organisieren Sie die Daten so, dass die letzte bzw. letzten Spalten für das Ziel (abhängige Variable) verwendet werden.Organize the data such that the last column(s) is the target (dependent variable). Weisen Sie für jede Trainingsinstanz eine Bezeichnung als Wert für diese Spalte zu.For each training instance, assign a label as the value of this column.

Unterteilen Sie für die temporalen Daten die Dauer der Sensordaten in Zeiteinheiten.For temporal data, divide the duration of sensor data into time units. Jeder Datensatz sollte zu einer Zeiteinheit für eine Ressource gehören und eindeutige Informationen enthalten.Each record should belong to a time unit for an asset, and should offer distinct information. Zeiteinheiten werden je nach den geschäftlichen Anforderungen in Vielfachen von Sekunden, Minuten, Stunden, Tagen, Monaten usw. definiert.Time units are defined based on business needs in multiples of seconds, minutes, hours, days, months, and so on. Die Zeiteinheit muss nicht der Häufigkeit der Datensammlung entsprechen.The time unit does not have to be the same as the frequency of data collection. Falls die Häufigkeit sehr hoch ist, kann es sein, dass sich die Daten für die Einheiten nicht merklich unterscheiden.If the frequency is high, the data may not show any significant difference from one unit to the other. Angenommen, die Umgebungstemperatur wurde alle zehn Sekunden erfasst.For example, assume that ambient temperature was collected every 10 seconds. Wenn für die Trainingsdaten das gleiche Intervall genutzt wird, steigt lediglich die Anzahl von Beispielen, ohne dass zusätzliche Informationen gewonnen werden.Using that same interval for training data only inflates the number of examples without providing any additional information. Eine bessere Strategie für diesen Fall ist die Verwendung eines Mittelwerts der Daten für einen Zeitraum von zehn Minuten oder, je nach Geschäftsanforderungen, von einer Stunde.For this case, a better strategy would be to use average the data over 10 minutes, or an hour based on the business justification.

Für statische Daten:For static data,

  • Wartungsdatensätze: Unformatierte Wartungsdaten verfügen über eine Ressourcen-ID und einen Zeitstempel mit Informationen zu den Wartungsaktivitäten, die zu einem bestimmten Zeitpunkt durchgeführt wurden.Maintenance records: Raw maintenance data has an asset identifier and timestamp with information on maintenance activities that have been performed at a given point in time. Transformieren Sie die Wartungsaktivitäten in kategoriebezogenen Spalten, wobei der Deskriptor jeder Kategorie eindeutig einer bestimmten Wartungsaktion zugeordnet sein sollte.Transform maintenance activities into categorical columns, where each category descriptor uniquely maps to a specific maintenance action. Das Schema für Wartungsdatensätze enthält die Ressourcen-ID, die Zeit und die Wartungsaktion.The schema for maintenance records would include asset identifier, time, and maintenance action.

  • Fehlerdatensätze: Fehler oder Fehlerursachen können als spezifische Fehlercodes oder Fehlerereignisse aufgezeichnet werden, die über bestimmte Geschäftsbedingungen definiert werden.Failure records: Failures or failure reasons can be recorded as specific error codes or failure events defined by specific business conditions. Falls die Ausrüstung über mehrere Fehlercodes verfügt, sollte der Domänenexperte dabei behilflich sein, diejenigen zu identifizieren, die zur Zielvariablen gehören.In cases where the equipment has multiple error codes, the domain expert should help identify the ones that are pertinent to the target variable. Verwenden Sie die verbleibenden Fehlercodes oder Bedingungen, um Vorhersagefeatures zu erstellen, die mit diesen Fehlern korrelieren.Use the remaining error codes or conditions to construct predictor features that correlate with these failures. Das Schema für Fehlerdatensätze enthält die Ressourcen-ID, die Zeit, den Fehler bzw. den Fehlergrund (falls verfügbar).The schema for failure records would include asset identifier, time, failure, or failure reason - if available.

  • Metadaten für Maschinen und Bediener: Führen Sie die Metadaten für Maschinen und Bediener in einem Schema zusammen, um eine Ressource dem Bediener zuzuordnen, einschließlich der jeweiligen Attribute.Machine and operator metadata: Merge the machine and operator data into one schema to associate an asset with its operator, along with their respective attributes. Das Schema für die Maschinenzustände enthält die Ressourcen-ID, Ressourcenfeatures, Bediener-ID und Bedienerfeatures.The schema for machine conditions would include asset identifier, asset features, operator identifier, and operator features.

Weitere Schritte zur Vorabaufbereitung der Daten sind der Umgang mit fehlenden Werten und die Normalisierung von Attributwerten.Other data preprocessing steps include handling missing values and normalization of attribute values. Eine ausführliche Beschreibung würde den Rahmen dieses Leitfadens sprengen. Im nächsten Abschnitt finden Sie einige hilfreiche Verweise.A detailed discussion is beyond the scope of this guide - see the next section for some useful references.

Wenn die obigen vorab aufbereiteten Datenquellen vorhanden sind, besteht die letzte Transformation vor der Featureentwicklung aus dem Einbinden der obigen Tabellen basierend auf der Ressourcen-ID und dem Zeitstempel.With the above preprocessed data sources in place, the final transformation before feature engineering is to join the above tables based on the asset identifier and timestamp. Die sich ergebende Tabelle enthält in der Fehlerspalte NULL-Werte, wenn sich die Maschine im Normalbetrieb befindet.The resulting table would have null values for the failure column when machine is in normal operation. Diese NULL-Werte können mit einem Indikator für den Normalbetrieb zugeordnet werden.These null values can be imputed by an indicator for normal operation. Verwenden Sie diese Fehlerspalte, um Bezeichnungen für das Vorhersagemodell zu erstellen.Use this failure column to create labels for the predictive model. Weitere Informationen finden Sie im Abschnitt zu den Modellierungsverfahren für Predictive Maintenance.For more information, see the section on modeling techniques for predictive maintenance.

FeatureentwicklungFeature engineering

Die Featureentwicklung ist der erste Schritt vor der Modellierung der Daten.Feature engineering is the first step prior to modeling the data. Ihre Rolle im Data Science-Prozess ist hier beschrieben.Its role in the data science process is described here. Ein Feature ist ein Vorhersageattribut für das Modell, z.B. Temperatur, Druck, Vibration usw.A feature is a predictive attribute for the model - such as temperature, pressure, vibration, and so on. In Bezug auf PdM umfasst die Featureentwicklung die Abstrahierung der Integrität einer Maschine anhand von Verlaufsdaten, die über einen längeren Zeitraum gesammelt wurden.For PdM, feature engineering involves abstracting a machine’s health over historical data collected over a sizable duration. In dieser Hinsicht unterscheidet sie sich von vergleichbaren Verfahren, z.B. der Remoteüberwachung, Anomalieerkennung und Fehlererkennung.In that sense, it is different from its peers such as remote monitoring, anomaly detection, and failure detection.

ZeitfensterTime windows

Bei der Remoteüberwachung geht es um das Berichten von Ereignissen, die zu bestimmten Zeitpunkten eintreten.Remote monitoring entails reporting the events that happen as of points in time. Bei Anomalieerkennungsmodellen werden eingehende Datenströme evaluiert (bewertet), um Anomalien für verschiedene Zeitpunkte zu kennzeichnen.Anomaly detection models evaluate (score) incoming streams of data to flag anomalies as of points in time. Im Rahmen der Fehlererkennung werden Fehler als bestimmte Fehlertypen klassifiziert, wenn diese zu bestimmten Zeitpunkten eintreten.Failure detection classifies failures to be of specific types as they occur points in time. Bei PdM geht es dagegen um das Vorhersagen von Fehlern für einen Zeitraum in der Zukunft basierend auf Features, die das Maschinenverhalten für Zeiträume in der Vergangenheit repräsentieren.In contrast, PdM involves predicting failures over a future time period, based on features that represent machine behavior over historical time period. Für PdM sind Featuredaten einzelner Zeitpunkte zu ungenau, um für Vorhersagen nützlich zu sein.For PdM, feature data from individual points of time are too noisy to be predictive. Die Daten jedes Features müssen also geglättet werden, indem Datenpunkte für Zeitfenster aggregiert werden.So the data for each feature needs to be smoothened by aggregating data points over time windows.

VerzögerungsfeaturesLag features

Anhand der geschäftlichen Anforderungen wird definiert, wie weit mit dem Modell Vorhersagen für die Zukunft getroffen werden sollen.The business requirements define how far the model has to predict into the future. Basierend auf dieser Dauer kann wiederum definiert werden, „wie weit das Modell zurückgehen soll“, um diese Vorhersagen zu erstellen.In turn, this duration helps define 'how far back the model has to look' to make these predictions. Dieser Zeitraum wird als Verzögerung bezeichnet, und für diesen Verzögerungszeitraum erstellte Features werden als Verzögerungsfeatures bezeichnet.This 'looking back' period is called the lag, and features engineered over this lag period are called lag features. In diesem Abschnitt werden Verzögerungsfeatures, die aus Datenquellen mit Zeitstempeln erstellt werden können, und die Featureerstellung aus statischen Datenquellen beschrieben.This section discusses lag features that can be constructed from data sources with timestamps, and feature creation from static data sources. Verzögerungsfeatures sind normalerweise numerischer Art.Lag features are typically numerical in nature.

Wichtig

Die Fenstergröße wird per Experimentierung bestimmt und sollte mithilfe eines Domänenexperten endgültig festgelegt werden.The window size is determined via experimentation, and should be finalized with the help of a domain expert. Die gleiche Anforderung gilt für die Auswahl und Definition von Verzögerungsfeatures, der dazugehörigen Aggregationen und der Fenstertypen.The same caveat holds for the selection and definition of lag features, their aggregations, and the type of windows.

Gleitende AggregateRolling aggregates

Für jeden Datensatz einer Ressource wird die Gleitfenstergröße „W“ als Anzahl von Zeiteinheiten zur Berechnung der Aggregate gewählt.For each record of an asset, a rolling window of size "W" is chosen as the number of units of time to compute the aggregates. Anschließend werden Verzögerungsfeatures berechnet, indem die W-Zeiträume vor dem Datum dieses Datensatzes verwendet werden.Lag features are then computed using the W periods before the date of that record. In Abbildung 1 veranschaulichen die blauen Linien Sensorwerte einer Ressource für jede Zeiteinheit.In Figure 1, the blue lines show sensor values recorded for an asset for each unit of time. Sie geben einen gleitenden Durchschnitt der Featurewerte für ein Fenster mit der Größe W=3 an.They denote a rolling average of feature values over a window of size W=3. Der gleitende Durchschnitt wird für alle Datensätze mit Zeitstempeln im Bereich t1 (orange) bis t2 (grün) berechnet.The rolling average is computed over all records with timestamps in the range t1 (in orange) to t2 (in green). Der Wert für W wird je nach Art der Daten normalerweise in Minuten oder Stunden angegeben.The value for W is typically in minutes or hours depending on the nature of the data. Bei bestimmten Problemen kann durch die Auswahl eines hohen Werts für W (z.B. 12 Monate) der gesamte Verlauf einer Ressource bis zum Zeitpunkt des Datensatzes angegeben werden.But for certain problems, picking a large W (say 12 months) can provide the whole history of an asset until the time of the record.

Abbildung 1.

Abbildung 1.Figure 1. Gleitendes Aggregat – FeaturesRolling aggregate features

Beispiele für gleitende Aggregate eines Zeitfensters sind Werte vom Typ „Anzahl“, „Mittelwert“, CUMESUM-Measures (Cumulative Sum) und Minimal-/Maximalwerte.Examples of rolling aggregates over a time window are count, average, CUMESUM (cumulative sum) measures, min/max values. Außerdem werden häufig Varianz, Standardabweichung und Anzahl von Ausreißern für N Standardabweichungen verwendet.In addition, variance, standard deviation, and count of outliers beyond N standard deviations are often used. Beispiele für Aggregate, die auf Anwendungsfälle in diesem Leitfaden angewendet werden können, sind unten aufgeführt.Examples of aggregates that may be applied for the use cases in this guide are listed below.

  • Flugverspätung: Anzahl von Fehlercodes für den letzten Tag bzw. die letzte Woche.Flight delay: count of error codes over the last day/week.
  • Ausfall eines Teils des Flugzeugtriebwerks: Gleitender Durchschnitt, Standardabweichung und Summe für den letzten Tag, die letzte Woche usw. Diese Metrik sollte in Zusammenarbeit mit dem Domänenexperten bestimmt werden.Aircraft engine part failure: rolling means, standard deviation, and sum over the past day, week etc. This metric should be determined along with the business domain expert.
  • Fehler bei Geldautomaten: Gleitender Durchschnitt, Median, Bereich, Standardabweichungen, Anzahl von Ausreißern über drei Standardabweichungen hinaus, CUMESUM-Ober- und -Unterwert.ATM failures: rolling means, median, range, standard deviations, count of outliers beyond three standard deviations, upper and lower CUMESUM.
  • Ausfälle der Türen von U-Bahn-Zügen: Anzahl von Ereignissen für den letzten Tag, die letzte Woche, die letzten zwei Wochen usw.Subway train door failures: Count of events over past day, week, two weeks etc.
  • Ausfälle von Leistungsschutzschaltern: Anzahl von Ausfällen für die letzte Woche, das letzte Jahr, die letzten drei Jahre usw.Circuit breaker failures: Failure counts over past week, year, three years etc.

Ein weiteres nützliches Verfahren bei PdM ist die Erfassung von Trendänderungen, Spitzen und Ebenenänderungen mit Algorithmen, die Anomalien in den Daten erkennen.Another useful technique in PdM is to capture trend changes, spikes, and level changes using algorithms that detect anomalies in data.

Rollierende AggregateTumbling aggregates

Für jeden bezeichneten Datensatz einer Ressource wird ein Fenster der Größe W-k definiert, wobei k für die Anzahl von Fenstern der Größe W steht. Aggregate werden dann für k rollierende Fenster W-k, W-(k-1), …, W-2, W-1 für die Zeiträume erstellt, die vor dem Zeitstempel eines Datensatzes liegen.For each labeled record of an asset, a window of size W-k is defined, where k is the number of windows of size W. Aggregates are then created over k tumbling windows W-k, W-(k-1), …, W-2, W-1 for the periods before a record's timestamp. k kann eine niedrige Zahl sein, um kurzfristige Auswirkungen zu erfassen, oder eine hohe Zahl, um langfristige Leistungsabfallmuster zu erfassen.k can be a small number to capture short-term effects, or a large number to capture long-term degradation patterns. (Siehe Abbildung 2.)(see Figure 2).

Abbildung 2.

Abbildung 2.Figure 2. Rollierendes Aggregat – FeaturesTumbling aggregate features

Verzögerungsfeatures für den Anwendungsfall mit den Windturbinen können beispielsweise mit den Werten W=1 und k=3 erstellt werden.For example, lag features for the wind turbines use case may be created with W=1 and k=3. Diese Werte implizieren jeweils die Verzögerung für die letzten drei Monate, und es werden Ausreißer nach oben und unten verwendet.They imply the lag for each of the past three months using top and bottom outliers.

Statische FeaturesStatic features

Technische Spezifikationen der Ausrüstung, z.B. Herstellungsdatum, Modellnummer und Standort, sind einige Beispiele für statische Features.Technical specifications of the equipment such as date of manufacture, model number, location, are some examples of static features. Sie werden als kategoriebezogene Variablen für die Modellierung behandelt.They are treated as categorical variables for modeling. Einige Beispiele für den Anwendungsfall mit dem Leistungsschutzschalter sind Spannung, Stromstärke, Stromaufnahme, Transformatortyp und Stromquelle.Some examples for the circuit breaker use case are voltage, current, power capacity, transformer type, and power source. Bei Radfehlern ist der Typ des Rads (Legierung oder Stahl) ein geeignetes Beispiel.For wheel failures, the type of tire wheels (alloy vs steel) is an example.

Die bisher beschriebenen Schritte zur Datenaufbereitung sollten ergeben, dass die Daten wie unten dargestellt organisiert werden.The data preparation efforts discussed so far should lead to the data being organized as shown below. Trainings-, Test- und Validierungsdaten sollten über dieses logische Schema verfügen (in diesem Beispiel wird die Zeiteinheit „Tage“ verwendet).Training, test, and validation data should have this logical schema (this example shows time in units of days).

Asset-IDAsset ID TimeTime <Featurespalten><Feature Columns> BezeichnungLabel
A123A123 Tag 1Day 1 .. .. .. ..
A123A123 Tag 2Day 2 .. .. .. ..
...... ...... .. .. .. ..
B234B234 Tag 1Day 1 .. .. .. ..
B234B234 Tag 2Day 2 .. .. .. ..
...... ...... .. .. .. ..

Der letzte Schritt der Featureentwicklung ist die Bezeichnung der Zielvariablen.The last step in feature engineering is the labeling of the target variable. Dieser Prozess richtet sich nach dem Modellierungsverfahren.This process is dependent on the modeling technique. Das Modellierungsverfahren ist wiederum vom Geschäftsproblem und von der Art der verfügbaren Daten abhängig.In turn, the modeling technique depends on the business problem and nature of the available data. Der Prozess der Bezeichnung wird im nächsten Abschnitt beschrieben.Labeling is discussed in the next section.

Wichtig

Die Datenaufbereitung und die Featureentwicklung sind genauso wichtig wie Modellierungsverfahren, um erfolgreiche PdM-Lösungen zu erhalten.Data preparation and feature engineering are as important as modeling techniques to arrive at successful PdM solutions. Der Domänenexperte und der Praktiker sollten viel Zeit investieren, um die richtigen Features und Daten für das Modell zu ermitteln.The domain expert and the practitioner should invest significant time in arriving at the right features and data for the model. Hier sind einige der vielen erhältlichen Bücher zur Featureentwicklung aufgeführt:A small sample from many books on feature engineering are listed below:

  • Pyle, D. Data Preparation for Data Mining (The Morgan Kaufmann Series in Data Management Systems), 1999 (Datenaufbereitung für Data Mining)Pyle, D. Data Preparation for Data Mining (The Morgan Kaufmann Series in Data Management Systems), 1999
  • Zheng, A., Casari, A. Feature Engineering for Machine Learning: Principles and Techniques for Data Scientists (Feature Engineering für Machine Learning: Prinzipien und Techniken für Datenanalysten), O'Reilly, 2018.Zheng, A., Casari, A. Feature Engineering for Machine Learning: Principles and Techniques for Data Scientists, O'Reilly, 2018.
  • Dong, G. Liu, H. (Editors), Feature Engineering for Machine Learning and Data Analytics (Chapman & Hall/CRC Data Mining and Knowledge Discovery Series), CRC Press, 2018 (Featureentwicklung für Machine Learning und Datenanalyse)Dong, G. Liu, H. (Editors), Feature Engineering for Machine Learning and Data Analytics (Chapman & Hall/CRC Data Mining and Knowledge Discovery Series), CRC Press, 2018.

Modellierungsverfahren für Predictive MaintenanceModeling techniques for predictive maintenance

In diesem Abschnitt werden die wichtigsten Modellierungsverfahren für PdM-Probleme mit den dazugehörigen spezifischen Methoden zur Erstellung von Bezeichnungen beschrieben.This section discusses the main modeling techniques for PdM problems, along with their specific label construction methods. Beachten Sie, dass ein Modellierungsverfahren für viele verschiedene Branchen eingesetzt werden kann.Notice that a single modeling technique can be used across different industries. Das Modellierungsverfahren ist mit dem Data Science-Problem gekoppelt, anstatt mit dem Kontext der jeweiligen Daten.The modeling technique is paired to the data science problem, rather than the context of the data at hand.

Wichtig

Die Wahl der Bezeichnungen für die Fehlerfälle und der BezeichnungsstrategieThe choice of labels for the failure cases and the labeling strategy
sollte in Abstimmung mit dem Domänenexperten erfolgen.should be determined in consultation with the domain expert.

Binäre KlassifizierungBinary classification

Die binäre Klassifizierung wird verwendet, um die Wahrscheinlichkeit vorherzusagen, dass ein Ausrüstungsteil in einem in der Zukunft liegenden Zeitraum ausfällt. Dieser Zeitraum wird als zukünftiger Zeithorizont „X“ bezeichnet. X wird anhand des Geschäftsproblems und der jeweiligen Daten in Zusammenarbeit mit dem Domänenexperten festgelegt.Binary classification is used to predict the probability that a piece of equipment fails within a future time period - called the future horizon period X. X is determined by the business problem and the data at hand, in consultation with the domain expert. Beispiele:Examples are:

  • Erforderliche Mindestvorlaufzeit zum Austauschen von Komponenten, Bereitstellen von Wartungsressourcen und Durchführen der Wartung zur Vermeidung eines Problems, dessen Auftreten für diesen Zeitraum wahrscheinlich ist.minimum lead time required to replace components, deploy maintenance resources, perform maintenance to avoid a problem that is likely to occur in that period.
  • Mindestzahl von Ereignissen, die eintreten können, bevor es zu einem Problem kommt.minimum count of events that can happen before a problem occurs.

Bei diesem Verfahren werden zwei Arten von Trainingsbeispielen identifiziert.In this technique, two types of training examples are identified. Ein positives Beispiel, mit dem ein Fehler angegeben wird und das die Bezeichnung „1“ (label = 1) hat.A positive example, which indicates a failure, with label = 1. Ein negatives Beispiel, mit dem der Normalbetrieb angegeben wird und das die Bezeichnung „0“ (label = 0) hat.A negative example, which indicates normal operations, with label = 0. Die Zielvariable und somit auch die Bezeichnungswerte sind kategoriebezogen.The target variable, and hence the label values, are categorical. Im Modell sollte für jedes neue Beispiel ermittelt werden, ob für die nächsten X Zeiteinheiten das Auftreten eines Fehlers oder der Normalbetrieb wahrscheinlich ist.The model should identify each new example as likely to fail or work normally over the next X time units.

Erstellung von Bezeichnungen für die binäre KlassifizierungLabel construction for binary classification

Hier wird die folgende Frage gestellt: „Wie hoch ist die Wahrscheinlichkeit, dass die Ressource innerhalb der nächsten X Zeiteinheiten ausfällt?“The question here is: "What is the probability that the asset will fail in the next X units of time?" Zur Beantwortung dieser Frage bezeichnen Sie X Datensätze im Zeitraum vor dem Ausfall einer Ressource als „Ausfall wahrscheinlich“ (label = 1) und alle anderen Datensätze als „normal“ (label =0).To answer this question, label X records prior to the failure of an asset as "about to fail" (label = 1), and label all other records as being "normal" (label =0). (Siehe Abbildung 3.)(see Figure 3).

Abbildung 3.

Abbildung 3.Figure 3. Bezeichnungen für binäre KlassifizierungLabeling for binary classification

Beispiele für die Bezeichnungsstrategie einiger Anwendungsfälle sind unten aufgeführt.Examples of labeling strategy for some of the use cases are listed below.

  • Flugverspätungen: Für X kann „1 Tag“ gewählt werden, um Verspätungen für die nächsten 24 Stunden vorherzusagen.Flight delays: X may be chosen as 1 day, to predict delays in the next 24 hours. Alle Flüge, die innerhalb von 24 Stunden vor einem Ausfall liegen, erhalten dann die Bezeichnung „1“.Then all flights that are within 24 hours before failures are labeled as 1.
  • Fehler bei der Geldausgabe an Geldautomaten: Ein Ziel kann hierbei darin bestehen, die Fehlerwahrscheinlichkeit für eine Transaktion innerhalb der nächsten Stunde zu ermitteln.ATM cash dispense failures: A goal may be to determine failure probability of a transaction in the next one hour. In diesem Fall erhalten alle Transaktionen, die innerhalb der vergangenen Stunde vor dem Fehler liegen, die Bezeichnung „1“.In that case, all transactions that happened within the past hour of the failure are labeled as 1. Zum Vorhersagen der Fehlerwahrscheinlichkeit für die nächsten ausgegebenen N Banknoten erhalten alle Banknoten, die innerhalb der letzten N Banknoten eines Fehlers ausgegeben werden, die Bezeichnung „1“.To predict failure probability over the next N currency notes dispensed, all notes dispensed within the last N notes of a failure are labeled as 1.
  • Ausfälle von Leistungsschutzschaltern: Das Ziel kann hierbei darin bestehen, den nächsten Ausfall des Leistungsschutzschalter-Befehls vorherzusagen.Circuit breaker failures: The goal may be to predict the next circuit breaker command failure. In diesem Fall wird für X ein zukünftiger Befehl gewählt.In that case, X is chosen to be one future command.
  • Ausfälle der Türen von Zügen: X kann als zwei Tage ausgewählt werden.Train door failures: X may be chosen as two days.
  • Ausfall von Windturbinen: X kann als zwei Monate ausgewählt werden.Wind turbine failures: X may be chosen as two months.

Regression für vorbeugende WartungRegression for predictive maintenance

Regressionsmodelle werden verwendet, um die verbleibende Nutzungsdauer einer Ressource zu berechnen.Regression models are used to compute the remaining useful life (RUL) of an asset. Die verbleibende Nutzungsdauer ist als der Zeitraum definiert, in dem eine Ressource betriebsbereit ist, bevor der nächste Fehler auftritt.RUL is defined as the amount of time that an asset is operational before the next failure occurs. Jedes Trainingsbeispiel ist ein Datensatz, der zu einer Zeiteinheit nY für eine Ressource gehört, wobei mit n das Vielfache angegeben wird.Each training example is a record that belongs to a time unit nY for an asset, where n is the multiple. Das Modell sollte die verbleibende Nutzungsdauer für jedes neue Beispiel als fortlaufende Zahl berechnen.The model should calculate the RUL of each new example as a continuous number. Mit dieser Zahl wird die Zeit angegeben, die bis zum Fehler verbleibt.This number denotes the period of time remaining before the failure.

Erstellung von Bezeichnungen für die RegressionLabel construction for regression

Hier wird die folgende Frage gestellt: „Welche Restnutzungsdauer hat das Gerät?“The question here is: "What is the remaining useful life (RUL) of the equipment?" Berechnen Sie für jeden Datensatz vor dem Fehler die Bezeichnung als Anzahl von Zeiteinheiten, die bis zum nächsten Fehler verbleiben.For each record prior to the failure, calculate the label to be the number of units of time remaining before the next failure. Bei dieser Methode handelt es sich bei den Bezeichnungen um fortlaufende Variablen.In this method, labels are continuous variables. (Siehe Abbildung 4.)(See Figure 4)

Abbildung 4.

Abbildung 4.Figure 4. Bezeichnungen für die RegressionLabeling for regression

Für die Regression erfolgt die Bezeichnung per Verweis auf einen Fehlerpunkt.For regression, labeling is done with reference to a failure point. Die Berechnung ist nicht möglich ohne Informationen dazu, wie lange eine Ressource vor einem Fehler fehlerfrei betrieben wurde.Its calculation is not possible without knowing how long the asset has survived before a failure. Im Gegensatz zur binären Klassifizierung können Ressourcen ohne jegliche Fehler in den Daten nicht für die Modellierung verwendet werden.So in contrast to binary classification, assets without any failures in the data cannot be used for modeling. Dieses Problem lässt sich am besten mit einem anderen statistischen Verfahren lösen, das als Ereigniszeitanalyse bezeichnet wird.This issue is best addressed by another statistical technique called Survival Analysis. Es kann aber zu potenziellen Komplikationen kommen, wenn dieses Verfahren auf PdM-Anwendungsfälle angewendet wird, die zeitbezogene Daten mit häufigen Intervallen umfassen.But potential complications may arise when applying this technique to PdM use cases that involve time-varying data with frequent intervals. Weitere Informationen zur Ereigniszeitanalyse finden Sie auf dieser Seite.For more information on Survival Analysis, see this one-pager.

Klassifizierung mit mehreren Klassen für vorbeugende WartungMulti-class classification for predictive maintenance

Verfahren mit der Klassifizierung mit mehreren Klassen können in PdM-Lösungen für zwei Szenarien verwendet werden:Multi-class classification techniques can be used in PdM solutions for two scenarios:

  • Vorhersage von zwei zukünftigen Ergebnissen: Das erste Ergebnis ist ein Bereich mit einer Zeitspanne bis zum Ausfall für eine Ressource.Predict two future outcomes: The first outcome is a range of time to failure for an asset. Die Ressource wird einem von mehreren möglichen Zeiträumen zugewiesen.The asset is assigned to one of multiple possible periods of time. Das zweite Ergebnis ist die Wahrscheinlichkeit eines Ausfalls in einem zukünftigen Zeitraum aufgrund einer der verschiedenen Grundursachen.The second outcome is the likelihood of failure in a future period due to one of the multiple root causes. Anhand dieser Vorhersage können die Wartungsmitarbeiter auf Symptome achten und Wartungszeitpläne erstellen.This prediction enables the maintenance crew to watch for symptoms and plan maintenance schedules.
  • Vorhersage der wahrscheinlichsten Grundursache eines bestimmten Fehlers.Predict the most likely root cause of a given failure. Bei diesem Ergebnis werden die richtigen Wartungsaktionen zur Behebung eines Fehlers empfohlen.This outcome recommends the right set of maintenance actions to fix a failure. Mit einer Prioritätenliste, die Grundursachen und empfohlene Reparaturmaßnahmen enthält, können Techniker die Reparaturschritte nach einem Fehler entsprechend ausführen.A ranked list of root causes and recommended repairs can help technicians prioritize their repair actions after a failure.

Erstellung von Bezeichnungen für die Klassifizierung mit mehreren KlassenLabel construction for multi-class classification

Hier wird die folgende Frage gestellt: „Wie hoch ist die Wahrscheinlichkeit, dass eine Ressource innerhalb der nächsten nZ Zeiteinheiten ausfällt?“ Hierbei steht n für die Anzahl von Zeiträumen.The question here is: "What is the probability that an asset will fail in the next nZ units of time where n is the number of periods?" Bezeichnen Sie zur Beantwortung dieser Frage nZ Datensätze vor dem Ausfall einer Ressource, indem Sie sog. Zeittöpfe (3Z, 2Z, Z) verwenden.To answer this question, label nZ records prior to the failure of an asset using buckets of time (3Z, 2Z, Z). Bezeichnen Sie alle anderen Datensätze als „normal“ (label = 0).Label all other records as "normal" (label = 0). Bei dieser Methode enthält die Zielvariable kategoriebezogene Werte.In this method, the target variable holds categorical values. (Siehe Abbildung 5.)(See Figure 5).

Abbildung 5.

Abbildung 5.Figure 5. Bezeichnungen für die Klassifizierung mit mehreren Klassen zur Vorhersage des FehlerzeitpunktsLabeling for multi-class classification for failure time prediction

Hier wird die folgende Frage gestellt: „Wie hoch ist die Wahrscheinlichkeit, dass die Ressource innerhalb der nächsten X Zeiteinheiten aufgrund der Grundursache bzw. des Problems Pi ausfällt?“The question here is: "What is the probability that the asset will fail in the next X units of time due to root cause/problem Pi?" Hierbei steht i für die Anzahl von möglichen Grundursachen.where i is the number of possible root causes. Bezeichnen Sie zur Beantwortung dieser Frage X Datensätze vor dem Ausfall einer Ressource als „Ausfall wahrscheinlich aufgrund von Grundursache Pi “ (label = Pi ).To answer this question, label X records prior to the failure of an asset as "about to fail due to root cause Pi" (label = Pi). Bezeichnen Sie alle anderen Datensätze als „normal“ (label = 0).Label all other records as being "normal" (label = 0). Auch bei dieser Methode sind die Bezeichnungen kategoriebezogen (siehe Abbildung 6).In this method also, labels are categorical (See Figure 6).

Abbildung 6.

Abbildung 6.Figure 6. Bezeichnung für die Klassifizierung mit mehreren Klassen zur Vorhersage des FehlerzeitpunktsLabeling for multi-class classification for root cause prediction

Bei diesem Modell wird jedem Pi eine anstehende Fehlerwahrscheinlichkeit sowie die Wahrscheinlichkeit für das Nichtauftreten eines Fehlers zugewiesen.The model assigns a failure probability due to each Pi as well as the probability of no failure. Diese Wahrscheinlichkeiten können nach Größenordnung sortiert werden, um die Vorhersage der Probleme zu ermöglichen, die in Zukunft mit der höchsten Wahrscheinlichkeit auftreten.These probabilities can be ordered by magnitude to allow prediction of the problems that are most likely to occur in the future.

Hier wird die folgende Frage gestellt: „Welche Wartungsaktionen werden nach einem Ausfall empfohlen?“The question here is: "What maintenance actions do you recommend after a failure?" Zur Beantwortung dieser Frage ist für die Bezeichnungen keine Auswahl eines zukünftigen Zeithorizonts erforderlich, da für das Modell kein in der Zukunft liegender Fehler vorhergesagt wird.To answer this question, labeling does not require a future horizon to be picked, because the model is not predicting failure in the future. Es wird lediglich die wahrscheinlichste Grundursache nach dem Auftreten des Fehlers vorhergesagt.It is just predicting the most likely root cause once the failure has already happened.

Trainings-, Validierungs- und Testmethoden für Predictive MaintenanceTraining, validation, and testing methods for predictive maintenance

Der Team Data Science-Prozess deckt den Trainings-, Test- und Validierungszyklus für Modelle vollständig ab.The Team Data Science Process provides a full coverage of the model train-test-validate cycle. In diesem Abschnitt werden Aspekte beschrieben, die nur für PdM gelten.This section discusses aspects unique to PdM.

Kreuzvalidierung im VergleichCross validation

Das Ziel der Kreuzvalidierung ist die Definition eines Datasets, um das Modell in der Trainingsphase zu „testen“.The goal of cross validation is to define a data set to "test" the model in the training phase. Dieses Dataset wird als Validierungssatz bezeichnet.This data set is called the validation set. Mit diesem Verfahren werden Probleme wie die Überanpassung eingedämmt, und Sie erhalten Erkenntnisse dazu, wie das Modell für ein unabhängiges Dataset generalisiert wird.This technique helps limit problems like overfitting and gives an insight on how the model will generalize to an independent data set. Hierbei handelt es sich um ein unbekanntes Dataset, das von einem echten Problem stammen kann.That is, an unknown data set, which could be from a real problem. Bei den Trainings- und Testroutinen müssen die zeitabhängigen Aspekte berücksichtigt werden, um eine bessere Generalisierung für noch nicht bekannte zukünftige Daten zu erzielen.The training and testing routine for PdM needs to take into account the time varying aspects to better generalize on unseen future data.

Viele Machine Learning-Algorithmen sind von einer Reihe von Hyperparametern abhängig, mit denen die Modellleistung erheblich verändert werden kann.Many machine learning algorithms depend on a number of hyperparameters that can change the model performance significantly. Die optimalen Werte dieser Hyperparameter werden beim Trainieren des Modells nicht automatisch berechnet.The optimal values of these hyperparameters are not computed automatically when training the model. Sie sollten von einem Data Scientist angegeben werden.They should be specified by the data scientist. Es gibt mehrere Möglichkeiten, gute Werte für Hyperparameter zu ermitteln.There are several ways of finding good values of hyperparameters.

Am häufigsten wird die k-fache Kreuzvalidierung verwendet, bei der die Beispiele nach dem Zufallsprinzip in k Durchläufe aufgeteilt werden.The most common one is k-fold cross-validation that splits the examples randomly into k folds. Führen Sie für jede Gruppe von Hyperparameterwerten den Lernalgorithmus mit der Häufigkeit k aus.For each set of hyperparameters values, run the learning algorithm k times. Verwenden Sie bei jedem Durchlauf die Beispielwerte im aktuellen Durchlauf als Validierungssatz und die restlichen Beispielwerte als Trainingssatz.At each iteration, use the examples in the current fold as a validation set, and the rest of the examples as a training set. Trainieren Sie den Algorithmus über Trainingsbeispielwerte, und berechnen Sie die Leistungsmetriken anhand von Validierungsbeispielwerten.Train the algorithm over training examples and compute the performance metrics over validation examples. Berechnen Sie am Ende dieser Schleife den Mittelwert von k Leistungsmetriken.At the end of this loop, compute the average of k performance metrics. Wählen Sie für jeden Satz mit Hyperparameterwerten diejenigen Werte aus, die über die beste durchschnittliche Leistung verfügen.For each set of hyperparameter values, choose the ones that have the best average performance. Bei Auswahl von Hyperparametern muss häufig experimentiert werden.The task of choosing hyperparameters is often experimental in nature.

In Bezug auf PdM-Probleme werden Daten als Zeitreihe mit Ereignissen aufgezeichnet, die aus mehreren Datenquellen stammen.In PdM problems, data is recorded as a time series of events that come from several data sources. Diese Datensätze können nach der Uhrzeit der Bezeichnung sortiert sein.These records may be ordered according to the time of labeling. Wenn das Dataset nach dem Zufallsprinzip in einen Trainingssatz und einen Validierungssatz aufgeteilt wird, weisen einige Trainingsbeispielwerte daher ggf. einen späteren Zeitpunkt als die Validierungsbeispielwerte auf.Hence, if the dataset is split randomly into training and validation set, some of the training examples may be later in time than some of validation examples. Die zukünftige Leistung von Hyperparameterwerten wird anhand der Daten geschätzt, die vor dem Trainieren des Modells erfasst wurden.Future performance of hyperparameter values will be estimated based on some data that arrived before model was trained. Diese Schätzungen können besonders dann zu optimistisch ausfallen, wenn die Zeitreihen nicht unbeweglich sind und im Laufe der Zeit weiterentwickelt werden.These estimations might be overly optimistic, especially if the time-series is not stationary and evolves over time. Dies kann dazu führen, dass die ausgewählten Hyperparameterwerte suboptimal sind.As a result, the chosen hyperparameter values might be suboptimal.

Die empfohlene Vorgehensweise ist das Aufteilen der Beispiele in einen Trainings- und einen Validierungssatz auf zeitabhängige Weise, wobei alle Validierungsbeispiele einen späteren Zeitpunkt als alle Trainingsbeispiele aufweisen.The recommended way is to split the examples into training and validation set in a time-dependent manner, where all validation examples are later in time than all training examples. Trainieren Sie den Algorithmus für jeden Satz mit Hyperparameterwerten anhand des Trainingsdatasets.For each set of hyperparameter values, train the algorithm over the training data set. Messen Sie die Leistung des Modells anhand des gleichen Validierungssatzes.Measure the model’s performance over the same validation set. Wählen Sie die Hyperparameterwerte aus, die die beste Leistung aufweisen.Choose hyperparameter values that show the best performance. Hyperparameterwerte, die nach der Trainings-/Validierungsaufteilung gewählt werden, führen zu einer besseren zukünftigen Modellleistung als mit den Werten, die zufällig für die Kreuzvalidierung ausgewählt werden.Hyperparameter values chosen by train/validation split result in better future model performance than with the values chosen randomly by cross-validation.

Das endgültige Modell kann generiert werden, indem ein Lernalgorithmus anhand der gesamten Trainingsdaten mit den besten Hyperparameterwerten trainiert wird.The final model can be generated by training a learning algorithm over entire training data using the best hyperparameter values.

Testen der ModellleistungTesting for model performance

Nach der Erstellung eines Modells ist eine Schätzung der zukünftigen Leistung für neue Daten erforderlich.Once a model is built, an estimate of its future performance on new data is required. Eine gute Schätzung ist die Leistungsmetrik von Hyperparameterwerten, die anhand des Validierungssatzes berechnet werden, oder eine Metrik zur durchschnittlichen Leistung, die per Kreuzvalidierung berechnet wird.A good estimate is the performance metric of hyperparameter values computed over the validation set, or an average performance metric computed from cross-validation. Diese Schätzungen sind häufig sehr optimistisch.These estimations are often overly optimistic. Unternehmen verfügen meist noch über zusätzliche Richtlinien dazu, wie das Modell getestet werden soll.The business might often have some additional guidelines on how they would like to test the model.

Die empfohlene Vorgehensweise für PdM ist das Aufteilen der Beispiele in Trainings-, Validierungs- und Testdatasets auf zeitabhängige Weise.The recommended way for PdM is to split the examples into training, validation, and test data sets in a time-dependent manner. Alle Testbeispiele sollten spätere Zeitpunkte als alle Trainings- und Validierungsbeispiele aufweisen.All test examples should be later in time than all the training and validation examples. Generieren Sie nach der Aufteilung das Modell, und messen Sie die Leistung wie oben beschrieben.After the split, generate the model and measure its performance as described earlier.

Wenn Zeitreihen unbeweglich und leicht vorhersagbar sind, werden sowohl beim zufälligen als auch beim zeitabhängigen Ansatz ähnliche Schätzungen der zukünftigen Leistung generiert.When time-series are stationary and easy to predict, both random and time-dependent approaches generate similar estimations of future performance. Falls die Zeitreihen aber nicht unbeweglich oder schwer vorherzusagen sind, werden mit dem zeitabhängigen Ansatz realistischere Schätzungen der zukünftigen Leistung generiert.But when time-series are non-stationary, and/or hard to predict, the time-dependent approach will generate more realistic estimates of future performance.

Zeitabhängige AufteilungTime-dependent split

In diesem Abschnitt werden die bewährten Methoden zum Implementieren der zeitabhängigen Aufteilung beschrieben.This section describes best practices to implement time-dependent split. Eine zeitabhängige bidirektionale Aufteilung auf Trainings- und Testsätze ist unten beschrieben.A time-dependent two-way split between training and test sets is described below.

Angenommen, es ist ein Datenstrom von Ereignissen mit Zeitstempel, z.B. Messungen verschiedener Sensoren, vorhanden.Assume a stream of timestamped events such as measurements from various sensors. Definieren Sie Features und Bezeichnungen von Trainings- und Testbeispielen für Zeitrahmen, die mehrere Ereignisse enthalten.Define features and labels of training and test examples over time frames that contain multiple events. Erstellen Sie beispielsweise für die binäre Klassifizierung Features basierend auf vergangenen Ereignissen, und erstellen Sie Bezeichnungen basierend auf zukünftigen Ereignissen in „X“ Zeiteinheiten in der Zukunft (siehe Abschnitte zur Featureentwicklung und zu den Modellierungsverfahren).For example, for binary classification, create features based on past events, and create labels based on future events within "X" units of time in the future (see the sections on feature engineering and modeling techniques). Der Bezeichnungszeitrahmen eines Beispielwerts liegt also nach dem Zeitrahmen seiner Features.Thus, the labeling time frame of an example comes later than the time frame of its features.

Wählen Sie für die zeitabhängige Aufteilung einen Trainingstrennzeitpunkt Tc für das Modelltraining, wobei die Hyperparameter Verlaufsdaten bis zum Zeitpunkt Tc nutzen.For time-dependent split, pick a training cutoff time Tc at which to train a model, with hyperparameters tuned using historical data up to Tc. Um zu verhindern, dass zukünftige Bezeichnungen nach dem Zeitpunkt Tc in die Trainingsdaten einfließen, wählen Sie als spätesten Zeitpunkt der Bezeichnung von Trainingsbeispielen einen Zeitpunkt, der X Einheiten vor Tc liegt.To prevent leakage of future labels that are beyond Tc into the training data, choose the latest time to label training examples to be X units before Tc. Im Beispiel in Abbildung 7 steht jedes Quadrat für einen Datensatz des Datasets, für das die Features und Bezeichnungen wie oben beschrieben berechnet werden.In the example shown in Figure 7, each square represents a record in the data set where features and labels are computed as described above. In der Abbildung sind die Datensätze dargestellt, die in die Trainings- und Testsätze für X=2 und W=3 einfließen sollen:The figure shows the records that should go into training and testing sets for X=2 and W=3:

Abbildung 7.

Abbildung 7.Figure 7. Zeitabhängige Aufteilung für binäre KlassifizierungTime-dependent split for binary classification

Die grünen Quadrate stehen für Datensätze der Zeiteinheiten, die für das Training verwendet werden können.The green squares represent records belonging to the time units that can be used for training. Bei der Generierung jedes Trainingsbeispiels werden die letzten drei Zeiträume für die Featuregenerierung und zwei zukünftige Zeiträume für die Bezeichnung vor dem Zeitpunkt Tc berücksichtigt.Each training example is generated by considering the past three periods for feature generation, and two future periods for labeling before Tc. Wenn ein Teil der beiden zukünftigen Zeiträume nach dem Zeitpunkt Tc liegt, sollten Sie dieses Beispiel aus dem Trainingsdataset ausschließen, da keine Sichtbarkeit über Tc hinweg vorausgesetzt wird.When any part of the two future periods is beyond Tc, exclude that example from the training data set because no visibility is assumed beyond Tc.

Die schwarzen Quadrate stehen für die Datensätze des endgültigen Datasets mit Bezeichnungen, die gemäß der obigen Einschränkung nicht im Trainingsdataset verwendet werden sollten.The black squares represent the records of the final labeled data set that should not be used in the training data set, given the above constraint. Diese Datensätze werden auch nicht in den Testdaten verwendet, da sie vor dem Zeitpunkt Tc liegen.These records will also not be used in testing data, since they are before Tc. Außerdem hängen die entsprechenden Bezeichnungszeitrahmen teilweise vom Trainingszeitrahmen ab, was nicht ideal ist.In addition, their labeling time frames partially depend on the training time frame, which is not ideal. Trainings-und Testdaten sollten über separate Bezeichnungszeitrahmen verfügen, um Lecks von Bezeichnungsinformationen zu verhindern.Training and test data should have separate labeling time frames to prevent label information leakage.

Das bisher beschriebene Verfahren lässt eine Überlappung zwischen Trainings- und Testbeispielen zu, deren Zeitstempel in der Nähe von Tc liegen.The technique discussed so far allows for overlap between training and testing examples that have timestamps near Tc. Eine Lösung zur Erzielung einer stärkeren Trennung ist das Ausschließen von Beispielen, die sich innerhalb von W Zeiteinheiten des Zeitpunkts Tc vom Testsatz befinden.A solution to achieve greater separation is to exclude examples that are within W time units of Tc from the test set. Für eine solch aggressive Aufteilung ist aber eine hohe Datenverfügbarkeit erforderlich.But such an aggressive split depends on ample data availability.

Regressionsmodelle für die Vorhersage der verbleibenden Nutzungsdauer sind von möglichen Lecks stärker betroffen.Regression models used for predicting RUL are more severely affected by the leakage problem. Die Verwendung der zufälligen Aufteilung führt zu einer extremen Überanpassung.Using the random split method leads to extreme over-fitting. Bei Regressionsproblemen sollte so aufgeteilt werden, dass die Datensätze, die zu Ressourcen mit Fehlern vor dem Zeitpunkt Tc liegen, in den Trainingssatz einfließen.For regression problems, the split should be such that the records belonging to assets with failures before Tc go into the training set. Datensätze von Ressourcen, deren Fehler nach dem Trennzeitpunkt liegen, fließen in den Testsatz ein.Records of assets that have failures after the cutoff go into the test set.

Eine weitere bewährte Methode für die Aufteilung von Daten für das Training und den Test ist die Aufteilung nach der Ressourcen-ID.Another best practice for splitting data for training and testing is to use a split by asset ID. Die Aufteilung sollte so erfolgen, dass keine Ressourcen aus dem Trainingssatz für das Testen der Modellleistung verwendet werden.The split should be such that none of the assets used in the training set are used in testing the model performance. Bei diesem Ansatz besteht für ein Modell eine höhere Chance realistischere Ergebnisse mit neuen Ressourcen zu liefern.Using this approach, a model has a better chance of providing more realistic results with new assets.

Behandeln von unausgeglichenen DatenHandling imbalanced data

Wenn bei Klassifizierungsproblemen mehr Beispielwerte einer Klasse als für eine andere Klasse vorhanden sind, wird das Dataset als unausgeglichen bezeichnet.In classification problems, if there are more examples of one class than of the others, the data set is said to be imbalanced. Im Idealfall wird eine ausreichende Anzahl von repräsentativen Werten jeder Klasse in den Trainingsdaten bevorzugt, um die Differenzierung zwischen unterschiedlichen Klassen zu ermöglichen.Ideally, enough representatives of each class in the training data are preferred to enable differentiation between different classes. Wenn eine Klasse weniger als 10% der Daten umfasst, werden die Daten als unausgeglichen angesehen.If one class is less than 10% of the data, the data is deemed to be imbalanced. Die unterrepräsentierte Klasse wird als Minderheitsklasse bezeichnet.The underrepresented class is called a minority class.

Es kommt für viele PdM-Probleme zu unausgeglichenen Datasets, bei denen eine Klasse gegenüber einer oder mehreren anderen Klassen stark unterrepräsentiert ist.Many PdM problems face such imbalanced datasets, where one class is severely underrepresented compared to the other class, or classes. In einigen Situationen kann es sein, dass die Minderheitsklasse nur 0,001% der gesamten Datenpunkte ausmacht.In some situations, the minority class may constitute only 0.001% of the total data points. Die Unausgeglichenheit von Klassen ist nicht auf PdM beschränkt.Class imbalance is not unique to PdM. Auch in anderen Bereichen, in denen Fehler und Anomalien selten sind, kommt es zu einem ähnlichen Problem, z.B. Betrugserkennung und Netzwerkangriffe.Other domains where failures and anomalies are rare occurrences face a similar problem, for examples, fraud detection and network intrusion. Die Beispiele der Minderheitsklassen bestehen aus diesen Fehlern.These failures make up the minority class examples.

Bei der Unausgeglichenheit von Klassen in Daten wird die Leistung der meisten Standardlernalgorithmen beeinträchtigt, da versucht wird, die Gesamtfehlerrate zu verringern.With class imbalance in data, performance of most standard learning algorithms is compromised, since they aim to minimize the overall error rate. Für ein Dataset mit 99% an negativen und 1% an positiven Beispielen kann für ein Modell eine Genauigkeit von 99% angegeben werden, indem alle Instanzen als negativ bezeichnet werden.For a data set with 99% negative and 1% positive examples, a model can be shown to have 99% accuracy by labeling all instances as negative. Alle positiven Beispiele sind für das Modell aber falsch klassifiziert. Die Genauigkeit ist zwar hoch, aber der Algorithmus ist nicht nützlich.But the model will mis-classify all positive examples; so even if its accuracy is high, the algorithm is not a useful one. Daher sind herkömmliche Evaluierungsmetriken, z.B. die Gesamtgenauigkeit der Fehlerrate, für das Lernen mit unausgeglichenen Daten nicht ausreichend.Consequently, conventional evaluation metrics such as overall accuracy on error rate are insufficient for imbalanced learning. Bei unausgeglichenen Datasets werden andere Metriken für die Modellevaluierung verwendet:When faced with imbalanced datasets, other metrics are used for model evaluation:

  • PrecisionPrecision
  • Recall (Trefferquote)Recall
  • F1 Scores (F1-Maße)F1 scores
  • Cost Adjusted ROC (Receiver Operating Characteristics) (ROC-Kurven mit Kostenanpassung)Cost adjusted ROC (receiver operating characteristics)

Weitere Informationen zu diesen Metriken finden Sie unter Modellevaluierung.For more information about these metrics, see model evaluation.

Es gibt aber einige Methoden, die als Hilfe beim Beheben von Problemen mit der Unausgeglichenheit von Klassen dienen.However, there are some methods that help remedy class imbalance problem. Die beiden wichtigsten Methoden sind Stichprobenverfahren und kostenbewusstes Lernen.The two major ones are sampling techniques and cost sensitive learning.

StichprobenmethodenSampling methods

Lernvorgänge mit unausgeglichenen Daten umfassen die Verwendung von Methoden zur Stichprobenentnahme, um das Trainingsdataset in ein ausgeglichenes Dataset zu ändern.Imbalanced learning involves the use of sampling methods to modify the training data set to a balanced data set. Methoden zur Stichprobenentnahme dürfen nicht auf den Testsatz angewendet werden.Sampling methods are not to be applied to the test set. Es gibt zwar mehrere Stichprobenverfahren, aber die einfachsten sind die Überquotierung und Unterquotierung nach dem Zufallsprinzip.Although there are several sampling techniques, most straight forward ones are random oversampling and under sampling.

Die Überquotierung nach dem Zufallsprinzip umfasst das Auswählen einer zufälligen Stichprobe aus der Minderheitsklasse, das Replizieren dieser Beispielwerte und das Hinzufügen zum Trainingsdataset.Random oversampling involves selecting a random sample from minority class, replicating these examples, and adding them to training data set. So wird die Anzahl von Beispielwerten in der Minderheitsklasse erhöht und somit letztendlich die Anzahl von Beispielwerten für unterschiedliche Klassen ausgeglichen.Consequently, the number of examples in minority class is increased, and eventually balance the number of examples of different classes. Ein Nachteil der Überquotierung ist, dass mehrere Instanzen von bestimmten Beispielwerten dazu führen können, dass der Klassifizierer zu spezifisch wird und es zu einer Überanpassung kommt.A drawback of oversampling is that multiple instances of certain examples can cause the classifier to become too specific, leading to over-fitting. Das Modell weist ggf. eine hohe Trainingsgenauigkeit auf, aber die Leistung in Bezug auf Testdaten im Hintergrund ist unter Umständen nicht optimal.The model may show high training accuracy, but its performance on unseen test data may be suboptimal.

Bei der Unterquotierung nach dem Zufallsprinzip geht es dagegen um das Auswählen einer zufälligen Stichprobe aus einer Mehrheitsklasse und das Entfernen dieser Beispielwerte aus dem Trainingsdataset.Conversely, random under sampling is selecting a random sample from a majority class and removing those examples from training data set. Beim Entfernen von Beispielwerten aus der Mehrheitsklasse kann es passieren, dass dem Klassifizierer wichtige Konzepte der Mehrheitsklasse entgehen.However, removing examples from majority class may cause the classifier to miss important concepts pertaining to the majority class. Hybridstichproben, bei denen die Minderheitsklasse überquotiert und die Mehrheitsklasse gleichzeitig unterquotiert wird, sind ebenfalls ein guter Ansatz.Hybrid sampling where minority class is over-sampled and majority class is under-sampled at the same time is another viable approach.

Es gibt viele anspruchsvolle Verfahren für die Stichprobenentnahme.There are many sophisticated sampling techniques. Das gewählte Verfahren hängt von den Dateneigenschaften und Ergebnissen der iterativen Experimente ab, die vom Data Scientist durchgeführt werden.The technique chosen depends on the data properties and results of iterative experiments by the data scientist.

Kostenbewusstes LernenCost sensitive learning

Bei PdM sind Fehler, die zur Minderheitsklasse gehören, interessanter als normale Beispielwerte.In PdM, failures that constitute the minority class are of more interest than normal examples. Das Hauptaugenmerk liegt daher auf der Leistung des Algorithmus in Bezug auf Fehler.So the focus is mainly on the algorithm's performance on failures. Die fehlerhafte Vorhersage einer positiven Klasse als negative Klasse kann teurer als der umgekehrte Fall werden.Incorrectly predicting a positive class as a negative class can cost more than vice-versa. Diese Situation wird im Allgemeinen als ungleicher Verlust oder asymmetrische Kosten der Fehlklassifizierung von Elementen als unterschiedliche Klassen bezeichnet.This situation is commonly referred as unequal loss or asymmetric cost of mis-classifying elements to different classes. Der ideale Klassifizierer sollte eine hohe Vorhersagegenauigkeit für die Minderheitsklasse ermöglichen, ohne die Genauigkeit für die Mehrheitsklasse zu beeinträchtigen.The ideal classifier should deliver high prediction accuracy over the minority class, without compromising on the accuracy for the majority class.

Es gibt mehrere Arten, diese Ausgeglichenheit zu erzielen.There are multiple ways to achieve this balance. Um das Problem des ungleichen Verlusts zu vermeiden, können Sie der Fehlklassifizierung der Minderheitsklasse hohe Kosten zuweisen und versuchen, die Gesamtkosten möglichst gering zu halten.To mitigate the problem of unequal loss, assign a high cost to mis-classification of the minority class, and try to minimize the overall cost. Bei Algorithmen wie SVMs (Support Vector Machines) ist diese Methode inhärent, indem zugelassen wird, dass die Kosten von positiven und negativen Beispielwerten während des Trainings angegeben werden.Algorithms like SVMs (Support Vector Machines) adopt this method inherently, by allowing cost of positive and negative examples to be specified during training. Auf ähnliche Weise bieten auch Boostingmethoden wie Boosted Decision Trees normalerweise eine gute Leistung in Bezug auf unausgeglichene Daten.Similarly, boosting methods such as boosted decision trees usually show good performance with imbalanced data.

ModellauswertungModel evaluation

Die Fehlklassifizierung ist ein erhebliches Problem für PdM-Szenarien, bei denen die Kosten für Fehlalarme für das Unternehmen hoch sind.Mis-classification is a significant problem for PdM scenarios where the cost of false alarms to the business is high. Beispielsweise kann die Entscheidung, ein Flugzeug basierend auf der falschen Vorhersage eines Triebwerksfehlers nicht starten zu lassen, zu einer Störung von Flug- und Reiseplänen führen.For instance, a decision to ground an aircraft based on an incorrect prediction of engine failure can disrupt schedules and travel plans. Das Herausnehmen einer Maschine aus einer Montagezeile kann zu Umsatzverlusten führen.Taking a machine offline from an assembly line can lead to loss of revenue. Daher ist die Modellevaluierung mit den richtigen Leistungsmetriken für neue Testdaten von entscheidender Bedeutung.So model evaluation with the right performance metrics against new test data is critical.

Hier sind einige gängige Leistungsmetriken beschrieben, die zum Evaluieren von PdM-Modellen dienen:Typical performance metrics used to evaluate PdM models are discussed below:

  • Die Genauigkeit ist die am häufigsten verwendete Metrik, die zum Beschreiben der Leistung eines Klassifizierers verwendet wird.Accuracy is the most popular metric used for describing a classifier’s performance. Die Genauigkeit reagiert aber sensibel auf Datenverteilungen und ist ein ineffektiver Wert für Szenarien mit unausgeglichenen Datasets.But accuracy is sensitive to data distributions, and is an ineffective measure for scenarios with imbalanced data sets. Stattdessen werden andere Metriken verwendet.Other metrics are used instead. Tools wie die Wahrheitsmatrix werden genutzt, um die Genauigkeit des Modells zu berechnen und zu hinterfragen.Tools like confusion matrix are used to compute and reason about accuracy of the model.
  • Die Genauigkeit (Precision) von PdM-Modellen bezieht sich auf die Rate der Fehlalarme.Precision of PdM models relate to the rate of false alarms. Eine geringere Genauigkeit des Modells basiert im Allgemeinen auf einer höheren Zahl von Fehlalarmen.Lower precision of the model generally corresponds to a higher rate of false alarms.
  • Mit der Trefferquote (Recall) wird angegeben, wie viele Fehler im Testsatz vom Modell richtig identifiziert wurden.Recall rate denotes how many of the failures in the test set were correctly identified by the model. Höhere Trefferquotenraten bedeuten, dass das Modell beim Identifizieren der tatsächlichen Fehler erfolgreich ist.Higher recall rates mean the model is successful in identifying the true failures.
  • Das F1-Maß (F1 Score) ist der harmonische Mittelwert aus der Genauigkeit und der Trefferquote, wobei der Wert zwischen 0 (am schlechtesten) und 1 (am besten) liegt.F1 score is the harmonic average of precision and recall, with its value ranging between 0 (worst) to 1 (best).

Für die binäre Klassifizierung:For binary classification,

  • Die ROC-Kurve (Receiver Operating Characteristic (ROC)) ist ebenfalls eine gängige Metrik.Receiver operating curves (ROC) is also a popular metric. Bei ROC-Kurven wird die Modellleistung basierend auf einem festen Punkt auf der ROC-Kurve interpretiert.In ROC curves, model performance is interpreted based on one fixed operating point on the ROC.
  • Für PdM-Probleme liefern Deziltabellen und Prognosegütediagramme aber mehr Informationen.But for PdM problems, decile tables and lift charts are more informative. Der Schwerpunkt liegt dabei nur auf der positiven Klasse (Fehler), und es ergibt sich ein komplexeres Bild der Algorithmusleistung als bei ROC-Kurven.They focus only on the positive class (failures), and provide a more complex picture of the algorithm performance than ROC curves.
    • Deziltabellen werden erstellt, indem Testbeispielwerte in absteigender Reihenfolge der Fehlerwahrscheinlichkeiten verwendet werden.Decile tables are created using test examples in a descending order of failure probabilities. Die sortierten Beispielwerte werden dann zu Dezilen gruppiert (10% der Beispiele mit der höchsten Wahrscheinlichkeit, dann 20%, 30% usw.).The ordered samples are then grouped into deciles (10% of the samples with highest probability, then 20%, 30%, and so on). Anhand des Verhältnisses „(Richtig-Positiv-Rate)/(Zufällige Baseline)“ für jedes Dezil kann die Algorithmusleistung der Dezile einzeln geschätzt werden.The ratio (true positive rate)/(random baseline) for each decile helps estimate the algorithm performance at each decile. Die zufällige Baseline hat den Wert 0,1, 0,2 usw.The random baseline takes on values 0.1, 0.2, and so on.
    • Bei Prognosegütediagrammen wird für alle Dezile die Richtig-Positiv-Rate eines Dezils gegenüber der zufälligen Richtig-Positiv-Rate ausgegeben.Lift charts plot the decile true positive rate versus random true positive rate for all deciles. Normalerweise stehen bei den Ergebnissen die ersten Dezile im Vordergrund, da hiermit die größten Vorteile erzielt werden.The first deciles are usually the focus of results, since they show the largest gains. Die ersten Dezile können auch als repräsentativ für den „Risikozustand“ angesehen werden, wenn sie für PdM verwendet werden.First deciles can also be seen as representative for "at risk", when used for PdM.

Modelloperationalisierung für Predictive MaintenanceModel operationalization for predictive maintenance

Der Vorteil des Data Science-Vorgangs wird nur realisiert, wenn für das trainierte Modell die Operationalität hergestellt wird.The benefit the data science exercise is realized only when the trained model is made operational. Dies bedeutet, dass das Modell in den Geschäftssystemen bereitgestellt werden muss, um Vorhersagen basierend auf neuen Daten zu treffen, die zuvor nicht bekannt waren.That is, the model must be deployed into the business systems to make predictions based on new, previously unseen, data. Die neuen Daten müssen auf zwei Arten genau mit der Modellsignatur des trainierten Modells konform sein:The new data must exactly conform to the model signature of the trained model in two ways:

  • Alle Features müssen in jeder logischen Instanz der neuen Daten (z.B. einer Tabellenzeile) vorhanden sein.all the features must be present in every logical instance (say a row in a table) of the new data.
  • Die neuen Daten müssen genau wie die Trainingsdaten vorverarbeitet werden, und die Features müssen entsprechend erstellt werden.the new data must be pre-processed, and each of the features engineered, in exactly the same way as the training data.

Der obige Prozess verfügt in akademischer Literatur und Branchenliteratur über viele verschiedene Bezeichnungen.The above process is stated in many ways in academic and industry literature. Aber mit allen folgenden Aussagen ist dasselbe gemeint:But all the following statements mean the same thing:

  • Bewerten von neuen Daten mit dem ModellScore new data using the model
  • Anwenden des Modells auf neue DatenApply the model to new data
  • Operationalisieren des ModellsOperationalize the model
  • Bereitstellen des ModellsDeploy the model
  • Ausführen des Modells für neue DatenRun the model against new data

Wie bereits erwähnt, unterscheidet sich die Modelloperationalisierung für PdM von vergleichbaren Ansätzen.As stated earlier, model operationalization for PdM is different from its peers. Bei Szenarien mit Anomalie- und Fehlererkennung wird normalerweise die Onlinebewertung (auch als Echtzeitbewertung bezeichnet) durchgeführt.Scenarios involving anomaly detection and failure detection typically implement online scoring (also called real time scoring). Hierbei wird jeder eingehende Datensatz vom Modell bewertet und eine Vorhersage zurückgegeben.Here, the model scores each incoming record, and returns a prediction. Für die Anomalieerkennung ist die Vorhersage ein Hinweis darauf, dass eine Anomalie aufgetreten ist (Beispiel: einklassige SVM).For anomaly detection, the prediction is an indication that an anomaly occurred (Example: One-class SVM). Für die Fehlererkennung ist dies der Typ oder die Klasse des Fehlers.For failure detection, it would be the type or class of failure.

Für PdM wird dagegen die Batchbewertung verwendet.In contrast, PdM involves batch scoring. Damit sie mit der Modellsignatur konform sind, müssen die Features in den neuen Daten genauso wie die Trainingsdaten erstellt werden.To conform to the model signature, the features in the new data must be engineered in the same manner as the training data. Für die großen Datasets, die für neue Daten typisch sind, werden Features in Zeitfenstern aggregiert und in Batches bewertet.For the large datasets that is typical for new data, features are aggregated over time windows and scored in batch. Die Batchbewertung wird normalerweise in verteilten Systemen wie Spark oder Azure Batch durchgeführt.Batch scoring is typically done in distributed systems like Spark or Azure Batch. Es gibt eine Reihe von Alternativen, die beide nicht optimal sind:There are a couple of alternatives - both suboptimal:

  • Bei Streamingdatenmodulen wird die Aggregation über Fenster im Arbeitsspeicher unterstützt.Streaming data engines support aggregation over windows in memory. Es kann also argumentiert werden, dass die Onlinebewertung unterstützt wird.So it could be argued that they support online scoring. Diese Systeme sind aber für Daten mit hoher Dichte in engen Zeitfenstern oder weniger Elemente in größeren Zeitfenstern geeignet.But these systems are suitable for dense data in narrow windows of time, or sparse elements over wider windows. Unter Umständen können sie für Daten mit hoher Dichte in größeren Zeitfenstern nicht gut skaliert werden, wie dies bei PdM-Szenarien zu beobachten ist.They may not scale well for the dense data over wider time windows, as seen in PdM scenarios.
  • Falls die Batchbewertung nicht verfügbar ist, besteht die Lösung darin, die Onlinebewertung so anzupassen, dass neue Daten jeweils in kleineren Batches verarbeitet werden.If batch scoring is not available, the solution is to adapt online scoring to handle new data in small batches at a time.

Lösungsvorlagen für Predictive MaintenanceSolution templates for predictive maintenance

Der letzte Abschnitt dieses Leitfadens enthält eine Liste mit den PdM-Lösungsvorlagen, Tutorials und Experimenten, die in Azure implementiert sind.The final section of this guide provides a list of PdM solution templates, tutorials, and experiments implemented in Azure. Diese PdM-Anwendungen können in einigen Fällen innerhalb weniger Minuten in einem Azure-Abonnement bereitgestellt werden.These PdM applications can be deployed into an Azure subscription within minutes in some cases. Sie können als Proof-of-Concept-Demos, Sandboxes zum Experimentieren mit Alternativen oder Beschleuniger für tatsächliche Produktionsimplementierungen verwendet werden.They can be used as proof-of-concept demos, sandboxes to experiment with alternatives, or accelerators for actual production implementations. Diese Vorlagen befinden sich im Azure KI-Katalog oder auf Azure GitHub.These templates are located in the Azure AI Gallery or Azure GitHub. Die unterschiedlichen Beispiele werden im Laufe der Zeit in diese Lösungsvorlage eingebunden.These different samples will be rolled into this solution template over time.

# TitelTitle BESCHREIBUNGDescription
22 Azure Predictive Maintenance Solution Template (Azure Predictive Maintenance-Lösungsvorlage)Azure Predictive Maintenance Solution Template Eine Open-Source-Lösungsvorlage zur Veranschaulichung von Azure ML-Modellierung in einer vollständigen Azure-Infrastruktur, die Szenarien für Predictive Maintenance im Kontext von IoT-Remoteüberwachung unterstützen kann.An open-source solution template which demonstrates Azure ML modeling and a complete Azure infrastructure capable of supporting Predictive Maintenance scenarios in the context of IoT remote monitoring.
33 Deep Learning for Predictive Maintenance (Deep Learning für Predictive Maintenance)Deep Learning for Predictive Maintenance Azure Notebook mit einer Demolösung für die Verwendung von LSTM-Netzwerken (Long Short-Term Memory) – einer Klasse von wiederkehrenden neuronalen Netzwerken – für Predictive Maintenance mit einem Blogbeitrag für dieses Beispiel.Azure Notebook with a demo solution of using LSTM (Long Short-Term Memory) networks (a class of Recurrent Neural Networks) for Predictive Maintenance, with a blog post on this sample.
44 Predictive Maintenance Modeling Guide in R (Predictive Maintenance – Leitfaden zur Modellierung in R)Predictive Maintenance Modeling Guide in R Leitfaden zur PdM-Modellierung mit Skripts in R.PdM modeling guide with scripts in R.
55 Azure Predictive Maintenance for Aerospace (Azure Predictive Maintenance für die Luft- und Raumfahrt)Azure Predictive Maintenance for Aerospace Eine der ersten PdM-Lösungsvorlagen, die auf Azure ML v1.0 für die Wartung von Flugzeugen basieren.One of the first PdM solution templates based on Azure ML v1.0 for aircraft maintenance. Dieser Leitfaden ist aus diesem Projekt entstanden.This guide originated from this project.
66 Azure AI Toolkit for IoT Edge (Azure KI-Toolkit für IoT Edge)Azure AI Toolkit for IoT Edge KI für IoT Edge mit TensorFlow. Im Toolkit sind Deep Learning-Modelle in Azure IoT Edge-kompatiblen Docker-Containern verpackt, und die Modelle werden als REST-APIs verfügbar gemacht.AI in the IoT Edge using TensorFlow; toolkit packages deep learning models in Azure IoT Edge-compatible Docker containers and expose those models as REST APIs.
77 Azure IoT Predictive MaintenanceAzure IoT Predictive Maintenance Azure IoT Suite PCS (Preconfigured Solution, vorkonfigurierte Lösung).Azure IoT Suite PCS - Preconfigured Solution. PdM-Vorlage für die Flugzeugwartung mit IoT Suite.Aircraft maintenance PdM template with IoT Suite. Nutzen Sie auch ein weiteres Dokument und die exemplarische Vorgehensweise für dasselbe Projekt.Another document and walkthrough related to the same project.
88 Predictive Maintenance template using SQL Server R Services (Predictive Maintenance-Vorlage mit SQL Server R Services)Predictive Maintenance template using SQL Server R Services Demo des Szenarios mit einer verbleibenden Nutzungsdauer basierend auf R Services.Demo of remaining useful life scenario based on R services.
99 Predictive Maintenance Modeling Guide (Modellhandbuch für die vorbeugende Wartung)Predictive Maintenance Modeling Guide Datasetfeature für die Wartung von Flugzeugen, das mit R erstellt wurde und über Experimente und Datasets sowie ein Azure Notebook und Experimente in AzureML v1.0 verfügt.Aircraft maintenance dataset feature engineered using R with experiments and datasets and Azure notebook and experiments in AzureML v1.0

Schulungsressourcen für Predictive MaintenanceTraining resources for predictive maintenance

Microsoft Azure bietet Lernpfade für die grundlegenden Konzepte, die hinter PdM-Techniken stehen, außerdem Inhalte, Schulungen und Übungen zu allgemeinen KI-Konzepten.Microsoft Azure offers learning paths for the foundational concepts behind PdM techniques, besides content and training on general AI concepts and practice.

SchulungsressourceTraining resource VerfügbarkeitAvailability
Lernpfad für PdM mithilfe von Trees und Random ForestLearning Path for PdM using Trees and Random Forest ÖffentlichPublic
Lernpfad für PdM mithilfe von Deep LearningLearning Path for PdM using Deep Learning ÖffentlichPublic
AI Developer in AzureAI Developer on Azure ÖffentlichPublic
Microsoft AI SchoolMicrosoft AI School ÖffentlichPublic
Azure KI-Lernmaterial auf GitHubAzure AI Learning from GitHub ÖffentlichPublic
LinkedIn LearningLinkedIn Learning ÖffentlichPublic
Microsoft KI – YouTube-WebinareMicrosoft AI YouTube Webinars ÖffentlichPublic
Microsoft AI ShowMicrosoft AI Show ÖffentlichPublic
LearnAI@MS PartnerPartners
Microsoft Partner NetworkMicrosoft Partner Network PartnerPartners

Zusätzlich werden kostenlose MOOCs (Massive Open Online Courses) zu KI von akademischen Institutionen wie Stanford und MIT sowie anderen Bildungseinrichtungen angeboten.In addition, free MOOCS (massive open online courses) on AI are offered online by academic institutions like Stanford and MIT, and other educational companies.