Übung: Trainieren und Testen des Machine Learning-Modells, um einen erfolgreichen Raketenstart vorherzusagen

Abgeschlossen

Nachdem die Daten in die Trainings- und die Testgruppe aufgeteilt wurden, kann das Machine Learning-Modell trainiert werden. Einer der Gründe, warum Python eine beliebte Sprache für Data Science und maschinelles Lernen ist, liegt in der Vielzahl der Bibliotheken, die zur Unterstützung des Datenstudiums vorhanden sind. Wie wir gesehen haben, war es einfach, das Machine Learning-Modell zu erstellen und die Daten aufzuteilen. Das Anpassen und Testen unseres Modells ist ebenfalls einfach.

Anpassen des Modells

Der nächste Schritt im Data Science-Lebenszyklus besteht darin, das Modell an die Trainingsdaten anzupassen. Während dieses Vorgangs der „Anpassung“ erfolgt im Wesentlichen der Lernvorgang des Modells. Dieser Prozess wurde anhand des Beispiels der Beeren beschrieben. Der Mensch wurde „angepasst“, als er eine Beere zeigte und man ihm sagte, was es war. Um das Modell anzupassen, wird fit() im Machine-Learning-Klassifizierer aufgerufen, und die Daten von X_train und y_train werden übergeben.

Die Anpassung des Modells ähnelt einer praktischen Prüfung, bei der Sie Zugriff auf die Antworten haben, um sicherzustellen, dass Sie die Konzepte verstehen.

# Fitting the model to the training data
tree_model.fit(X_train,y_train)

Testen des Modells

Die importierten Bibliotheken erleichtern auch das Testen des Modells. Das Testen des Modells ähnelt dem Absolvieren einer Prüfung. Sie stellen X_test (die 20 % der Eingabedaten, die Sie für das Testen reserviert haben) für die Funktion predict() des Klassifizierers bereit. Diese Funktion gibt eine Liste von Y und N zurück, die darstellt, was nach Ansicht des Modells passieren würde, wenn ein Raketenstart unter einem bestimmten Satz von Wetterbedingungen versucht würde.

Fügen Sie den folgenden Code in Visual Studio Code ein, um Vorhersagen zu erhalten, und drucken Sie dann die Vorhersagen aus.

# Do prediction on test Data
y_pred = tree_model.predict(X_test)
print(y_pred)

Wie viele Y haben Sie erhalten? Wirken die Vorhersagen repräsentativ für die eingegebenen Daten? Dies ist ohne weitere Untersuchung nicht klar, aber bisher enthält die Ausgabe ~9 Y-Antworten bei 60 Eingabewerten. Bei ungefähr 20 % aller Daten wurde Yzurückgegeben. Unser Prozentsatz entspricht ungefähr 15 % dieser vorhergesagten Daten, ist also relativ nahe dran.