練習 - 訓練及測試機器學習模型來預測火箭發射成功

已完成

將資料分成訓練區段與測試區段之後,即可訓練機器學習模型。 Python 為資料科學與機器學習熱門語言的其中一個原因,是因為其所有支援資料研究的程式庫。 如您所見,取得建立的機器學習模型與資料分割十分簡單。 調整及測試模型也變得簡單。

調整模型

資料科學生命週期的下一個步驟是調整訓練資料的模型。 「調整」動作基本上是模型正在學習的地方。 此程序已在莓果範例中說明。 在人們帶來了莓果並被告知其種類時,這即表示正在「調整」人們。 為了符合模型,您可在機器學習分類器上呼叫 fit(),並傳入 X_trainy_train 資料。

調整模型就像是進行練習測驗,可在其中存取答案以確定您了解這些概念。

# Fitting the model to the training data
tree_model.fit(X_train,y_train)

測試模型

使用已匯入的程式庫也可供輕鬆測試模型。 測試模型如同進行測驗。 您將會在分類器的 predict() 函式中提供 X_test (您為測試所保留的 20% 輸入資料)。 當嘗試火箭發射時,若有一組特定的天氣狀況,此函式就會傳回 YN 的清單,其表示此模型所認為會發生的情況。

在 Visual Studio Code 中貼上下列程式碼以進行預測,然後列印該預測。

# Do prediction on test Data
y_pred = tree_model.predict(X_test)
print(y_pred)

您取得了多少個 Y? 預測看起來會代表輸入的資料嗎? 沒有進一步調查所以不清楚,但目前輸出包含 ~9 個 Y 回應 (共 60 個輸入值)。 大約有 20% 的資料總計會產生 Y。 此百分比大約是此預測資料的 15%,所以相當接近。