練習 - 訓練及測試機器學習模型來預測火箭發射成功

將資料分成訓練區段與測試區段之後，即可訓練機器學習模型。 Python 為資料科學與機器學習熱門語言的其中一個原因，是因為其所有支援資料研究的程式庫。如您所見，取得建立的機器學習模型與資料分割十分簡單。調整及測試模型也變得簡單。

調整模型

資料科學生命週期的下一個步驟是調整訓練資料的模型。「調整」動作基本上是模型正在學習的地方。此程序已在莓果範例中說明。在人們帶來了莓果並被告知其種類時，這即表示正在「調整」人們。為了符合模型，您可在機器學習分類器上呼叫 fit()，並傳入 X_train 與 y_train 資料。

調整模型就像是進行練習測驗，可在其中存取答案以確定您了解這些概念。

# Fitting the model to the training data
tree_model.fit(X_train,y_train)

使用已匯入的程式庫也可供輕鬆測試模型。測試模型如同進行測驗。您將會在分類器的 predict() 函式中提供 X_test (您為測試所保留的 20% 輸入資料)。當嘗試火箭發射時，若有一組特定的天氣狀況，此函式就會傳回 Y 與 N 的清單，其表示此模型所認為會發生的情況。

在 Visual Studio Code 中貼上下列程式碼以進行預測，然後列印該預測。

# Do prediction on test Data
y_pred = tree_model.predict(X_test)
print(y_pred)

您取得了多少個 Y？預測看起來會代表輸入的資料嗎？沒有進一步調查所以不清楚，但目前輸出包含 ~9 個 Y 回應 (共 60 個輸入值)。大約有 20% 的資料總計會產生 Y。此百分比大約是此預測資料的 15%，所以相當接近。