練習 - 評分預測火箭發射成功的機器學習模型
對產生 Y
發射的資料百分比進行簡單比較,有助於檢查模型是否接近正確。 但實際評分模型更有用。
評分模型
如同測驗,學習可以用分數來測量。 您可呼叫單行函式,以查看模型在預測是否會發生發射時的精確度。
# Calculate accuracy
tree_model.score(X_test,y_test)
使用 score()
函式,傳入 X_test
輸入資料與 y_test
輸出資料來為模型「評分」。 評分越高,模型根據天氣資料預測火箭發射的結果就越精確。
了解評分
本範例中的模型為 98.3% 正確,這結果是好的。 事實上,使用少量的資料清理與操作,以及已知的資料問題,結果看似太美好。
也許我們擁有最佳資料且已正確地定型模型,才能取得如此精確的結果。 但也許這個精確率代表我們僅擅長預測這份部分為編造出來的數據。 因此,這個分數在真實世界中並不可靠。 就內容而言,決策樹分類器 (第一次執行時) 的精確度為 70% 很常見。
您要如何確定評分本身能準確代表模型的正確度?
其中一種方式是要求專家為未發射日期的資料填入 Y
與 N
資料,而不只是猜測 N
。 例如,發射前後一天的可能性「也」是很好的發射日,可能比我們在這項資料中所代表的還高。