练习 - 选择机器学习算法来预测火箭发射是否成功

已完成

你已选择要使用哪些列来预测在特定天气条件下是否会发射火箭。 现在,你需要选择用哪种算法来创建模型。 回想一下,你已简要了解 Azure 机器学习算法速查表

Flowchart-style diagram of the Machine Learning Algorithm Cheat Sheet.

记住你的问题:能否预测在特定天气条件下是否有可能成功发射?该问题有两种选择。 火箭将成功发射:是或否。 这个问题被视为双类分类问题。

在这类算法中,有许多特定算法可供选择。 在本例中,你将了解双类决策树。 如果直观呈现决策树的结果,会得到相关见解,它们有助于后续对数据收集、清理和处理进行迭代。

在 Python 中创建机器学习模型

使用 scikit-learn 可轻松创建该练习所需的机器学习模型。 将此代码粘贴到 Visual Studio Code 的另一个单元中:

# Create decision tree classifier 
tree_model = DecisionTreeClassifier(random_state=0,max_depth=5)

让我们看看有关决策树分类器的文档。 了解此处指定的两个参数的重要性:random_statemax_depth

random_state 参数用于大多数机器学习算法。 它会控制算法的随机性。 使用此估算器将数据拆分为训练数据和测试数据时,此处提供的种子指示该拆分的随机性。 下一单元将详细介绍数据拆分。

max_depth 参数特定于树,可用于确定模型输出的范围。 在这种情况下,了解特定天气条件的所有可能概率及其对火箭成功发射可能性的潜在影响可能无法提供有用信息。 知识深度的上限为 5,这样可以仅获得与结果相关性最高的知识。

进一步探索

如果感兴趣,可尝试原封不动地完成本模块。 然后,可回来更改参数值,了解可能会发现的新见解类型。