发现新的回归模型

已完成

在第 2 单元中,我们学习了如何在数据点上拟合一条直线。 但是,回归可以适用于许多类型的关系,包括有多个因素的关系,以及一个因素的重要性取决于另一个因素的关系。

试验模型

人们经常选择回归模型是因为它们处理小型数据样本、可靠、易于解释并且存在多种类型。

线性回归是最简单的回归形式,对使用的特征数量没有限制。 线性回归有多种形式,通常根据所使用的特征数量和所拟合的曲线的形状命名。

决策树采用分步方法预测变量。 如果我们考虑自行车的例子,决策树可能首先是在春/夏季节和秋/冬季节的例子期间拆分的示例,根据星期几进行预测。 春/夏季节周一的自行车租赁率可能为每天 100,而秋/冬季节周一的租赁率可能为每天 20。

集成算法不仅构造一个决策树,还构造大量的树,允许对更复杂的数据进行更好的预测。 集成算法(例如随机森林)具有很强的预测能力,因此被广泛应用于机器学习和数据科学领域。

数据科学家通常尝试使用不同的模型。 在下面的练习中,我们将试验不同类型的模型,以比较它们在相同数据上的表现。