用于机器学习的数据科学基础

学习路径
14 模块

初级

中级

AI 工程师

数据科学家

开发人员

学生

Azure

Microsoft Learn 提供了几种交互式方法来了解经典机器学习。这些学习路径可帮助你提高工作效率，也是继续学习深度学习主题的很好基础。

从最基本的经典机器学习模型，到探索性数据分析和自定义体系结构，你将获得易于理解的概念性内容和交互式 Jupyter 笔记本的指导，无需离开浏览器即可实现这一切。

根据你的教育背景和兴趣选择你自己的路径。

✔ 选项 1：完整课程：用于机器学习的数据科学基础

建议大多数人采用此选项。它具有与其他两个学习路径相同的模块，以及可最大程度强化概念的定制流程。如果你想要了解基础概念以及如何利用最常见的机器学习工具来构建模型，那么此路径适合你。如果你希望超越经典机器学习的范畴，了解深度学习和神经网络（我们只在此路径中提供相关介绍），这也是最佳路径。

✔ 你当前位于此路径中，请向下滚动以开始学习。

选项 2：“了解用于机器学习的数据科学”学习路径

如果你希望了解机器学习的工作原理，并且你没有太强的数学背景，那么此路径适合你。此路径对教育背景没有要求（除了需对编码概念略有了解），通过代码、比喻和可视化进行教学，帮助你理解相关内容。此路径是实操型的，但更侧重于理解基础知识，而不是了解可用的工具和库的功能。

选项 3：“创建机器学习模型”学习路径

如果你已对机器学习概念有一定了解或者具有强大的数学背景，则最好直接转到“创建机器学习模型”学习路径。这些模块会教授一些机器学习概念，但进度很快，使你可以了解 scikit-learn、TensorFlow 和 PyTorch 等工具的强大功能。如果你希望适当了解适用于 Azure ML 或 Azure Databricks 等产品的机器学习示例，那么此学习路径也是最佳选择。

先决条件

无

本学习路径中的模块

机器学习简介

机器学习的简要概述，适用于对计算机科学和统计学知之甚少或一无所知的人。我们将介绍一些基本概念，浏览数据，并以交互方式探索机器学习生命周期 - 使用 Python 来训练、保存和使用机器学习模型，就像在现实世界中一样。

使用监督式学习构建传统机器学习模型

监督式学习是一种算法通过示例数据学习的机器学习形式。我们将逐步讲解监督式学习如何自动生成可对现实世界进行预测的模型。还将介绍测试这些模型的方式以及在训练它们时可能会出现的难题。

机器学习数据简介

机器学习模型的强大之处来自用于对它们进行训练的数据。通过内容和练习，我们将探索如何理解数据、如何对其进行编码以使计算机能够正确解释数据、如何清理错误，并探讨有助于创建高性能模型的技巧。

使用 Python 探索和分析数据

数据探索和分析是数据科学的核心。数据科学家需要拥有像 Python 这样的编程语言技能来探索、可视化和操作数据。

训练和了解机器学习中的回归模型

回归无疑是一种最广泛使用的机器学习技术，通常在基础科学发现、业务规划和股票市场分析中使用。此学习材料深入探讨了一些常见的回归分析（包括简单和更复杂的分析），并提供了有关如何评估模型性能的一些见解。

优化和测试机器学习模型

当我们想到机器学习时，通常关注的是训练过程。在此过程之前进行少量的准备工作，不仅可以加快和改进学习进程，而且在我们面对从未见过的数据时，可以对我们的模型工作效果有一些信心。

训练和评估回归模型

回归是一种常用的机器学习，用于预测数值。

创建并了解机器学习中的分类模型

分类是指将项分配到类别，也可以被视为自动做出决策。在这里，我们通过逻辑回归介绍分类模型，为你提供实现更复杂且令人兴奋的分类方法的垫脚石。

使用随机森林选择和自定义体系结构和超参数

通常可以手动自定义更复杂的模型，以提高它们的效率。通过练习和解释性内容，我们探索了如何改变更复杂模型的体系结构，以产生更有效的结果。

混淆矩阵和数据不平衡

对数据分类时，如何判断模型是好还是不好？计算机评估模型性能的方式有时对于我们来说可能难以理解或者可以进一步简化模型的实际表现。若要构建模型，使其以令人满意的方式工作，我们需要找到直观的方法来评估这些指标，并了解这些指标如何影响我们的观点。

使用 ROC 和 AUC 测量和优化模型性能

接受者操作特征曲线是评估和微调经过训练的分类模型的一种强大方法。我们通过学习内容和实际练习来介绍和说明这些曲线的效用。

训练和评估分类模型

分类属于一种机器学习，用于将项目归入类中。

训练和评估聚类分析模型

聚类分析是一种机器学习，用于将相似项分组到群集。

训练和评估深度学习模型

深度学习是一种高级的机器学习形式，它通过连接的神经元网络模拟人类大脑学习的方式。