前提条件和准备工作 | 机器学习速成课程 | Google Developers
机器学习速成课程适合您吗?
在开始机器学习速成课程之前,请先阅读下面的 前提条件和 准备工作部分,以确保您已做好完成所有单元所需的准备工作。
前提条件
机器学习速成课程并不会假定或要求您预先掌握机器学习方面的任何知识。但是,为了能够理解课程中介绍的概念并完成练习,您最好满足以下前提条件:
-
掌握入门级代数知识。您应该了解变量和系数、线性方程式、函数图和直方图(熟悉对数和导数等更高级的数学概念会有帮助,但不是必需条件)。
-
熟练掌握编程基础知识,并且具有一些使用 Python 进行编码的经验。机器学习速成课程中的编程练习是通过 TensorFlow并使用 Python进行编码的。您无需拥有使用 TensorFlow 的任何经验,但应该能够熟练阅读和编写包含基础编程结构(例如,函数定义/调用、列表和字典、循环和条件表达式)的 Python 代码。
准备工作
可使用 Colaboratory平台直接在浏览器中运行编程练习(无需设置!)。Colaboratory 支持大多数主流浏览器,并且在 Chrome 和 Firefox 的各个桌面版本上进行了最全面的测试。如果您想下载并离线运行这些练习,请参阅有关设置本地环境的 说明。
Pandas 使用入门
机器学习速成课程中的编程练习使用 Pandas库来操控数据集。如果您不熟悉 Pandas,最好先学习 Pandas 简介教程,该教程介绍了练习中使用的主要 Pandas 功能。
低阶 TensorFlow 基础知识
机器学习速成课程中的编程练习使用 TensorFlow 的高阶 tf.estimator API来配置模型。如果您有兴趣从头开始构建 TensorFlow 模型,请学习以下教程:
- TensorFlow Hello World在低阶 TensorFlow 中编码的“Hello World”。
- TensorFlow 编程概念演示了 TensorFlow 应用中的基本组件:张量、指令、图和会话。
- 创建和操控张量张量快速入门:TensorFlow 编程中的核心概念。此外,还提供了线性代数中的矩阵加法和乘法方面的复习进修内容。
主要概念和工具
机器学习速成课程中介绍并应用了以下概念和工具。有关详情,请参阅链接的资源。
数学
代数
线性代数
三角学
统计信息
- 平均值、中间值、离群值和 标准偏差
- 能够读懂 直方图
微积分(可选,适合高级主题)
Python 编程
基础 Python
Python 教程中介绍了以下 Python 基础知识:
-
for
循环:包含多个迭代器变量的for
循环(例如for a, b in [(1,2), (3,4)]
) -
字符串格式化(例如
'%.2f' % 3.14
) -
变量、赋值、 基本数据类型(
int
、float
、bool
、str
)
中级 Python
Python 教程还介绍了以下更高级的 Python 功能:
第三方 Python 库
机器学习速成课程代码示例使用了第三方库提供的以下功能。无需提前熟悉这些库;您可以在需要时查询相关内容。
Matplotlib(适合数据可视化)
Seaborn(适合热图)
-
heatmap
函数
Pandas(适合数据处理)
NumPy(适合低阶数学运算)
scikit-learn(适合评估指标)
- metrics模块
Bash 终端/云端控制台
要在本地计算机上或云端控制台中运行编程练习,您应该能熟练使用命令行: