【蔻享书苑】机器学习入门教材《机器学习算法（MATLAB版）》

（以下内容摘自《机器学习算法（MATLAB版）》）

《机器学习算法（MATLAB版）》

作者：马昌凤柯艺芬谢亚君

书号：978-7-03-060319-7

￥75.46(7.7折)

原价￥98.00

扫码购买书籍

机器学习的基本术语

掌握一门学科的基本术语对学好这门学科是至关重要的。假定我们通过记录的方式获得了一个关于西瓜的训练数据集，如表 1.1 所示。我们将以这个数据集中的数据为例对机器学习的基本术语进行具体化，以便加深对有关概念的理解。

记录表 1.1 中各项数据的集合称为“数据集”或“样本集”，表格的每一行数据 (这里是对每一个西瓜的描述) 称为一个“示例”或“样本”。反映事件或对象在某方面的表现或性质的事项，称为“属性”或“特征”，如表格中的“色泽”“根蒂”“敲声”等；而每个属性或特征的取值, 称为“属性值”或“特征值”，例如表格中的“青绿”“乌黑”等。属性 (特征) 张成的空间称为“属性空间”(或“样本空间”“输入空间”)，例如将表格中的“色泽”“根蒂”“敲声”作为三个坐标轴，则它们张成一个用于描述西瓜的三维空间，每个西瓜都可在这个空间中找到自己的坐标位置。由于属性空间中的每个点对应着一个坐标向量，因此可以把一个示例称为一个“特征向量”(或“属性向量”)。对于表 1.1 中的某一行数据，利用“色泽”“根蒂”“敲声”三个属性进行取值记录，可认为该样本的“维数”为 3。从数据中学得模型的过程称为“学习”或“训练”，这个过程通过执行某个学习算法来完成。训练过程中使用的数据称为“训练数据”，其中每个样本称为一个“训练样本”，训练样本组成的集合称为“训练集”。“标记/标签”用来表示样本的结果信息，例如表中的“是否好瓜”。“样例”是指既包含样本属性值又包含标签的样本。注意样例与样本的区别，后者包括训练样本和测试样本，样本不一定具有标签。所有标记结果的集合称为“标记空间/输出空间”。

根据已有的众多样本来判断某一样本的输出结果的过程称为“预测”。当预测结果是离散值时, 如表中的“好瓜”“非好瓜”, 此类学习任务称为“分类”。特别地，对只涉及两个类别的“二分类”任务，通常称其中一个类为“正类”，另一个类为“负类 ”；当涉及多个类别时，则称为“多分类”任务。若欲预测的是连续值，例如西瓜成熟度，此类学习任务称为“回归”。一般地，预测任务是希望通过对训练集 {(x1, y1), (x2, y2), ..., (xn, yn)} 进行学习，建立一个从输入空间 X 到输出空间 Y 的映射 f : X → Y。对二分类任务，通常令 Y = {-1, +1} 或 {0, 1}；对多分类任务，|Y| > 2；对回归任务，Y = R，R 为实数集。

没有用于模型训练的样本都可认为是该模型的“新样本”。学得模型适用于新样本的能力，称为“泛化”能力。学得模型后，使用其进行预测的过程称为“测试”，被预测的样本称为“测试样本”。例如在学得映射 f 后，对测试例 x，可得到其预测标记 y = f(x)。

还可以对样本做“聚类”，也就是将训练集中的样本分成若干组，每个组称为一个“簇”，这些自动形成的簇可能对应一些潜在的概念划分，例如“浅色瓜”“深色瓜”等。这样的学习过程有助于人们了解数据内在的规律，能为更深入地分析数据建立基础。值得注意的是，在聚类学习中，“浅色瓜”“深色瓜”这样的概念事先是不知道的，是学习过程中得到的。而且学习过程中使用的训练样本通常不拥有标记信息。

机器学习算法的分类

机器学习的本质是模型的选择和模型参数的确定。根据训练数据是否拥有标记信息，学习任务可大致划分为两大类：监督学习和无监督学习，分类和回归是监督学习的代表，且样本拥有标记信息，而聚类则是无监督学习的代表，且样本不具有标记信息。

监督学习与无监督学习

监督学习的样本数据 xi (i = 1, 2, ..., n) 带有标签值 yi (i = 1, 2, ..., n)，它从训练样本中学得一个模型，然后用这个模型对新的样本进行预测推断。通俗地说，监督学习就是从训练样本数据中学得一个映射函数 f 以及函数的参数 θ，建立如下的映射关系：

其中，样本向量 x 是模型的输入值，标签 y 是模型的输出值。标签可以是整数，也可以是实数，还可以是向量。确定这个映射的依据是它能够很好地解释训练样本，让映射的输出值与真实的样本标签值之间的误差极小化，或者让训练样本集的对数似然函数极大化。

日常生活中，监督学习的应用例子很多，例如人脸识别、垃圾邮件分类、语音识别、手写体辨识等等。这类问题需要先收集训练样本，并对样本进行标注，然后用标注好的样例 (样本 + 标记) 去训练模型，最后用训练好的模型对新的样本进行预测。

无监督学习对没有标签的样本数据进行分析，去发现样本集所具有的内在结构或分布规律。无监督学习的典型代表是聚类分析、数据降维和表示学习，它们所处理的样本都不带有标签信息。

聚类分析属于分类问题，但不具有训练过程。聚类把一批没有标签的样本数据划分成多个“簇”，使得在某种相似度指标下每个簇内的样本尽量相似，而不同簇的样本之间尽量不相似。聚类算法只有输入向量而没有标签值，也没有训练过程，我们在后续的章节中将详细介绍各种典型的聚类算法。数据降维也是一种无监督学习方法，它将 m 维向量空间中的点通过一个函数映射到更低维的 l (l<

通过将数据映射到低维空间，可以更容易对它们处理和分析。如果将数据降维到二维或三维空间，还可以直观地将降维后的样本数据可视化。我们将在后续章节中详细介绍数据降维的典型代表——主成分分析法。

无监督学习的另一类典型算法是表示学习。表示学习自动从样本中学习出有用的特征，用于聚类和分类等目的。典型的表示学习算法有自动编码器和受限玻尔兹曼机，它们的输入是没有标签值的样本数据，如图像和语音信号等，输出值是提取的特征向量。

有些应用问题，对训练样本进行标记具有很高的成本。如何利用少量有标记样本和大量无标记样本进行学习，就是所谓的“半监督学习”。半监督学习的训练样本是有标记样本与无标记样本的混合，且一般情况下无标记样本的数量远大于有标记样本。关于半监督学习的原理，本书不打算详细阐述，有兴趣的读者可参考有关文献。

分类问题与回归问题

（1）分类问题

在监督学习中，如果样本标签是离散值，这类问题称为分类问题，其预测函数是一个向量到整数的映射: R^m → Z。通俗地说，分类问题是用于将事物打上一个标签，例如判断一幅图片上的动物是一只猫还是一只狗。在分类问题中，样本的标签是其类别编号，一般从 0 或 1 开始编号。如果类别数为 2，则称为二分类问题，其类别标签通常设置为 +1 和 -1 (也可以设置为 0 和 1)，分类对应正类样本和负类样本。例如在图像识别中，要判断一幅图像是否为人脸，那么正类样本为人脸，负类样本为非人脸。分类并没有逼近的概念，最终正确结果只有一个，错误的就是错误的，不会有相近的概念。最常见的分类方法是逻辑回归，或者叫逻辑分类。

对于分类问题，如果预测函数是线性函数，则称为线性模型，否则称为非线性模型。线性模型是 R^m 中的线性划分。线性函数是超平面 (在二维空间中是直线，三维空间中是平面)。线性模型的二分类问题使用的预测函数通常是

其中 w 是权重向量，b 是偏置项。后续章节要介绍的线性支持向量机、逻辑斯谛回归等都属于线性模型。

非线性模型的预测函数是非线性映射，其分类边界是 R^m 中的一个超曲面。在实际应用中样本数据一般是非线性的，因此，要求决策函数必须具有非线性拟合的能力，如后续章节中将介绍的人工神经网络、核映射支持向量机、决策树等都属于非线性模型。

（2）回归问题

在监督学习中，如果标签值是连续实数，这类学习问题称为回归问题。回归问题是对于连续性数据，从已有的数据分析来预测结果，它的预测函数是向量到实数的映射: R^m → R。例如预测房价、未来的天气情况等都属于回归分析问题。

预测函数可以是线性函数，也可以是非线性函数。如果是线性函数则称为线性回归，否则称为非线性回归。回归分析的任务就是对于给定的训练样本集，选择预测函数的类型，然后确定函数的参数值，例如线性模型 y = wTx + b 中的参数 w 和 b。确定参数的常用方法是构造一个损失函数 l(x, θ)，它表示预测函数的输出值与样本真实标签值之间的误差，对所有训练样本的误差求平均值，得到一个关于参数 θ 的极小化问题：

其中，l(xi; θ) 是单个样本的损失函数，n 为训练样本数。极小化损失函数 l(θ) 可以确定参数 θ 的值，从而确定预测函数。对于机器学习算法，关键的一步就是确定损失函数。一旦确定了损失函数，问题就转化为求解一个最优化问题，这在数学上一般有标准的解决方案。

生成模型与判别模型

按照模型的求解方法，可以将分类算法分成生成模型和判别模型。给定样本特征向量 x 和标签 y，生成模型是对联合概率 p(x, y) 建模，而判别模型则是对条件概率 p(y | x) 建模。不使用概率模型的分类器被归为判别模型，它直接得到决策函数而不关心样本的概率分布。

典型的生成模型有高斯混合模型、贝叶斯分类器、隐马尔可夫模型、生成对抗网络、受限玻尔兹曼机等。而常见的判别模型有决策树、人工神经网络、k 近邻算法、逻辑斯谛回归、支持向量机、AdaBoost 算法等。

强化学习

强化学习是一类特殊的机器学习算法，这类算法根据输入数据确定要执行的动作，输入数据是环境参数。强化学习研究如何通过一系列的顺序决策来达成一个特定目标。强化学习的完整过程是：机器从一开始什么都不懂，通过不断地尝试，从错误中学习，最后找到规律，从而达到学习目的。实际中的强化学习例子有很多，比如近期最有名的阿尔法狗，机器头一次在围棋场上战胜人类高手。

与监督学习算法相类似，强化学习也有训练过程，训练时对正确的动作予以奖赏，对错误的动作予以惩罚，训练完之后用得到的模型进行预测。在后续章节中，我们将专门介绍强化学习算法。

值得注意的是，随着机器学习技术的迅速发展，越来越多新的机器学习算法被研究者们创造出来。而由经典算法衍生出来的机器学习算法更是种类繁多，在此不一一列举。此外，算法的分类不是绝对的，随着经典机器学习算法的大量衍生，其分类出现了大量的交叉。例如，在由神经网络算法衍生出的众多深度学习算法中，卷积神经网络算法属于监督学习，而稀疏编码算法属于无监督学习。

内容简介

本书是机器学习领域的入门教材，详细阐述了机器学习的基本理论和方法。全书由15章组成，包括机器学习概论、数学基础知识、线性模型与逻辑斯谛回归、支持向量机、人工神经网络、决策树算法、贝叶斯算法、k近邻算法、数据降维算法、聚类算法、高斯混合模型与EM算法、集成学习算法、最大熵算法、概率图算法以及强化学习算法等。对每一种机器学习算法，均从算法原理的理论推导和MATLAB实现两方面进行介绍。本书既注意保持理论分析的严谨性，又注重机器学习算法的实用性，同时强调机器学习算法的思想和原理在计算机上的实现。全书内容选材恰当，系统性强，行文通俗流畅,具有较强的可读性。

适用对象

本书建议课时为60课时（其中含上机实验12课时），可作为计算机科学与技术、信息与计算科学、统计学以及数学与应用数学等本科专业的教材或教学参考书，也可以作为理工科研究生机器学习课程的教材或教学参考书。

本书特色

（1）机器学习领域的入门教材，力求系统而详细地介绍机器学习的基本理论与算法。

（2）既注意保持理论分析的严谨性，又注重机器学习算法的实用性，同时强调机器学习算法的思想和原理在计算机上的实现。

（3）各章节主要算法都给出MATLAB程序及相应的计算实例。

（4）配有电子课件和电子版程序，便于教学。

目录

向上滑动阅览

第1章机器学习概论

1.1机器学习的基本定义

1.2机器学习的基本术语

1.3机器学习算法的分类

1.3.1监督学习与无监督学习

1.3.2分类问题与回归问题

1.3.3生成模型与判别模型

1.3.4强化学习

1.4机器学习模型的评价指标

1.4.1模型的泛化能力

1.4.2模型的评估方法

1.4.3精度与召回率

1.4.4 ROC 曲线与 AUC

1.5机器学习模型的选择

1.5.1正则化技术

1.5.2偏差-方差分解

1.6机器学习应用的基本流程

1.7机器学习的用途及发展简史

第2章数学基础知识

2.1 矩阵与微分

2.1.1 矩阵的基本运算

2.1.2 矩阵对标量的导数

2.1.3 矩阵变量函数的导数

2.1.4 向量函数的导数

2.1.5 矩阵和向量的微分

2.1.6 特征值分解和奇异值分解

2.2 最优化方法

2.2.1 无约束优化方法

2.2.2 约束优化与 KKT 条件

2.2.3 二次规划

2.2.4 半定规划

2.3 概率与统计

2.3.1 随机变量与概率

2.3.2 条件概率与独立性

2.3.3 期望、马尔可夫不等式和矩生成函数

2.3.4 方差与切比雪夫不等式

2.3.5 样本均值与样本方差

2.3.6 极大似然估计

2.3.7 熵与 KL 散度

第3章线性模型与逻辑斯谛回归

3.1 线性模型的基本形式

3.1.1 线性回归模型的理论基础

3.1.2 线性回归模型的 MATLAB 实现

3.2 逻辑斯谛回归模型

3.2.1 逻辑斯谛回归的基本原理

3.2.2 逻辑斯谛回归的 MATLAB 实现

3.3 线性判别分析

3.3.1 线性判别分析的基本原理

3.3.2 线性判别分析的 MATLAB 实现

第4章支持向量机

4.1 支持向量机的算法原理

4.1.1 线性可分问题

4.1.2 线性不可分问题

4.2 核映射 (核函数) 支持向量机

4.3 SMO 算法原理及推导

4.3.1 子问题的求解

4.3.2 优化变量的选择

4.4 支持向量回归模型

4.5 支持向量机的 MATLAB 实现

第5章人工神经网络

5.1 前馈神经网络简介

5.1.1 M-P 神经元

5.1.2 感知器模型

5.1.3 多层前馈网络

5.2 误差逆传播算法

5.2.1 一个单隐层网络实例

5.2.2 误差逆传播 (BP) 算法

5.3 神经网络的数学性质与实现细节

5.3.1 神经网络的数学性质

5.3.2 全局最小与局部极小

5.3.3 面临的问题与实现细节

5.4 神经网络的 MATLAB 实现

第6章决策树算法

6.1 决策树算法的基本原理

6.1.1 树模型决策过程

6.1.2 决策树算法的基本框架

6.1.3 决策树的剪枝

6.2 基本决策树算法的改进

6.2.1 信息增益与 ID3 决策树

6.2.2 增益率与 C4.5 决策树

6.2.3 基尼指数与 CART 决策树

6.3 连续值处理与属性缺失

6.3.1 连续值的处理

6.3.2 属性缺失问题

6.4 决策树算法的 MATLAB 实现

第7章贝叶斯算法

7.1 贝叶斯算法的原理

7.1.1 贝叶斯决策

7.1.2 朴素贝叶斯算法

7.1.3 正态贝叶斯算法

7.2 贝叶斯算法的改进

7.2.1 半朴素贝叶斯算法

7.2.2 TAN 贝叶斯算法

7.2.3 贝叶斯网与朴素贝叶斯树

7.2.4 加权朴素贝叶斯算法

7.3 贝叶斯算法的 MATLAB 实现

第8章 k 近邻算法

8.1 k 近邻算法的原理

8.1.1 k 近邻算法的流程

8.1.2 k 近邻的距离函数

8.2 k 近邻改进算法简介

8.3 k 近邻算法的 MATLAB 实现

第9章数据降维算法

9.1 主成分分析法

9.1.1 主成分分析的基本原理

9.1.2 核主成分分析算法

9.1.3 PCA 算法的 MATLAB 实现

9.1.4 快速 PCA 算法及其实现

9.2 流形学习算法

9.2.1 局部线性嵌入及其 MATLAB 实现

9.2.2 等距映射与 MDS 算法及其实现

第10章聚类算法

10.1 聚类的基本理论

10.1.1 问题定义

10.1.2 距离计算

10.1.3 性能指标

10.2 k 均值算法

10.2.1 k 均值算法基本原理

10.2.2 k 均值算法的 MATLAB 实现

10.3 k 中心点算法

10.3.1 k 中心点算法基本原理

10.3.2 k 中心点算法的 MATLAB 实现

10.4 密度聚类算法

10.4.1 DBSCAN 算法的基本原理

10.4.2 DBSCAN 算法的 MATLAB 实现

10.5 层次聚类算法

10.5.1 AGNES 算法的基本原理

10.5.2 AGNES 算法的 MATLAB 实现

第11章高斯混合模型与 EM 算法

11.1 高斯混合模型

11.2 EM 算法的理论推导

11.3 EM 算法的应用

11.4 GMM 的 MATLAB 实现

11.4.1 高斯混合模型的生成

11.4.2 GM 模型的参数拟合

11.4.3 高斯混合聚类实例

11.5 高斯混合聚类的改进方法

11.5.1 拟合初始值的设定问题

11.5.2 聚类簇数 k 值的选择问题

11.5.3 高斯混合聚类的正则化

第12章集成学习算法

12.1 集成学习概述

12.1.1 集成学习的基本概念

12.1.2 集成模型的并行生成

12.1.3 集成模型的串行生成

12.1.4 集成模型的组合策略

12.2 Bagging 与随机森林

12.2.1 Bagging 算法

12.2.2 随机森林算法

12.2.3 随机森林的 MATLAB 实现

12.3 Boosting 算法

12.3.1 AdaBoost 算法的基本原理

12.3.2 AdaBoost 的 MATLAB 实现

第13章最大熵算法

13.1 熵的来源及相关定义

13.2 最大熵模型的定义

13.2.1 最大熵原理

13.2.2 最大熵模型

13.3 最大熵模型的学习算法

13.3.1 最大熵算法的基本原理

13.3.2 最大熵模型的极大似然估计

13.4 模型参数学习的最优化方法

13.4.1 梯度下降法和拟牛顿法

13.4.2 改进的迭代尺度法

13.5 最大熵模型的 MATLAB 实现

第14章概率图算法

14.1 隐马尔可夫模型

14.1.1 隐马尔可夫模型的定义

14.1.2 观测序列概率的计算方法

14.1.3 计算模型参数的鲍姆-韦尔奇算法

14.1.4 预测隐藏状态序列的维特比算法

14.2 条件随机场模型

14.2.1 条件随机场的定义

14.2.2 线性链条件随机场

14.2.3 线性链条件随机场的概率计算

14.2.4 线性链条件随机场的学习算法

14.2.5 线性链条件随机场的解码算法

第15章强化学习算法

15.1 强化学习的模型基础

15.1.1 强化学习的基本特征

15.1.2 强化学习的建模

15.2 强化学习的理论模型

15.2.1 探索与利用

15.2.2 ε-贪心算法

15.2.3 Softmax 算法

15.3 马尔可夫决策过程

15.4 求解最优策略的动态规划算法

15.4.1 策略迭代算法

15.4.2 价值迭代算法

15.5 求解最优策略的蒙特卡罗法

15.5.1 无模型强化学习的定义

15.5.2 蒙特卡罗法求解预测问题

15.5.3 蒙特卡罗法求解控制问题

15.6 求解最优策略的时序差分法

15.6.1 时序差分法的基本原理

15.6.2 SARSA 算法及 MATLAB 实现

15.6.3 Q-学习算法及 MATLAB 实现

参考文献

内文展示

左右滑动查看

声明：此文是出于传递更多信息之目的。部分图片、资料来源于网络，版权归原作者所有，如有侵权请联系后台删除。

【蔻享书苑】好书推荐 |《稀疏傅里叶变换》

【蔻享书苑】《简明积分导论第3版》(一部数学经典教材)

【蔻享书苑】“科学大师经典”系列《玻恩晶格动力学理论》

【蔻享书苑】抓住了量子力学的灵魂《现代量子力学第2版（中译本修订版）》

点击“阅读原文”