Py学习  »  机器学习算法

我们的新书《时间序列与机器学习》出版了!

数学人生 • 3 月前 • 239 次点击  

当今时代,数据无处不在,而时间序列数据更是其中的佼佼者。我们在互联网、经济、金融、气象等诸多领域都能见到时间序列数据的身影。有效分析这些随时间变化的数据样本以提炼有价值的信息,不仅有助于企业和机构的决策优化,而且对科学研究和技术创新具有重要意义。在最近几年,由于数据量的增加、计算能力的提升、学习算法的成熟以及应用场景的多样化,人工智能技术(如机器学习)逐渐普及并取得了显著的成果,越来越多的人开始关注这个充满潜力的研究领域。ChatGPT 大语言模型亦是掀起一波新的人工智能热潮。正因如此,我们决定着手编写一本关于时间序列与机器学习相关的书籍,希望它能为广大读者提供理论指南和实践参考。

两位作者在工作期间相识,参与过许多一线机器学习项目,其中不少是时间序列相关,如异常检测、预测、根因定位等。平时工作之余总结和记录了不少这方面的技术帖子。电子工业出版社的张爽老师联系到我们,希望能够编撰成书,给予了很多撰写上的指导,在此感谢她的支持。尽管如此,我们仍然低估了撰写书籍所面临的困难。一方面,机器学习和深度学习技术的发展非常迅速,我们的认知也在发展和更新,会担心写作的内容是否会已经落后。另一方面,由于日常工作相当繁重,很难抽出连续的时间来全身心地专注于写作。因此,这部作品的创作也是颇为艰辛。

国内外已出版了许多关于机器学习和时间序列分析的书籍,各自都是一个庞大的学科,与诸多经典比起来本书显得颇为拙劣。理想中著书立说是要构建起一个完整的知识体系,该体系能容纳新老技术。尽管尚未达到著书立说的境界,仍希望能够借助自身的经验和专业知识,对这一领域进行系统的梳理和总结。写作这本书的过程也促使自己能够更加深入理解机器学习和时间序列分析。

由于作者水平所限,书中难免有纰漏和不足之处,恳请各位专家和读者给予批评指正。

本书内容包括 8 个章节组成,分别是:

第 1 章“时间序列概述”:介绍时间序列分析的基础知识、发展历程、应用现状、分类及其与其他领域(如自然语言处理、计算机视觉等)的关联。

第 2 章“时间序列的信息提取”:介绍特征工程的核心概念及其在时间序列分析中的应用,比如对原始数据进行归一化、缺失值填充等转换;以及如何通过特征工程从时间序列数据中提取有用的特征,例如时间序列的统计特征、熵特征和降维特征等,以及如何判断时间序列的单调性。

第 3 章“时间序列预测”:介绍常用的时间序列预测方法,包括自回归模型、移动平均模型、自回归差分移动平均模型、指数平滑方法、Prophet,以及神经网络,例如循环神经网络、长短期记忆网络、Transformer、Informer 等。

第 4 章“时间序列异常检测”:介绍时间序列异常检测算法的技术与框架,如何识别异常的时间点,包括基于概率密度的方法(如3-Sigma、核密度估计)、基于重构的方法(如变分自编码器、Donut)、基于距离的方法(如孤立森林、RRCF)、基于有监督的方法和基于弱监督的方法等。

第 5 章“时间序列的相似度与聚类”:介绍时间序列的相似性度量方法,如欧氏距离、动态时间规整算法等,用于衡量两个或多个时间序列在形状和模式上的相似程度;聚类算法,如K-Means、DBSCAN等,可以将相似的时间序列分组,以便进一步理解时间序列数据中的结构和模式。

第 6 章“多维时间序列”:介绍多维时间序列在广告分析和业务运维领域的应用,包括如何利用OLAP 技术对多维时间序列进行有效处理,以及如何通过根因分析技术获得导致故障的维度和元素,包括基于时间序列异常检测算法的根因分析、基于熵的根因分析、基于树模型的根因分析、规则学习等。

第 7 章“智能运维的应用场景”:介绍智能运维领域的应用,包括指标监控、容量预估、弹性伸缩、告警关联、告警收敛和告警系统评估等,以及监控中出现的节假日效应、持续异常等实际情况。

第 8 章“金融领域的应用场景”:介绍量化交易的概念、发展历程,如何通过因子挖掘从时间序列数据中提取特征并将其转化为交易策略,以及机器学习在其他金融领域(包括资产定价、资产配置、波动率预测)的应用。

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/170693
 
239 次点击