统计物理方法是一座架起微观作用到宏观涌现的桥梁,2021年诺贝尔物理学奖得主帕里西在无序系统方面作出开创之举,他提出复本对称破缺方法解决自旋玻璃问题,这一方法也对神经网络等交叉学科产生深厚影响,激发学者对人工智能和人脑等复杂系统的进一步研究。由中山大学黄海平教授组织的【神经网络的统计力学】系列课程,系统性梳理统计力学的基本原理及其在理解神经网络内部工作原理的应用,自2022年9月持续到2023年6月,周六授课。课程视频将在集智学园网站同步,购课回看录播请扫二维码或下拉至文末报名。
5月13日(周六)10:00-12:00 将进行系列课程的第23讲,重点介绍从深度网络的冗余性出发,提出的随机路径模型,以及几种物理启发的深度学习算法,包括以二值网络为例考虑的深度网络的平均场视角,为探究深度的信用分配问题提出的深度网络的系统学习算法Spike and Slab模型,为理解大规模的网络权重矩阵从量子力学态分解获得启发的模式分解方法等,为理解深度学习提供了一个新的视角。本节课程会在集智学园视频号和B站直播,预约及付费报名方式见下文。
AI+Science 是近年兴起的将人工智能和科学相结合的一种趋势。其中一个重要的方面是 Science for AI,科学尤其是物理学中的规律和思想启发机器学习理论,为人工智能的发展提供全新的视角和方法。集智俱乐部联合斯坦福大学计算机科学系博士后研究员吴泰霖(Jure Leskovec 教授指导)、哈佛量子计划研究员扈鸿业、麻省理工学院物理系博士生刘子鸣(Max Tegmark 教授指导),共同发起以“AI+Science”为主题的读书会,探讨该领域的重要问题,共学共研相关文献。欢迎加入。
在21、22讲中,我们介绍了感知机的统计力学。然而,感知机的学习并非深度学习,因为它本质上属于单层神经网络。深度网络在具有更丰富物理现象的同时,也将使得精确的物理解析变得难以入手。
本节课程,我们从深度网络的冗余性出发,提出随机路径模型(RAP,Random Active Path Model)。具体来说,我们在一定的学习假设下将P-层神经网络转化成P-体相互作用模型,进而通过空腔方法对模型进行分析。这帮助我们发现蕴含在深度网络与冗余性相关的一级相变。之后将进入对几种物理启发算法的介绍,首先我们以二值网络为例,考虑一种训练深度网络的平均场视角。随后,为了探究深度学习的信用分配问题,我们介绍深度网络的系综学习算法 (SaS,Spike and Slab Model),在学习的过程中揭示每个部分微观组成因子对决策的贡献(由每条连接权值的概率分布刻画)。最后,为了理解大规模的网络权重矩阵,我们从量子力学态分解得到灵感, 使用模式分解(MDL,Mode Decomposition Learning)的方法将网络的决策行为理解为几个占主导模式的贡献,从而极大地减少了达成决策行为所需要的学习参数,并且为理解深度学习提供了一个新的视角。
Chapter 14: Mean-Field Model of Multi-layered Perceptron- 14.1 Random Active Path Model
- 14.2 Mean-Field Training Algorithms
- 14.3 Spike and Slab Model
3.统计系统角度的深度学习模型:Spike and Slab(SaS)
关键词:随机路径模型;空腔方法;平均场;信用分配;模式分解
黄海平,中山大学物理学院教授。本科毕业于中山大学理工学院,博士毕业于中国科学院理论物理研究所,随后在香港科技大学物理系、东京工业大学计算智能系 (2012年获日本学术振兴会资助) 以及日本理化学研究所 (RIKEN) 脑科学中心从事统计物理与机器学习、 神经计算交叉的基础理论研究,2017年因在无监督学习方面的研究获得 RIKEN 杰出研究奖。于2018年入选中山大学百人计划,在物理学院组建了“物理、机器与智能” (PMI)研究小组,专注于各种神经计算的理论基础,长期目标是使用基于物理的近似来揭示机器及大脑智能的基本原理。曾主持国家自然科学基金两项。
PMI Lab:https://www.labxing.com/hphuang2018
2023年5月13日(周六)10:00-12:00
参与方式二:付费加入课程,查看课程回放
付费后,可参与集智学园平台直播并加入交流群获得视频回放权限。欢迎对统计力学的基本原理感兴趣的你,加入【神经网络的统计力学】课程!
课程定价:499元
课程时间:从2023年2月18日起,每周六 10:00-12:00(节假日除外)
扫码付费报名课程
https://campus.swarma.org/course/4543
付费流程:
第一步:扫码付费
第二步:在课程详情页面,填写“学员信息登记表”
第三步:扫码添加助教微信,入群
本学期内容介绍
本季内容从2023年2月底~6月底,将围绕书籍第9章-17章进行介绍,我们将讲授现代神经网络的前沿理论,覆盖监督学习,无监督学习,深度网络降维理论,循环神经网络的动力学平均场理论,随机矩阵理论等。我们将在学习理论的同时穿插各种小项目和文献阅读,帮助学生全方位的鸟瞰神经网络理论研究的全貌。
系列课程大纲
课程主要目的是培养一批有望在神经网络理论深耕的青年学者(侧重学生),课程涉及黄海平老师最新出版的书籍《Statistical Mechanics of Neural Networks》的大部分内容,目标是学习统计力学的基本原理及其在理解神经网络内部工作原理的应用。书籍涵盖了用于理解神经网络原理的必要统计力学知识,包括复本方法、空腔方法、平均场近似、变分法、随机能量模型、Nishimori条件、动力学平均场理论、对称性破缺、随机矩阵理论等,同时详细描述了监督学习、无监督学习、联想记忆网络、感知器网络、随机循环网络等神经网络及其功能的物理模型以及解析理论。本书通过简洁的模型展示了神经网络原理的数学美和物理深度,并介绍了相关历史和展望未来研究的重要课题,可供对神经网络原理感兴趣的学生、研究人员以及工程师阅读参考。Chapter 2: Spin Glass Models and Cavity Method- 2.1 Multi-spin Interaction Models
- 2.3 From Cavity Method to Message Passing Algorithms
Chapter 3: Variational Mean-Field Theory and Belief Propagation- 3.2 Variational Free Energy
- 3.3 Mean-Field Inverse Ising Problem
Chapter 4: Monte Carlo Simulation Methods
- 4.3 Markov Chain Sampling
- 4.4 Monte Carlo Simulations in Statistical Physics
Chapter 5: High-Temperature Expansion- 5.1 Statistical Physics Setting
- 5.2 High-Temperature Expansion
- 5.3 Properties of the TAP Equation
Chapter 6: Nishimori Line- 6.2 Exact Result for Internal Energy
- 6.3 Proof of No RSB Effects on the Nishimori Line
Chapter 7: Random Energy ModelChapter 8: Statistical Mechanical Theory of Hopfield Model- 8.4 Hopfield Model with Arbitrary Hebbian Length
Chapter 9: Replica Symmetry and Replica Symmetry Breaking- 9.1 Generalized Free Energy and Complexity of States
- 9.2 Applications to Constraint Satisfaction Problems
- 9.3 More Steps of Replica Symmetry Breaking
Chapter 10: Statistical Mechanics of Restricted Boltzmann Machine- 10.2 Restricted Boltzmann Machine
- 10.3 Free Energy Calculation
- 10.4 Thermodynamic Quantities Related to Learning
- 10.6 Variational Mean-Field Theory for Training Binary RBMs
Chapter 11: Simplest Model of Unsupervised Learning with Binary- 11.2 Derivation of sMP and AMP Equations
- 11.5 Measuring the Temperature of Dataset
Chapter 12: Inherent-Symmetry Breaking in Unsupervised Learning- 12.3 Hyper-Parameters Inference
Chapter 13: Mean-Field Theory of Ising Perceptron- 13.1 Ising Perceptron model
- 13.2 Message-Passing-Based Learning
Chapter 14: Mean-Field Model of Multi-layered Perceptron- 14.1 Random Active Path Model
- 14.2 Mean-Field Training Algorithms
- 14.3 Spike and Slab Model
Chapter 15: Mean-Field Theory of Dimension Reduction in Neural Networks-
- 15.2 Linear Dimensionality and Correlation Strength
- 15.3 Dimension Reduction with Correlated Synapses
Chapter 16: Chaos Theory of Random Recurrent Neural Networks- 16.1 Spiking and Rate Models
- 16.2 Dynamical Mean-Field Theory
- 16.3 Lyapunov Exponent and Chaos
- 16.4 Excitation-Inhibition Balance Theory
- 16.5 Training Recurrent Neural Networks
Chapter 17: Statistical Mechanics of Random Matrices- 17.2 Replica Method and Semi-circle Law
- 17.3 Cavity Approach and Marchenko
- 17.4 Spectral Densities of Random Asymmetric Matrices
报名加入课程
欢迎对统计力学的基本原理感兴趣的你,加入【神经网络的统计力学】课程!扫码付费报名课程
AI+Science 是近年兴起的将人工智能和科学相结合的一种趋势。一方面是 AI for Science,机器学习和其他 AI 技术可以用来解决科学研究中的问题,从预测天气和蛋白质结构,到模拟星系碰撞、设计优化核聚变反应堆,甚至像科学家一样进行科学发现,被称为科学发现的“第五范式”。另一方面是 Science for AI,科学尤其是物理学中的规律和思想启发机器学习理论,为人工智能的发展提供全新的视角和方法。集智俱乐部联合斯坦福大学计算机科学系博士后研究员吴泰霖(Jure Leskovec 教授指导)、哈佛量子计划研究员扈鸿业、麻省理工学院物理系博士生刘子鸣(Max Tegmark 教授指导),共同发起以“AI+Science”为主题的读书会,探讨该领域的重要问题,共学共研相关文献。读书会从2023年3月26日开始,每周日早上 10:00-12:00 线上举行,持续时间预计10周。欢迎对探索这个激动人心的前沿领域有兴趣的朋友报名参与。