社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

【中国科学院团队用数学研究深度学习,助力理解神经网络深度的有效性-20241027181307

麻省理工科技评论 • 5 月前 • 91 次点击  

2024-10-27 18:13

【中国科学院团队用数学研究深度学习,助力理解神经网络深度的有效性】

#深度学习# 的成功已经无需多言。一直以来,研究者们都尝试从数学角度去解释神经网络的有效性。然而,由于网络的结构可以看作是高维线性变换和逐元素的非线性变换(如 ReLU 激活函数)之间的多重复合,因此实际上并没有很好的数学工具去破解这样复杂的结构。

所以,对于#神经网络# 的理论研究往往局限在诸如网络的逼近、优化、泛化以及其他观测到的现象等方面。

如果抛开理论的限制,一个无可争议的事实是:更宽、更深的网络总是有着更好的效果。小到几层的全连接网络、大到万亿规模的#大模型# ,都一致性地保持着这样的规律。

那么,如何从理论上理解这样的事实?激活函数又在其中扮演什么样的角色?

相比于宽度,对深度的研究更加具有挑战性,因为层数的增加还伴随着非线性函数的不断复合。

戳链接查看详情:中国科学院团队用数学研究深度学习,助力理解神经网络深度的有效性
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/175360
 
91 次点击