社区教程 Wiki

注册登录

创作新主题

社区所有版块导航

Python

python开源 Django Python DjangoApp pycharm

DATA

docker Elasticsearch

分享

问与答闲聊招聘翻译创业分享发现分享创造求职区块链支付之战

aigc

aigc chatgpt

WEB开发

linux MongoDB Redis DATABASE NGINX 其他Web框架 web工具 zookeeper tornado NoSql Bootstrap js peewee Git bottle IE MQ Jquery

机器学习

机器学习算法

Python88.com

反馈公告社区推广

产品

短视频

印度

印度

一周十大热门主题

明天见！2025第十三届TopDigital创新营销盛典明日正式开启

航空发动机用上大模型：解决复杂时序问题，性能超越ChatGPT-4o实现SOTA｜上交创智复旦

速递｜时尚界ChatGPT？5000万美金重塑购物搜索，Daydream推出AI购物机器人

专辑征稿 | 化学、材料科学和生物技术中的量子计算 - Digital Discovery

顶刊《Materials Today》最新成果：机器学习+增材制造

Python 现在可以运行 Mojo 了？

「6月26日AI日报」可灵AI推全球首部AIGC单元剧；谷歌开源AI智能体Gemini CLI

弃 Python 拥抱 JVM，Spring 之父 20 年后再造“革命性框架”：我从未如此确信一个...

郑州大学田芸/周震 | 下一代电池安全管理：机器学习辅助寿命预测与性能提升

Python实现简单的 “导弹” 自动追踪！

关注

Py学习 » 机器学习算法

【中国科学院团队用数学研究深度学习，助力理解神经网络深度的有效性-20241027181307

麻省理工科技评论 • 8 月前 • 110 次点击

2024-10-27 18:13
本条微博链接

【中国科学院团队用数学研究深度学习，助力理解神经网络深度的有效性】

#深度学习# 的成功已经无需多言。一直以来，研究者们都尝试从数学角度去解释神经网络的有效性。然而，由于网络的结构可以看作是高维线性变换和逐元素的非线性变换（如 ReLU 激活函数）之间的多重复合，因此实际上并没有很好的数学工具去破解这样复杂的结构。

所以，对于#神经网络# 的理论研究往往局限在诸如网络的逼近、优化、泛化以及其他观测到的现象等方面。

如果抛开理论的限制，一个无可争议的事实是：更宽、更深的网络总是有着更好的效果。小到几层的全连接网络、大到万亿规模的#大模型# ，都一致性地保持着这样的规律。

那么，如何从理论上理解这样的事实？激活函数又在其中扮演什么样的角色？

相比于宽度，对深度的研究更加具有挑战性，因为层数的增加还伴随着非线性函数的不断复合。

戳链接查看详情：

中国科学院团队用数学研究深度学习，助力理解神经网络深度的有效性

Python社区是高质量的Python/Django开发社区
本文地址：http://www.python88.com/topic/175360

110 次点击

登录后回复

关于移动版

Py学习 - 专注于Python技术发展的社区(原Django社区)

沪ICP备11025650号