
在万物向“智”生长的 2025 年,AI 领域的热潮持续升温,正引领着技术革新与产业探索的新浪潮。
4 月 18-19 日,由 CSDN 联合高端 IT 咨询与教育平台 Boolan 举办的 2025 全球机器学习技术大会(ML-Summit 2025),在上海虹桥西郊庄园丽笙大酒店隆重拉开帷幕。本次大会围绕 AI 最前沿的发展趋势与落地实践,聚焦大语言模型技术演进、AI 智能体、具身智能、DeepSeek 技术解析与行业实践等 12 大专题,邀请了超 60 位来自全球顶尖科技企业与学术机构的重磅嘉宾齐聚一堂,全面呈现 AI 领域的技术风向与应用前沿。
在生成式 AI 重构技术边界的浪潮下,产业实践与学术探索的融合正加速推进。此次大会汇聚了来自微软、百度、阿里巴巴、腾讯、字节跳动、蚂蚁集团、智源研究院、小红书、网易、商汤科技、小米、360、AMD数十家领军企业和组织的技术专家,他们从科研创新、工程落地到产业趋势,带来了兼具深度与前瞻的思考。
大会现场座无虚席,技术氛围热烈。演讲嘉宾阵容横跨产学研界,既有理论深度的学术洞察,也有千亿级产品的实战真知。通过持续 2 天密集的专题研讨、案例拆解与圆桌对话,他们深度探索 AI 驱动下的技术范式革新与产业价值重塑。这场融合思想交锋与实践启发的技术盛宴,不仅呈现了行业最新技术脉动,更为开发者、研究者与产品创新者们搭建了深入交流的平台,共同探索 AI 的技术演进路径与未来落地的无限可能。

从 Scaling Law 走向强化学习,全球机器学习技术大会剖析 AI 最新进展!
过去一年,大模型的发展速度让人目不暇接,甚至超出了很多人的想象。从文本生成到图像、视频处理,从搜索引擎的革新到编程助手的普及,各大厂商在全力不断突破 AI 的技术边界。如今整个行业呈现出怎样的图景?在 4 月 18 日上午的主会场,CSDN 高级副总裁、Boolan首席技术专家李建忠,加拿大工程院及加拿大皇家学院院士、香港理工大学 AI 高等研究院院长杨强,IEEE Fellow、清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军,数势科技创始人兼 CEO、原京东集团副总裁、原京东商城技术负责人黎科峰等重量级嘉宾带来关于 AI 的深度分享与前瞻思考。
在这场大会上,强化学习、扩散模型、DeepSeek 等关键词频繁被提及,成为技术讨论的焦点。那么,强化学习是否会成为 Scaling Law(规模法则)新的驱动力?扩散模型能否继续作为推动模型能力跃升的核心技术路线?DeepSeek 的出现,又会如何重塑开源生态?算力优化的难题,又是否有了新的破解思路?围绕这些关键问题,欢迎回看大会首日视频,看众多技术大咖如何从理论、算法到实际应用层面进行了深度剖析,以此了解 AI 技术的更多最新进展:
大模型技术创新驱动的 AI 生态和应用演进
联邦大小模型协作学习
扩散策略学习的若干进展
DeepSeek 范式重构:从大模型平权到企业级智能决策 Agent 的产业革命
值得关注的是,在本次主会上,我们正式发布了《AI 大模型技术体系综合开源影响力榜单》。榜单围绕“模型—数据—系统—评测平台”四个核心维度,对当前大模型技术生态进行了全景式梳理与评估。
圆桌对话:大模型技术趋势展望与产业落地
在主会的圆桌对话环节,CSDN 高级副总裁、Boolan 首席技术专家李建忠,加拿大工程院及加拿大皇家学院院士、香港理工大学 AI 高等研究院院长杨强,AMD 人工智能事业部企业副总裁 Ramine Roane,极狐 GitLab CEO 柳钢在格蠹科技创始人、《软件调试》和《软件简史》作者张银奎的主持下,围绕“大模型技术趋势展望与产业落地”主题,就算法、算力、数据三大 AI 核心要素如何驱动大模型持续演进展开了深入探讨。


12 大技术专题,深度解读大模型演进密码
从基础模型的演进到智能体的落地实践,从具身智能的探索到多模态大模型的产业化进展,大模型驱动的 AI 革命正以前所未有的速度席卷各行各业。当前,开发者和企业最关心的已不仅是“模型有多强”,更是“能落地多深、跑多快、做得多稳”。
在这一背景下,本次大会以全球视角聚焦 AI 最前沿的发展趋势,围绕大语言模型技术演进、AI Agent 实践、具身智能、多模态生成、DeepSeek 技术解析等 12 大专题展开深入探讨,与海内外一线科技公司与高校机构的专家学者,共同勾勒出大模型技术的创新脉络与落地全景。接下来,让我们从这 12 大专题的现场分享中,逐一拆解这些正在重塑未来的技术亮点与实践思路。
大语言模型技术演进
当大模型突破千亿参数后,技术演进的方向是继续“堆料”还是探索更智能的思维涌现?这一话题正在引发学界与产业界的深度碰撞。从预训练范式的革新到思维能力的塑造,业界正在经历一轮深层次的技术再思考。本专题汇聚了来自新浪微博、阿里巴巴、上海交通大学、复旦大学的一线企业与高校的技术专家,围绕深度思考模型、推理能力演进、强化反馈等关键议题,展开了深入的技术分享与思想碰撞,展现了当下大语言模型演进路径的多元探索。
从 DeepSeek R1 的复现看深度思考模型的未来
通义星尘 Character Model – 探索为“人”建模
基于强化反馈的大模型自我提升与推理增强
面向领域的大模型思维能力
圆桌对话:DeepSeek 与大语言模型技术演进
随着 DeepSeek 等新兴模型掀起大模型效率革命,当技术演进面临算力瓶颈与场景适配的双重挑战,大语言模型如何突破 “规模依赖” 实现智能跃升?在模型架构创新、领域知识融合、工程化落地等关键议题上,产学研界又该如何协同破局?
在 CSDN &《新程序员》执行总编唐小引的主持下,本次圆桌对话邀请到了
新浪微博首席科学家及 AI 研发部负责人张俊林、阿里巴巴通义实验室大模型资深算法总监李永彬、上海交通大学 AI 学院长聘教轨副教授温颖以及智源人工智能研究院数据研究组负责人兼 OpenSeek/FlagAI 负责人刘广,他们围绕 DeepSeek 的技术实践,共同探讨了大模型技术发展的新趋势与现实挑战。

多模态大模型前沿
从图像到文本、从语音到视频、再到 3D 空间与数字人生成,AI 正在快速迈入“理解+生成”深度融合的多模态时代。Sora 等模型的震撼登场为多模态大模型注入了空前的想象力,但其背后蕴含的跨模态对齐、时空建模、生成控制等技术挑战也愈发突出。为此,本专题邀请了来自阶跃星辰、生数科技、复旦大学、腾讯和百川智能等机构的核心技术专家,他们从基础理论到产业实践,揭示了多模态技术未来的发展方向与潜力空间。
视频生成基础模型进展、挑战和未来
生数科技在多模态大模型的探索与实践
数字人生成模型:前沿与应用
混元 3D 生成大模型的研发布局与应用
Baichuan-Omni-1.5:百川智能在端到端多模态大模型的实践探索

大模型驱动的软件开发变革
毫无疑问,大模型目前正以前所未有的速度重塑软件开发的每一个环节。从代码自动生成、智能补全,到多轮对话式编程、AI Agent 协同开发,AI 正从“辅助工具”走向“智能合作者”。与此同时,如何在成本控制与性能优化之间取得平衡,构建适配不同行业需求的代码大模型,成为技术发展的重要课题。本专题汇集了字节跳动、阿里巴巴、快手、百度等顶尖团队的实践先锋,他们带来的案例分享为软件开发的智能化变革提供了关键指引。
大语言模型驱动的智能编程助手构建之道
通义灵码 AI 程序员解密:AI Agent 在软件研发领域的落地实践
快手 KwaiCoder 模型:低成本构建先进代码大模型的实践探索
聊一聊 Composer 式的代码生成
圆桌对话:软件研发智能化变革
如果代码可以自己写代码,研发还能被称为一种“技术”吗?从人机协作模式的重塑到开发流程的范式迁移,从工具链智能化到全生命周期自主决策,这场变革正在叩击每个技术管理者的战略神经。但这同时也带来了新的挑战:如何解决 AI 辅助开发的精准性与稳定性问题?怎样平衡智能化工具与开发者创意的关系?如何推动智能化技术在复杂业务场景中的深度落地?
本次圆桌对话由 Boolan 首席咨询师吴咏炜主持,邀请到了商汤科技小浣熊家族技术负责人张涛
,DeepWisdom 算法研究员、OpenManus 项目一作梁新兵,以及 CAMEL AI 核心成员、Eigent AI 工程师范文栋,他们既直面了智能编程工具从“效率提升”到“认知革命”的转型阵痛,也为开发者应对技术代际跃迁提供了破局指南。

DeepSeek 技术解析与行业实践
今年年初,DeepSeek R1 的爆火引发了业内广泛关注。它不仅在性能上超越了国际顶尖的闭源大模型,更以开源的方式让开发者得以深入了解先进模型的架构与实现机制。这一开放姿态,不仅推动了模型复现、优化与再创新,也带动了行业在大模型应用上的进一步实践探索。
本专场围绕 DeepSeek 技术的底层逻辑、工程路径以及实际落地经验展开。来自智源研究院、微软亚洲研究院、得物、TeleAI 研究院、360 和清华大学的技术专家们带来了他们在大模型系统搭建、推理能力释放、模型治理、强化学习训练等多个维度的实践成果分享与思考。
OpenSeek: 开源集合创新的新模式以及挑战
Logic-RL:通过基于规则的强化学习释放大模型推理能力
DeepSeek 在得物部署的应用与优化实践
DeepSeek R1 技术复现和大模型的治理与安全
自动形式化验证与可信代码生成
开源推理模型的课程学习与 GRPO 数据心得和训练策略
AReaL:一个专为大型推理模型设计的灵活高效的开源强化学习系统

AI 智能体
AI 智能体正逐渐从概念变成现实。它不再只是一个执行命令的工具,而是在很多场景下,开始具备理解任务、独立决策,甚至主动协作的能力。与其说它是一个助手,不如说它正朝着“智能搭子”的方向进化。本专场中,来自数势科技、CAMEL AI、DeepWisdom 和上海开源信息技术协会的嘉宾,带来他们在 AI 智能体构建与落地过程中的一手经验。
DeepSeek 如何重塑数据智能产品:数势科技 SwiftAgent 的创新与实践分享
从工具到自主化,构建更强大的 Agent 系统
通用 Agent 的构建与赋能:OpenManus 的实践与探索
科学智能体:从数据驱动到认知涌现的科研基础设施升级

大模型应用开发实践、GenAI 产品创新与探索
“大模型的杀手级应用到底是什么样?”这个问题引发了很多人的好奇。有人觉得它可能会改变编程的方式,有人认为它将在教育、数字人等领域带来深远影响。在本专场,我们将邀请小红书、网易有道、声网和商汤的技术专家,分享他们在大模型应用开发中的经验,带你了解这项技术是如何一步步落地并改变行业的。也系统本专场为大家提供一个清晰的视角,让你看到大模型如何在实际应用中推动行业变革,也为未来的 AI 探索提供一些灵感。
大模型在小红书推荐的应用
有道子曰教育大模型落地实践
2D 与 3D 数字人技术解析与创新应用
做好准备,迎接 AI 原生应用爆发

算力基建与性能优化
大模型的飞速发展要求底层算力基建不断升级,如何在 CPU、GPU、NPU 等多种异构算力之间高效协同?如何解决推理延迟、内存瓶颈与数据调度等关键问题?性能优化已不再是附加项,而是支撑大模型高效运行与规模扩展的核心要素。本技术专场中,我们邀请到了复旦大学、英飞流、蚂蚁集团等资深技术专家分享他们在算力架构、计算优化、RAG 系统演进及推理架构设计等方面的真实实践与技术突破。
从 CPU 到 NPU,从对象到张量的编程范式转型
大规模图上的高效局部计算与优化
2025 的 RAGFlow——推理、记忆、多模态
性能驱动的大模型架构探索——网络架构及推理架构

大模型应用框架与工具
当大模型成为 AI 应用的基础设施,开发者如何更高效地构建、微调与部署模型?模型微调的边界在哪里?框架设计应优先支持哪些典型场景?向量数据库如何真正释放大模型的上下文能力?在工具链日趋复杂的今天,大模型开发是否正走向“从组件到编排”的新范式?
在“大模型应用框架与工具”专场中,来自美国东北大学、Pinterest、字节跳动的技术专家,以及 LLaMA Factory 核心开发者,将围绕大模型训练框架、向量数据库、应用开发体系与多模态微调等关键方向,带领与会开发者深入剖析支撑大模型落地的核心工具与技术体系。
揭秘大模型训练---完全开源透明的大模型:从预训练到增强学习
向量数据库对大语言模型的支持和优化
从组件到编排——大模型应用开发框架设计实践
LLaMA Factory 多模态 LLM 高效微调原理与实践

具身智能
这两天,在北京举行的机器人马拉松比赛上,形态各异的机器人穿梭于真实的物理世界中,奔跑、感知、协作,成为不少人关注的焦点。这场融合真实物理挑战的竞技,不仅展示了机器人技术的飞跃,也将“具身智能”这一 AI 热点推上了前沿舞台。随着人工智能从语言理解、图像识别逐步迈向融合感知、决策与执行的一体化能力,具身智能正成为推动通用智能落地的关键路径——让智能体不仅“能思考”,更“会行动”。
本次“具身智能”专场,汇聚了来自同济大学、小米、智源研究院、深圳人工智能与机器人研究院等学术界与产业界的专家,围绕具身智能在认知、系统架构、硬件基础、数据工程等多个维度的核心议题展开深入分享与探讨。
类脑认知多模态大模型:连接人类大脑、AI 大脑和机器人大脑的基础
基于 Xiaomi Vela 构建 AI 硬件和智能制造开源系统底座
智源具身智能核心:大小脑操作框架与具身大脑模型构建
具身智能数据工程:技术探索与实践

大模型+行业落地实践
“百模大战”进行一段时间后,技术热潮逐渐回归理性,业界开始将目光转向一个更核心的问题:大模型如何真正走进业务、落地产业?在这一背景下,“大模型+行业落地实践”专场应运而生,邀请来自小红书、京东、金山办公、恒生电子研究院、eBay 等头部企业的技术专家,分享他们在不同业务场景中推动大模型技术落地的探索与成果。
FireRed-基于大模型的语音/音乐技术综合实践
基于因果大模型的库存清理创新实践
文档生成 PPT,WPS AI 基于 LLM 的智能办公落地实践
金融领域大模型应用技术瓶颈与突破
大模型与智能体在 eBay 广告的落地与实践

大模型工程与架构
在大模型迅猛发展的背景下,如何提升其在真实场景中的工程效率与系统稳定性?面对算力瓶颈与推理成本的挑战,底层架构又该如何演进?而当大模型从“模型”走向“系统”,智能化的设施设备、云原生平台将扮演怎样的角色?
在“大模型工程与架构”专场中,来自上海人工智能实验室、摩尔线程、建宇智造与 eBay 的一线技术专家们将围绕强化学习、算力优化、智能制造与推理平台等关键议题,分享他们在大模型工程落地过程中的探索与实战经验。
PRIME:结合隐式过程奖励的大模型强化学习
摩尔线程全功能 GPU 大规模语言模型分布式训练性能优化探索
大模型驱动下的设施设备智能化转型
LLM 在 eBay 云原生模型推理平台的工程化落地

AMD ROCm 开发者技术专场
为促进 AMD ROCm 开发者技术交流,探索大模型与开源工具的实践应用,AMD ROCm AI 开发者交流会——大模型推理与开源创新专场活动于 4 月 19 日下午拉开帷幕。
这次活动聚焦基于 AMD ROCm 的大模型推理、性能加速、开源社区生态建设与工具链实操四大主题,邀请到了 AMD 人工智能事业部生态负责人、AI 软件产品市场技术负责人、AI 开源社区核心贡献者及行业合作伙伴共同分享,通过技术解析、动手实验与实时 Demo 演示,助力 ROCm 开发者提升工程能力与创新效率。
ROCm AI 及开发者战略
ROCm 及 SGLang 社区开源解析
AMD ROCm 大模型应用实战
ROCm AI 优化技术简介
ROCm 大模型推理实操工作坊


现场热闹非凡,产学研共绘 AI 盛景
本次盛会之所以精彩纷呈,离不开行业专家的深度分享、AI 开发者的热情参与,以及众多合作伙伴始终如一的支持与信任。我们在此特别感谢 AMD、数势科技、Neuriva 纽睿华、极狐、飞瓴德移民、声网、人民邮电出版社异步社区、电子工业出版社博文视点、清华大学出版社对大会提供的大力支持。正是产学研多方的协同发力,让现场成为前沿思想的交汇点与技术创新的孵化场。
至此,为期两天的议程已圆满收官。在这场汇聚全球目光的盛会上,来自产业一线与学术前沿的专家学者围绕 AI 基础研究、大模型演进、算力基础设施建设、智能体技术突破以及行业落地实践等热点话题,展开了深入交流与思想碰撞。从技术的探讨到场景的落地,从模型的前沿到系统的支撑,精彩内容接连不断,干货与启发齐飞。
未来已来,技术正当时。让我们共同期待,在下一次相聚时,AI 世界将呈现更多可能。