大模型为整个计算产业链带来的计算范式、开发范式、交互范式共三大范式转换,将深刻影响计算产业的未来,包括基础设施、开发流程和应用形态。
“推理能力”是 AGI 的核心,倘若不能解决推理问题,大模型成为 AGI 是不可能的!
没有大规模的多模态数据,大语言模型就难以获取各个模态足够多的知识,因此,预训练应尽早纳入多模态。
……
4 月 25-26 日,备受业界关注的大模型风向标大会 ML-Summit 2024 全球机器学习技术大会在上海环球港凯悦酒店盛大开幕。
本次盛会共邀请 50+ 国内外顶尖专家,涉及产学研等多个领域,涵盖微软、阿里、小米、百度、蚂蚁集团、智谱、零一万物、智源、面壁智能、中科院、北大、复旦、上海交通大学、南方科技大学等大模型领域专家和学者,他们齐聚一堂,共同探讨行业前沿动态,分享最新的研究成果和实践经验,为推动相关领域的发展贡献智慧和力量。现场座无虚席,超 1000 名各行各业的AI 技术精英齐聚一堂。围绕大模型各层次技术栈与行业落地实践共12 大主题展开研讨与热议。4 月 25 日上午的主会汇聚 CSDN 高级副总裁、Boolan 首席技术专家李建忠,Kaldi之父, IEEE Fellow、小米集团首席语音科学家 Daniel Povey,复旦大学教授、眸思大模型负责人张奇,水木分子联合创始人和首席技术官乔木等业界大咖。他们从 AI 的发展历程中深度剖析 AGI 的探索之路,以及大模型的行业应用,带来一系列精彩的主题演讲。AGI 2024 技术创新研究与思考:大模型驱动的计算产业范式转换The Current Moment in AI
大语言模型是实现AGI的必由之路吗?
多模态生物医药大模型及其行业应用
圆桌论坛:大模型的演进与 AI 创新之路
随后在 Athena labs CTO 王兴明的主持下,上述几位重磅嘉宾围绕“大模型的演进与AI创新之路”进行高峰对话,这场高峰对话不仅仅是一次技术交流,更是对于大模型和AI创新领域的一次集中探讨和思考。通过与会者们的分享和讨论,可以看到这一领域的发展潜力和未来方向,为相关领域的研究和应用提供了宝贵的参考和启示。在 4 月 25 日下午的首个分会场,来自智源基础语言模型与软件组负责人刘广、南方科技大学统计与数据科学系讲席教授荆炳义、恒生电子AI首席技术专家林金曙分别从不同的角度和领域,分享了大模型在具体实践中的研发案例与行业应用。从理论到实践:剖析 Aquila 模型的研发过程和未来展望随着预训练技术的发展,大模型强大的语言理解和生成能力,助力开发者更高效地编写代码、优化算法、提升软件性能。为此,我们特邀请了微软首席应用科学家经理黄寓凡、阿里巴巴通义实验室资深算法总监李永彬、百度 Comate 架构师张立理、智谱 AI-CodeGeeX 算法工程师张鑫鹏等众多行业翘楚,共同探讨大模型在软件开发领域的应用前景和创新实践。他们分享各自在大模型赋能软件开发方面的宝贵经验和前沿技术,为我们带来一场别开生面的技术盛宴。
CodeLLM在微软开发者部门的发展及其应用
通义灵码的技术进展和应用案例
智能化研发在百度的落地
CodeGeeX:RAG和长文本模型在代码项目级别的探索和应用实践
本论坛聚焦于智能驾驶、推理优化、算力基建等领域,来自元戎启行副总裁兼技术合伙人刘轩,揭示端到端模型在智能驾驶中的应用案例和技术突破;MiniMax技术总监星龙,分享了大模型在AI Infra方面的挑战与实践,以及应对策略;PPIO联合创始人兼CTO王闻宇,探讨了如何实现算力基建和推理优化的“软硬兼施”与创新突破;蚂蚁集团AI Infra技术专家王勤龙,介绍了DLRover训练故障自愈技术,以大幅提升大规模AI训练的算力效率,为参与者呈现一场前沿科技的盛宴,引领新质生产力的崛起。PPIO:如何做到算力基建和推理优化的"软硬兼施"与创新突破DLRover 训练故障自愈:大幅提升大规模AI训练的算力效率在多模态大模型前沿技术专场,我们特邀请了零一万物联合创始人潘欣、上海交通大学教授倪冰冰、新浪微博新技术研发负责人张俊林、潞晨科技副总裁李彤就原生多模态、多模态架构及具体应用进行精彩分享。40+ 主题演讲同步进行
嘉宾听众互动不断,激情碰撞
当我们谈及大模型时,我们看到的是其在各个领域展现出的巨大潜力和无限可能。大模型如何落地到实际的应用中去,也是众多大模型开发者关注的焦点。为此,我们特邀请了度小满金融技术委员会执行主席、数据智能应用部总经理杨青、文因互联工程VP兼首席科学家宋劼、金山办公文档AI技术总监熊龙飞、网易有道技术总监林辉、达观数据联合创始人张健、eBay支付风控部门算法专家韩志超就大模型应用落地实践展开分享,现场听众更是意犹未尽,与嘉宾互动频频。- 杨青 度小满金融技术委员会执行主席、数据智能应用部总经理
有道QAnything RAG引擎的演化史与落地经验分享大模型与传统模型在eBay电商业务中的融合开发策略智能涌现、智能体、机密计算、RAG 等技术成为大模型的重要实现细节,对推动大模型技术的发展和应用具有重要意义。本论坛邀请到 7 位资深技术专家,共同探讨在不同场景下的大模型实现以及应用和挑战,为推动智能化技术的发展添砖加瓦。MetaGPT:多智能体引领代码生成与协同的革新探索- 吴承霖 DeepWisdom创始人兼 CEO,MetaGPT项目作者
上下文相关的决策优化:基础模型在工业控制中的应用探索AI Infra 大模型基础设施是支撑人工智能发展的坚实基石。它就像四通八达的高速公路,为大模型的运行提供了稳定、高效的环境。该专场特邀请了聆心智能联合创始人,CEO郑叔亮、中科曙光存储产品事业部副总经理,曙光存储公司副总裁杨志雷、白海科技创始人兼CEO卢亿雷、千芯科技董事长陈巍、清昴智能科技 CEO关超宇、百度飞桨资深研发工程师骆涛展开主题分享。- 杨志雷 中科曙光存储产品事业部副总经理,曙光存储公司副总裁
该专场由来自北京大学博士生导师袁粒、微软亚研首席研究员刘树杰、中科院自动化所副研究员、武汉人工智能研究院算法总监吴凌翔、自变量机器人 CTO王昊、OriginX AI Technologies Cofounder CTO 姚佳晨、小冰公司计算机视觉算法专家王文斓、复旦大学工学硕士刘妍领衔开讲。Open-Sora Plan 视频生成开源计划 – 进展与不足
- 吴凌翔 中科院自动化所副研究员、武汉人工智能研究院算法总监
- 姚佳晨 Cofounder CTO, OriginX AI Technologies
小冰AI Beings的视觉革新:个性化表达的挑战与突破StepCoder:从编译器反馈中强化学习以提高代码生成能力ML-Summit 2024 全球机器学习技术大会的成功举办离不开赞助商们的大力支持和慷慨相助。特别感谢元戎启行、曙光存储、金茂绿建、PPIO、西云算力、容数信创、戴尔、英伟达,是他们的共同努力,让这场盛会得以圆满举行。
至此,ML-Summit 2024 全球机器学习技术大会圆满落幕,通过精彩的分享和深度的讨论,与会者们深入探讨了大模型技术的前沿与应用,探索了大模型工程与架构、多模态、产品创新的技术挑战和解决方案。本次会议不仅展示了人工智能领域的最新进展,也为业界人士提供了宝贵的交流与学习机会。我们期待着在未来的研究与实践中,进一步推动机器学习、人工智能、大模型、生成式 AI 等技术的创新与发展,共同开创智能化时代的新篇章。最后感谢所有参与者的支持与贡献,期待与您再次相聚!与此同时,2024 全球软件研发技术大会(http://sdcon.com.cn/)将于 7 月 4-5 日在北京威斯汀酒店隆重举行,敬请关注~