几乎是一夜之间,“来自东方的神秘力量”再次让海外人士惊叹不已!1月27日,国产大模型公司杭州深度求索(DeepSeek)开发的同名应用DeepSeek,不仅在中国地区,更在美国地区的应用商店免费APP下载排行榜上登顶,一举超越了ChatGPT,成为科技圈的新宠。
然而,就在登顶当日,DeepSeek官网却显示网页/API不可用。原来,就在前一天(26日),DeepSeek曾出现短时闪崩现象。对此,DeepSeek迅速回应,表示当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。这一事件无疑是由于新模型发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求所致。
DeepSeek究竟是何方神圣?它来自国产大模型公司深度求索,这家公司是量化巨头幻方量化旗下的大模型公司。1月20日,深度求索正式发布了推理大模型DeepSeek-R1,一经推出,便凭借其“物美价廉”的特性在海外开发者社区中引发了轰动。
创始人梁文锋的传奇经历
说到深度求索,就不得不提其创始人梁文锋。这位1985年出生于广东省湛江市的年轻人,对数学建模充满热情,2002年考入浙江大学电子信息工程专业,并在随后的几年里继续深造,最终于2010年获得信息与通信工程硕士学位。在校期间,他就对金融市场产生了浓厚的兴趣,并在2008年全球金融危机之际,带领团队探索了机器学习技术在全自动量化交易中的应用潜力。
毕业后,梁文锋将目光投向了更广阔的金融市场,与浙大同学共同创立了杭州雅克比投资管理有限公司和杭州幻方科技有限公司,致力于通过数学和人工智能进行量化投资。2016年,公司推出了首个基于深度学习的交易模型,实现了所有量化策略的AI化转型。为解决计算资源不足的问题,2019年,梁文锋带领团队自主研发了“萤火一号”训练平台,总投资近2亿元,搭载了1100块GPU。两年后,“萤火二号”的投入增加到10亿元,搭载了约1万张英伟达A100显卡。2023年,梁文锋宣布正式进军通用人工智能领域,创办了深度求索DeepSeek,专注于做真正人类级别的人工智能。
DeepSeek的震撼表现
2024年5月,DeepSeek发布了混合专家语言模型DeepSeek-V2,同年12月,DeepSeek-V3问世。这款性能优越且性价比极高的大语言模型,被硅谷同行誉为“来自东方的神秘力量”。DeepSeek-V3的出现极大地降低了大模型训练和应用的成本,其训练成本仅557.6万美元,而OpenAI训练ChatGPT-4o所花费的成本高达7800万美元甚至是1亿美元,双方成本差距至少10倍!
在性能上,DeepSeek-V3在数学、代码能力和中文知识问答方面还超过了ChatGPT-4o,这一性价比让行业震惊。更值得一提的是,DeepSeek-V3还开源给了全世界的技术开发团队。
团队配置
DeepSeek团队只有139名研发人员,而ChatGPT的OpenAI团队则有1200名研究人员,团队规模近乎是DeepSeek的9倍之多。然而,这并没有影响DeepSeek的吸引力。近期热门话题“雷军千万年薪挖95后天才AI少女”,这位AI少女就是DeepSeek团队的研发人员。同时,深度求索公司的北京子公司正在招人,共放出了52个岗位,包括深度学习研究员、核心系统研发工程师等,薪资诱人。
市场反应
1月27日,DeepSeek概念股表现强势,多只股票涨停。消息面上,AMD宣布已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上,旨在实现最佳性能。华经产业研究院报告显示,国内智能体市场规模正快速增长,预计2024年将突破百亿元。中国工程院院士邬贺铨也表示,2025年将是智能体和AI终端的元年。
结语
DeepSeek的崛起无疑展示了国产AI的强大实力和无限潜力。未来,随着技术的不断进步和市场的不断拓展,DeepSeek有望成为全球AI领域的领军企业,为人类社会带来更多的变革。从科研到商业,它为全球开发者和使用者提供了一个更具竞争力、灵活性和透明度的AI选择。
———————————
原IBM/Accenture产品战略顾问;
品牌商业IP营销公司创始人/高维商业IP操盘手/0到1成功打造近百位创始人IP/AI商业化课程主理人;
欢迎加微交流(58311518),可以领取最新品牌/IP打造/数字营销相关资料包;