社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

历史性一刻!DeepSeek超越ChatGPT,登顶美区

观察者网 • 1 周前 • 20 次点击  

DeepSeek-V3模型发布后,在美国热度持续飙升。截至北京时间今早,DeepSeek在美区苹果App Store免费榜上已经排在第一位,力压此前霸榜的ChatGPT,而排在第三的则是Meta旗下的Threads。

而就在昨天早上,DeepSeek还没有挤进榜单前五,显示出过去24小时发酵速度之快。

对于一款中国大模型来说,能够在美国力压ChatGPT,也是历史性一刻。

另据澎湃新闻,1月27日,由国产大模型公司杭州深度求索开发的DeepSeek应用登顶苹果中国地区应用商店免费App下载排行榜。

除了C端用户的喜爱,DeepSeek也持续引发行业内的高度重视。

1月25日,超微半导体(AMD)在其X账号上宣布,已将中国人工智能公司深度求索的DeepSeek-V3模型集成到AMD Instinct MI300X GPU上,以在SGLang技术支持下,实现极致性能。选择将DeepSeek大模型集成至自家AI芯片产品上,AMD或重塑全球AI芯片竞争格局。

AMD表示,DeepSeek-V3作为强大的混合专家(MoE)语言模型。为实现高效推理与经济性训练,该模型延续了前代产品DeepSeek-V2的核心架构——多头潜在注意力机制(MLA)和DeepSeekMoE架构。在多数基准测试中,特别是数学与代码任务领域,DeepSeek-V3均展现出业界领先性能。

那么在通常情况下,像DeepSeek-V3这种语言大模型推理过程中,普遍都需要大量的计算资源和内存带宽来处理文本和视觉数据,AMD则认为自家Instinct GPU系列AI芯片可以为运行此类大模型,提供出色性能。

公开信息显示,MI300X是 AMD于2023 年底推出的旗舰级AI芯片,专为大语言模型和高性能计算设计,旨在挑战竞争对手英伟达(Nvidia)在AI计算领域的主导地位。其基于CDNA 3架构,采用混合5nm和6nm制程工艺,集成1530亿晶体管,配备192GB 内存,拥有5300GB/s的带宽。在不考虑软件层面问题,仅从硬件规格上看,MI300X远超英伟达的H100甚至H200。

2023年12月,AMD CEO苏姿丰展示MI300X平台,该GPU峰值理论性能号称吊打英伟达H100。@AMD官方

AMD称,深度求索团队在DeepSeek-V3的开发过程的关键阶段,采用了AMD ROCm 软件和AMD Instinct GPU加速器。ROCm对FP8格式的广泛支持,能显著提升AI模型的运行效率,特别是在推理环节。该技术可以解决内存瓶颈及高读写格式相关的高延迟问题,而FP8低精度计算还能减少数据传输与计算过程中的延迟。因此,通过与深度求索的合作,AMD也为用户提供了更丰富的GPU硬件选择。

另一方面,随着AI浪潮对高算力芯片的需求,英伟达的股价水涨船高,如今已超越苹果公司登顶全球市值最高宝座,而同期的AMD不论市场份额和产品性能,相对于英伟达都全面处于明显劣势。受此影响,虽然AMD也享受了AI爆发带来的红利,但股价自去年10月的172.8美元以来已下跌近30%,与同年3月创下的211.38美元最高点相比更是跌幅超40%。

过去一年里,AMD股价持续下跌。CNBC

不过,转机或已出现。2024年底,深度求索发布DeepSeek-v3时,技术报告中称正式训练成本仅为550万美元成本,使用的也是英伟达H800芯片(美出口管制”下,针对中国市场特供版H100),这和美国OpenAI以及Meta公司动辄上亿美元的大模型相比,便宜到令美国人自我怀疑。前几天,深度求索又发布了DeepSeek-R1模型,作为开源软件直接比肩闭源的OpenAI的o1大模型,一度引发市场关注。

越来越多的投资者开始反思,AI计算对英伟达GPU的需求是否被资本人为夸大了?因为深度求索团队已经展示了如何通过超低成本,以及使用“不那么先进的芯片”,构建出了高质量AI模型。倘若如此,这意味着训练大模型也不用一味去追求英伟达那“一卡难求”的旗舰芯片,这时“不那么能打”但在硬件方面性价比更高的AMD产品,则看上去更“Yes”了。

目前,华尔街分析师普遍看好AMD。包括花旗集团、路通资本等近30名分析师都给出了“买入”意见,这些预测将AMD未来一年平均目标价推上了182.7美元,出现了48.73%的上涨空间。还有更激进的预测认为,若AMD的PEG比率回归行业中枢(科技行业在3倍上下),其估值可能进一步提升130%以上,达到265美元。

华尔街分析师对AMD未来股价保持乐观。StockAnanlysis

与此同时,英伟达股价则出现下跌。1月24日,英伟达收报142.62点,跌幅3.12%,盘后又下跌0.42%,反映出投资者对其市场主导地位的担忧。

来源|观察者网


推荐阅读

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/178428
 
20 次点击