社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

超越ChatGPT,DeepSeek成全球增速最快AI应用!国产AI黑马是如何炼成的?

TechWeb • 1 月前 • 79 次点击  

TechWeb 文/ 果青
题图/ 豆包AI

2月6日,据国内AI产品榜 aicpb.com数据,DeepSeek 应用(APP) 2025/01/11 日发布,截止 1/31 日上线仅 21 天。日活跃用户DAU 2215万,达ChatGTP日活用户的41.6%。

DeepSeek上线20天全球日活 DAU突破2000 万,超过ChatGTP成为全球增速最快的AI应用。

更令人咋舌的是,截止1月31日DeepSeek霸榜苹果应用商店157个国家/地区的第一名。

SensorTower数据显示,目前DeepSeek应用每日下载量接近500万。

DeepSeek这股热潮简直势不可挡。

芯片巨头适配DeepSeek
国产GPU们欢呼“过年”

DeepSeek的火爆,不仅体现在用户数量的激增上,更在于它赢得了芯片巨头的青睐。AMD、英伟达、英特尔等大佬纷纷宣布适配DeepSeek,国产GPU企业更是欢呼雀跃,仿佛过年一般。壁仞科技、摩尔线程、华为昇腾等纷纷宣布上线DeepSeek推理服务,为全球开发者提供了云端体验的全系列模型服务,从1.5B到70B,应有尽有,简直是开发者的福音。

早在1月25日,AMD宣布将DeepSeek-V3模型集成到其Instinct MI300X GPU上;1月31日,英伟达官宣其NVIDIA NIM微服务预览版支持DeepSeek-R1模型;2月1日,美国芯片巨头英特尔宣布DeepSeek能够在英特尔产品上运行,包括搭载英特尔处理器的AI PC上实现离线使用。

正在过年的国内芯片企业紧随其后。

2月5日,壁仞科技宣布壁仞AI算力平台正式上线 DeepSeek R1 蒸馏模型推理服务,全球开发者可云端体验 1.5B、7B、8B、14B、32B、70B 全系列模型服务。该服务具备以下两大核心优势:一是零部署成本:免去硬件采购与环境搭建,实现“开箱即用”的云端推理体验。二是多场景覆盖:针对LLM等不同任务预置优化配置方案。

2月4日,摩尔线程智能科技公司在2025年2月宣布成功部署DeepSeek蒸馏模型推理服务,验证了其自研全功能GPU在复杂AI任务中的支持能力。摩尔线程还计划开放自主设计的夸娥(KUAE)GPU智算集群,支持DeepSeek V3、R1模型及新一代蒸馏模型的分布式部署。

2月4日,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上线昇腾社区,支持一键获取DeepSeek系列模型,支持昇腾硬件平台上开箱即用,推理快速部署,带来更快、更高效、更便捷的AI开发和应用体验,欢迎广大开发者体验使用。

全球云巨头争先恐后接入DeepSeek

开源模型成本的下降对产业链上的云服务厂商无疑是利好。目前,全球主要云厂商纷纷将DeepSeek系列模型部署在其云服务上,以丰富其AI产品线,提升服务竞争力。

1月30日,亚马逊云科技就举办一场关于在Amazon Bedrock上部署DeepSeek模型的线上直播。用自定义模型导入功能,在Amazon Bedrock上部署DeepSeek-R1 Distill Llama模型,无缝集成至Amazon Bedrock环境中,即可充分利用Amazon Bedrock的Serverless基础设施和统一API。

1月30日,微软董事长兼CEO萨蒂亚·纳德拉宣布DeepSeek-R1模型已可通过微软的Azure AI Foundry和GitHub获取。微软宣布推出针对NPU优化的DeepSeek-R1首批将面向搭载高通骁龙X芯片的Copilot+ PC推出,随后是英特尔酷睿Ultra 200V等平台。

还在春节假期期间的国内云服务商们也不甘落后、紧急加班起来。

2月1日华为云宣布,硅基流动与华为云团队联合首发并上线基于华为云昇腾云服务的DeepSeek-R1/V3推理服务。

2月2日,腾讯云宣布腾讯云高性能应用服务 HAI 支持 DeepSeek-R1 一键部署,2月4日又宣布腾讯云 TI 上架 DeepSeek 系列模型;

2月3日宣布阿里云PAI ModelGallery支持云上一键部署DeepSeek-V3、DeepSeek-R1。

2月3日晚,百度智能云宣布,百度智能云千帆平台已正式上架 DeepSeek-R1 和 DeepSeek-V3 模型。

2月4日,火山引擎宣布,将支持 V3、R1 等不同尺寸的 DeepSeek 开源模型,可以通过在火山引擎机器学习平台 veMLP 中部署和在火山方舟中调用模型两种方式使用模型。

2月5日下午,青云科技旗下 AI 算力云服务——基石智算CoresHub 正式上线 DeepSeek-R1 系列模型,限时免费!既可以通过大模型服务直接调用 DeepSeek 系列模型,按token计费,前5天免费使用,不限token数量;也可以通过 AI 算力云服务提供的 GPU 在云端部署推理服务,按需使用算力,可随用随开,新用户注册认证立即赠送 50 元算力券,可免费体验。

DeepSeek爆火背后的创新和突破

DeepSeek之所以能够爆火,背后自然有其创新和突破点。

在C端用户使用来看,DeepSeek与ChatGPT等其他聊天机器人的不同之处在于,DeepSeek的同名聊天机器人在回应用户提问时,会将思维链(Chain of Thought,CoT)完全展示出来。将自己的思考过程完全展示给用户看,这激发了大量用户的热情。

对企业等B端用户而言,DeepSeek R1 API 的价格,比o1便宜近27倍。效果差不多的情况下,便宜这么多,谁不选便宜又好用的呢?

DeepSeek模型在前端的优秀表现,其背后依赖于DeepSeek的技术突破。

DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。

DeepSeek V3模型和R1系列模型都是基于更基础版本V3-Base开发的。V3模型的突破主要在于训练成本和计算效率,R1开辟了训练推理模型的新路径。

在R1之前,业界大模型普遍依赖于RLHF(基于人类反馈的强化学习)。这一强化学习模式使用了大量由人类撰写的高质量问答以了解“什么才是好的答案”

根据DeepSeek 发表的论文,R1模型放弃了RLHF中的HF(人类反馈)部分,只采用RL(强化学习):为模型设置两个奖励函数,一个用于奖励“结果正确”的答案,另一个奖励“思考过程正确”的答案;鼓励模型一次尝试几个不同的答案,然后根据两个奖励函数对它们进行评分。DeepSeek称,经过数千个RL步骤,DeepSeek-R1-Zero在推理基准测试中的性能就与OpenAI-o1-0912的性能相当了。

DeepSeek颠覆“大算力”玩法儿
英伟达GPU被抛售?

更值得一提的是,DeepSeek的低成本模型已经给产业界带来震撼。

DeepSeek的模型在较低成本的算力环境下运行高效,降低了对英伟达高端GPU芯片的依赖。这可能导致市场对英伟达高端芯片的需求增长放缓。

DeepSeek的技术突破使投资者重新审视AI产业的投资逻辑,对英伟达等依赖高端算力芯片的企业前景产生担忧,导致英伟达等科技股集体下挫。DeepSeek的技术突破引发市场对AI算力需求的怀疑,导致博通、台积电等依赖AI获得巨额市值增长的芯片制造商股价下跌。

同时,DeepSeek的开源策略和技术突破有助于吸引更多开发者参与优化和部署,进一步降低算力成本,提高模型的应用效果。

整体来看,DeepSeek的崛起促使全球科技圈重新审视AI产业的投资逻辑和技术路径,加速了AI技术的创新和发展。

近期,就有消息称,DeepSeek发布之后,英伟达GPU预期需求已经出现下降,有人发现Alibaba网站上有大量全新的英伟达H800、A100、甚至H100上线,正在疯狂被抛售。

围堵DeepSeek
又是美国挑头

然而,DeepSeek的崛起之路并非一帆风顺。美国已然挑头围堵DeepSeek。

据媒体报道,近日,美国参议员Josh Hawley提出了一项激进的法案《2025年美国人工智能能力与中国脱钩法案》。根据新的法案,任何下载或使用DeepSeek的行为将被定性为犯罪,最高可判处20年监禁。如果与中国的高校、大学或实验室合作,可能涉及违法行为,并对违反规定的行为设定了民事罚款,具体为个人罚款100万美元,公司罚款1亿美元,此外赔偿金额为3倍。

早在法案提出之前,美国总统就已开始屏蔽DeepSeek,包括国防部、国会和NASA等部门。

另外,意大利等国家也跟风禁用DeepSeek。意大利数据保护局(Garante)以数据隐私风险为由,要求DeepSeek提供关于个人数据收集和存储的详细信息,包括数据来源、用途、法律依据及是否存储在中国境内。由于DeepSeek的回应被认定为“完全不充分”,Garante随即下令屏蔽其服务,并展开正式调查。意大利要求政府设备移除DeepSeek相关产品,但个人设备暂未受限。

自2025年1月31日起,DeepSeek在意大利的苹果和谷歌应用商店已无法下载。

意大利的举措引发了欧洲多国跟进。例如,法国、爱尔兰等国的监管机构也启动了对DeepSeek的质询,而澳大利亚、美国部分州及韩国则进一步扩大至政府系统的全面禁用。

最后总结

DeepSeek的颠覆性影响已经显现。它不仅改变了大模型经济的格局,更让全球科技圈重新审视AI产业的未来。

不过,目前使用DeepSeek服务非常不稳定。有用户反馈,一上午问了10个问题,7个被回复“服务器繁忙,请稍后再试。”

所以,首要需求是,还得让DeepSeek服务的更稳定!

—【 THE END 】—

往期精彩文章回顾:

丨卢伟冰换上新手机:小米15 Ultra又近一步


丨国行定档2月11日!三星Galaxy S25 Ultra 16GB版本或中韩独享


丨iPhone 17系列背板实拍图曝光:六年来首次设计大焕新

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/178766
 
79 次点击