社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

国产AI自称ChatGPT,真相可能和你想的不太一样

哎咆科技 • 6 天前 • 28 次点击  

幻方量化旗下的DeepSeek(深度求索)在2024年年末成为了全球AI行业的焦点,他们刚刚发布的开源大模型DeepSeek-v3用更低的参数、更少的成本、更短的时间,在能力上却可以媲美OpenAI的GPT-4o。如此反常的表现自然是一石激起千层浪,让整个业界开始讨论起了这个“神秘的东方力量”。



因此“国产大模型之光”的头衔也被好事者戴在了DeepSeek-v3头上,可人红是非多,日前有用户发现,在向DeepSeek-v3提问“你是哪家大模型”时,DeepSeek-v3竟然会称自己是ChatGPT。考虑到这一次DeepSeek-v3的训练成本仅为557.6万美元,使用的GPU也只有2048块,如此低的成本却有着惊人的效果,难免就会有人怀疑它是ChatGPT套壳。

事实上,当下大模型的迭代是建立在海量投入的基础上。根据技术咨询公司Omdia的分析师估计,微软方面在2024年购买了48.5万块英伟达Hopper芯片,接下来则是买了22.4万块Hopper芯片的Meta,xAI、亚马逊,即便谷歌购买的芯片也在六位数。也正是各大厂商的疯狂投入,使得英伟达的市值攀上了全球第一的宝座。


不仅如此,为了保障AI大模型训练所需要的能源,谷歌、微软等巨头甚至盯上核能,开启了投资核电站的热潮。更加致命的是,大模型训练的“高举高打”模式甚至开始失灵,根据相关爆料显示,OpenAI的GPT-5开发进度已落后原计划半年,其每轮训练需要耗费数周、乃至数月时间,六个月的计算成本可能达到了5亿美元。

业界领头羊OpenAI的核心项目出现问题,自然就更显得DeepSeek-v3以小博大的特殊性。当然,DeepSeek-v3并非第一个出现自我认知错误的大模型。此前在去年年末,谷歌的Gemini就出现过自称百度文心一言的情况,马斯克旗下xAI推出的AI聊天机器人Grok也曾在与用户对话时突然表示,“我无法完成您的请求,因为它违反了OpenAI的用例政策。”


显而易见,DeepSeek-v3自称是ChatGPT的现象并非孤立。那么问题就来了,为什么大模型会出现如此低级的错误,难道证明了“算力极限会制约大模型演进”是一个伪命题的DeepSeek-v3,其实是建立在套壳ChatGPT的基础上?当然不是,毕竟DeepSeek-v3在大多数基准测试中都比GPT-4o的表现更好,单纯的抄袭显然也做不到青出于蓝而胜于蓝。

事实上,DeepSeek-v3出现自称ChatGPT的认知错位,源自于AI输出的内容已经在互联网泛滥。从2023年开始,就已经有大量出版机构、网站开始使用AI来撰写文章,随着AI产出的内容大量出现,任何一家大模型厂商使用的数据集都无法避免会被AI污染,其中ChatGPT输出的内容必然就是最多的。


在2022年年末上线的ChatGPT,是史上增长最快的消费类应用程序,时至今日其仍以超3亿月活遥遥领先于一众竞品。如此庞大的活跃用户群体,就意味着ChatGPT已经在事实上成为了互联网新的内容源。即便DeepSeek或其他大模型厂商并未通过“蒸馏”ChatGPT来获得数据,也做不到完全摆脱ChatGPT的影响。

当初谷歌Gemini自认为是文心一言,其实也是同样的道理。彼时Gemini自称文心一言只会发生在中文对话场景,切换到英文就不会复现,其中的关键就在于百度实际上掌握有全网规模最大、质量最高的中文语料库,所以不使用百度的数据几乎没有训练好AI中文能力的可能。


归根结底,DeepSeek-v3自称ChatGPT当然也不是一件好事。它的出现代表着即使是DeepSeek-v3这种基于合成数据完成自我迭代的模型,在左脚踩右脚实现原地升天的情况下,也无法在训练数据集中彻底清洗AI产出的内容。


换而言之,未来大模型厂商将不得不在AI内容的基础上进行产品迭代,各个大模型自我认知混乱的情况也会进一步加剧,这次DeepSeek-v3自称ChatGPT可能仅仅只是一个开始。

【本文图片来自网络】
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/177684
 
28 次点击