社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

“千模大战”100天:六路玩家围攻ChatGPT

智东西 • 1 年前 • 208 次点击  

55家企业火拼“千模大战”,谁真刀实枪,谁虚晃一剑?
作者 |  李水青
编辑 |  心缘
随着ChatGPT火遍全球,“千模大战”在国内已经打响!
今年3~5月,堪称“国产大模型之春”。据智东西统计,自2022年11月ChatGPT发布至5月29日,国内至少有55个类GPT大模型已经推出或马上面世,互联网和云服务大厂、AI企业、行业头部公司、高校及科研机构、大数据及算力提供商都参与到这场AI“大乱斗”之中来了。
下表展示了国内的类GPT大模型发布/更新的具体情况。为了呈现更清楚,本表格仅以企业最新一次大模型重大进展情况为参照,比如百度、阿里早在位列第一的MiniMax之前推出了大模型,但我们选择统计其今年最新公布的文心一言、通义千问的进展节点;华为于2021年4月就推出了盘古大模型,但由于在统计时间内未公布重大进展,因此未列入表格。

▲国内大模型推出/更新时间表(2022年11月~2023年5月)

根据近日在2023中关村论坛上面世的《中国人工智能大模型地图研究报告》,全国有14个省(市)在开展大模型研发,其中仅是北京、广东两地的大模型产品分别达到38个和20个,可以说全局情况远超我们肉眼可见的信息面。
国产大模型浩浩荡荡,但这还没算上陆续官宣创业的业界大佬动作,今年2月起,从美团联合创始人王慧文到搜狗创始人王小川,再到李开复宣布Project AI 2.0计划……大佬“从大厂毕业去做AI”成为科技圈的新趋势。

▲国内部分知名人士大模型创业情况(不完全统计)

在5月的一场ICT市场趋势论坛上,知名行研机构IDC对基于大模型的AI市场规模进行了预测:中国AI市场规模在2023年将超过147亿美元,到2026年将超过263亿美元。市场增量主要源于基于大模型的AI应用、生成式AI及新AI企业应用,不具备大模型能力的厂商难以维持竞争优势。这样的局势给了国内互联网大厂及AI企业无限压力。

实际上,国内大模型于2021年前后就崭露头角。三年来,国内企业推出的大模型参数规模从几十亿扩展到几万亿;同时,通用大模型也在向行业大模型发展,应用从Demo进化为测试版本,已有一定技术和产业基础。
但ChatGPT横空出世,让国内玩家看到其间的代际差距现实。即便是被寄予厚望的百度文心一言,也只被其创始人打了70分。只有在中文大模型及特定细分行业的局部领域,国内大模型或许能短期内赶超。
随着逆全球化风险在全球蔓延,很多人期盼国内出现与ChatGPT对打的技术。那么在这场“千模大战”之中,这些大模型有什么相似和不同之处?哪些是真刀实枪,哪些又是虚晃一剑?它们前景如何,竞赛格局又会怎样?本文对此进行了深入探讨。

01.
互联网云大厂围攻ChatGPT
军备赛打响


近几个月,随着微软、谷歌、亚马逊等硅谷大厂纷纷公布大模型及AIGC进展,通过AI搜索引擎、AI办公软件等一系列应用打响AI竞赛,国内互联网云大厂也陆续全军出击了。
以百度、阿里、腾讯、华为为第一梯队玩家,360、京东、网易、知乎等为第二梯队玩家,以及字节跳动、快手、小红书等为潜力玩家,互联网/云大厂已经在大模型、算力设施、AIGC应用产品、生态等各方面展开了明争暗斗。

▲互联网/云大厂推出大模型的情况

众所周知,打响应战ChatGPT第一枪的互联网大厂是百度,今年3月面世的文心一言(ERNIE Bot)是百度在2021年12月推出的百度·文心(ERNIE 3.0 Titan)迭代而来的细分模型,百度创始人李彦宏称将用其重构百度所有的应用。而后,首个跳出来硬刚百度的是阿里。4月11日,阿里云推出通义千问大语言模型(LLM),阿里董事会主席兼CEO张勇宣布,阿里所有产品将接入大模型全面升级。阿里的大模型进展公开可追溯到2021年10月的云栖大会。

▲阿里云推出通义千问大语言模型(LLM)

随着百度、阿里参战,互联网云大厂AI竞赛开始变得硝烟四起。
4月9日,360集团基于360GPT大模型的“360智脑”落地搜索场景内测;
同日,京东透露京东言犀大模型预训练参数达到千亿级,2月言犀平台曾官宣推出“产业版ChatGPT”:ChatJD;
4月13日,知乎和面壁科技合作推出中文大模型“知海图AI”,落地“热榜摘要”开启内测;
近日,短视频厂商字节跳动、快手,以及生活方式平台小红书都已筹备大模型团队或透露出大模型计划。
……
华为和腾讯仍未在这波大模型浪潮正式推新,但已经从局部领域围而攻之。
比如,华为于2021年4月就推出了盘古系列大模型,并在2022年推出了矿山、气象、金融OCR等行业大模型。4月17日,华为云旗下的智能编程助手CodeArts Snap在深圳一场“华为代码大模型的方案与应用”活动中露面。
再看看腾讯这边,其也在2022年12月推出了万亿参数的中文NLP预训练模型“混元”(HunYuan-NLP-1T),但至今未正式披露类ChatGPT应用的新进展。4月14日,腾讯云推出大模型算力集群;5月15日,腾讯云副总裁、腾讯云智能平台负责人李学朝透露:“具体的大模型腾讯内部正在做……具体进度后续会统一对外公布。”

当然,仍有一些互联网大厂表现得比较谨慎。比如搜狐董事局主席兼CEO张朝阳近日接受媒体采访时称,搜狐现在对大模型仍是观望,应该会从应用角度来看一看,相对还是比较谨慎一点,但在整个GPT的应用方面搜狐已经开始在产品里逐渐渗透了。

通用大模型之战是大厂的大型军备竞赛。
市面上大厂推出的大模型,大多是基于Transformer架构进行开发的通用大模型,这是一场算法、算力和数据以及应用落地、生态合作的全面比拼。这边,百度刚刚宣布文心一言接入企业超700家;那边,阿里云宣布全系产品史上最大规模降价,发起规模战进行攻击;看似按兵不动的华为则加速在行业“圈地”,抢占大模型落地先机。
合作成为BATH以外的互联网企业的关键抉择。比如360集团和知名AI大模型企业智谱AI于5月宣布了战略合作,共同研发千亿级大模型“360GLM”,借鉴“微软+OpenAI”组合的分工模式。5月24日,云知声也宣布了与360集团的战略合作,双方将积极推动山海大模型在各领域的落地应用。
在打法上,互联网云大厂大多“两条腿走路”:一边通过提供大模型MaaS,获取平台服务费用;一边通过出租算力和推训平台,赚取大模型企业的租金。两种方式都有望成为云服务业务的新增长点,并带来新的云服务范式。
尽管战争仍在初期,大厂之间已经开始明着较量,阵势不小。

02.
AI企业大乱斗:数量多爆发强
避开“巨兽的脚印”抢生存空间


AI大模型也吸引了一大批创业者,从美团联合创始人王慧文到搜狗创始人王小川,再到李开复宣布Project AI 2.0计划,众多大佬都在加入AIGC创业潮。
实际上,国内已有一批AI企业率先将大模型做出来了。
据智东西统计,国内至少有19家AI企业加入了这场AI大模型之战,其中4月官宣的企业达到9家,接近一半。如下图所示,这些AI企业大致分为两类,一类是专用AI中小模型起家的企业,一般成立有一段时间了;一类是原生AI大模型创企,大多是新公司。

▲AI企业推出的大模型

在第一类AI企业中,最受关注的无疑是NLP领域龙头企业科大讯飞,其于5月6日推出的“星火”大模型已开启内测,与文心一言打擂台。
此外还有商汤科技,其于4月10日推出“日日新SenseNova”大模型体系,包括其自研中文语言大模型应用平台“商量”等。近期,包括云从科技、云知声、旷视科技等专用AI起家的知名企业都披露了大模型动向。这类企业具有AI算法研究的人才队伍及经验积累,长处在于算法研发和行业工程化突破。

▲商汤科技推出日日新大模型

第二类企业是AI大模型原生企业,如昆仑万维,其在4月10日正式推出千亿级大语言模型“天工3.5”,对标ChatGPT、支持万字以上的文本对话。有很多AI大模型企业创立不久,比如创立于2021年的澜舟科技、MiniMax等,但其团队成员做大模型的时间却跨越数年。这波大模型浪潮的到来令这些企业压力不小,催促其加快结合细分赛道的产业化探索。
可以看到,在这些大模型的领域分布上,NLP仍是目前大模型研发最为活跃的重点领域,其次是多模态领域,在CV和智能语音等领域的大模型还较少。
AIGC大模型已成为热门投资领域,金沙江创投管理合伙人朱啸虎近日发文透露今年的投资策略,称今年一半投资都给了AIGC。反过来对于AI公司来说,推出大模型有望帮公司吸引更多资金以推动估值上涨,比如刚刚推出AI大语言模型“序列猴子”的出门问问,就被彭博社爆料正推动港股IPO,可能筹集约2亿至3亿美元。
在互联网大厂的团战之下,AI创企的空间有多大?
对此多位业内人士和投资人告诉智东西,AI大模型领域不同于互联网“大补贴”时代,可能不会赢家通吃,而是百花齐放。
一方面,大语言模型在产业可能仍是大厂主导,因为参赛入场券是足够的钱、数据、算力及人才。比如OpenAI三年前接受了微软为其打造的一台由数万个A100 GPU组成、价值数亿美元的大型AI超级计算机,据推测标准大小的ChatGPT-175B大概需要625台8卡DGX A100服务器进行训练,成本约达到3~5亿元人民币。创企融来的几亿元在这个层面几乎做不了什么,大厂则资金相对充裕。
但另一方面,有业内人士告诉智东西,一些关键点突破可能还要看科创公司。据悉,国内AI企业的大模型很多是基于GPT-2开源模型开发而来,与GPT-4仍有代际差。由于GPT-4是闭源的,国内企业无法参考论文而只能自行研发追赶,并不是投钱和时间就能攻克的。因此从算法层面来说,AI创企与互联网大厂可以说站在同一起跑线,甚至聚焦创新的能力会更强。
正因为AI大模型算法结构突破难度大,许多创企公司都是由高校及科研机构成果孵化而来。与此同时,众多高校直接推出了大模型,包括复旦大学、清华大学、武汉大学等。

▲高校及科研机构布局大模型的情况
根据《中国人工智能大模型地图研究报告》,大模型的学术影响力已初步形成,但仍有提升空间。在开源影响力方面,国内大模型研发团队在积极推进大模型开源发展,目前已经有超过半数大模型实现开源,且高校和科研机构是开源主力。 

即便是基于强大科研成果,AI初创企业要突围还需要花些巧劲。正如创世伙伴资本合伙人梁宇此前告诉智东西:“创企要学会躲开‘巨兽踩下的脚印’,所有伟大的公司都是从很小的缝隙中钻出来的。”

在大厂领跑的同时,初创公司的机会可能在应用层,从垂直领域切入做产业落地、降本增效。比如澜舟科技聚焦的就是金融领域。其于3月14日推出孟子对话大模型,而早在2021年7月推出了孟子(MChat)大模型及相关系列开源模型。基于Transformer,孟子大模型可支持以及快速替换自回归(如GPT)、自编码(如BERT)等多种预训练模型。

03.
传统行业公司与算力企业纷纷入局
抢占绝佳站位


说到AI大模型竞赛,数据是必不可少的一环。传统行业公司掌握海量数据,是这波“千模大战”中另一类不容小觑的选手。
据智东西统计,截至目前至少有15家传统行业公司推出了行业大模型。其中,金融领域涉及的企业最多,包括中国农业银行、江苏银行、度小满、奇富科技等;教育领域涉及的企业仅此其后,包括网易有道、学而思、淘云科技、孩子王等推出或计划推出大模型。此外,医疗、自动驾驶、智能物联等领域的行业公司都已经行动。

▲传统行业公司推出的大模型

随着大模型产业化落地加速推进,目测一大批来自各个行业的大模型也将喷涌而出。
行业头部公司由于接近客户和落地场景,因此更容易在数据、应用落地方面占据优势。比如近日,度小满正式开源国内首个千亿级中文金融大模型——“轩辕”。轩辕大模型是在1760亿参数的Bloom大模型基础上训练而来,在金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务上,效果相较于通用大模型大幅提升。
说到数据,实际上也有一些大数据起家的公司推出了大模型。比如大数据公司达观数据就于3月18日推出了曹植大模型,不过具体参数和应用效果还不清楚。

▲大数据公司推出的大模型

此外,一些算力公司也推出了大模型。比如4月29日消息,联发科在4月28日发表官方博客称,联发科AI研究小组近日发布了全球第一个繁体中文大型语言模型BLOOM-zh。多语言模型BLOOM-zh在保持其英语功能的同时,在大多数繁体中文基准上优于其前身。
国内服务器头部企业浪潮甚至在2021年9月就推出了源1.0大模型。根据公司2月在深交所互动平台上的发言,源1.0模型结构与GPT-3类似,与GPT-3相比参数量增加40%,训练数据集提升10倍,达到了2457亿参数,训练使用了5TB的高质量中文数据。消息称,源2.0也将在不久之后发布。
国家超算天津中心于5月19日推出了“天河E级智能计算开放创新平台”和“天河天元大模型”,据称将带来突破百亿次的跨模态的超级计算算力,支撑传统的科学工程计算,并服务智能混合计算,成为智算中心机构布局大模型的代表。
可以看到,行业、大数据、算力领域的大模型入局玩家还不多。但由于这些领域的企业往往拥有算力和算力优势,如果与AI大模型企业合作,有望在大模型领域实现超车,这都为“千模大战”的战况带来更多变数。

04.
结语:千模大战打响
研发和落地是持久战


仅仅两个月时间,国内的大模型之战已经打响,互联网/云服务大厂、AI企业、传统行业公司、大数据公司以及算法公司全都入局了。
可以看到,入局的公司要么在资本实力、平台生态、应用场景方面占据优势,要么在算法、算力和数据层面构筑了护城河,但这都只是一张“入场券”。
AI大模型创业将是一场持久战。国内的大模型产品大多与GPT-4仍有代际差,这毕竟是一个高难度的系统性工程,仍需要国内大模型玩家深耕技术、贴合应用,以此在硅谷巨头的包围中实现突破。

(本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。)




Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/155661
 
208 次点击