#文心大模型# 【综合实力已超ChatGPT！文心大模型3.5勇-20230724215917

2023-07-24 21:59
本条微博链接

#文心大模型# 【综合实力已超ChatGPT！文心大模型3.5勇夺国际权威测评第一名，7项指标均为满分】

日前，IDC 发布《AI 大模型技术能力评估报告，2023》。该报告指出，“百度 #AI大模型# 整体竞争力位于领先水平，在模型能力、工具平台、生态布局以及行业覆盖上优势明显，并已提前进入商业化落地探索阶段”。

内容创作、图片生成、智能编程、对话问答……如今，AI 大模型已然具备诸多通用能力。它的诞生，让人类通过自然语言就能与其进行交互，极大程度地促进了社会生产力的释放。

以 AI 驱动的大模型技术突破，也被看作是人工智能发展的一个重要里程碑。目前，市场上已经出现各式各样的大模型，与之同时产生的，是各类大模型评测标准和评估报告。《AI 大模型技术能力评估报告，2023》，就是 IDC 面向 AI 领域推出的一项权威报告。据悉，本次评估涉及 9 家大模型技术厂商。其中，由百度开发的文心大模型 3.5 取得 12 项指标的 7 项满分，获得综合评分第一、算法模型唯一满分和行业覆盖唯一满分的佳绩。

IT 市场研究和咨询公司 IDC 在分析咨询领域深耕了五六十年，对信息技术和高科技行业发展趋势的跟踪覆盖全球 110 多个国家。目前，其所发布的数据和指标，已经成为诸多行业和企业的重要参考依据。

2023 年 3 月，IDC 正式启动《AI 大模型技术能力评估报告》项目。据了解，该报告与其他机构发布的同类报告存在几点不同。首先，其是国内最早启动的大模型评估报告。其次，研究周期持续 4 个月，在对不同类型的不同厂商进行全面覆盖的同时，也保持对大模型能力迭代与演进的持续跟踪。同时，评估范围非常全面，涵盖产品、服务、行业这三大维度和算法模型、通用能力、创新能力等十多项指标。此外，其首次提出的一套行业认可的技术评估标准，对发展大模型过程中的去伪存真也有一定借鉴意义。

如上所述，百度文心大模型 3.5 在 7 项指标中获得满分。具体来说，这 7 项指标分别是算法模型、通用能力、创新能力、平台能力、行业覆盖、能源和生态合作。

戳链接查看详情：

综合实力已超ChatGPT！文心大模型3.5勇夺国际权威测评第一名，7项指标均为满分