1.1、中软国际AIGC系列产品发布会:携手华为算力硬件,打通大模型ToB需求场景的“最后一公里”
2023年10月20日,中软国际面向大模型开发应用的AIGC模型工厂、场景案例及“昇腾云+混合云一体机”方案发布会在贵安华为云上屯举行。本次发布会上,中软国际依托华为盘古大模型和昇腾云算力,正式发布AIGC模型工厂以及昇腾云+混合云一体机一体化方案、并集中展示了多项促进大模型场景应用落地方面的创新成果。
发布背景:基础大模型To B服务仍存诸多痛点。近年来,AIGC技术的不断发展为大模型的研发和应用提供了有力支撑,基础大模型具备通用能力强、善于对话&写作类应用、计算性能强大等优势,极大程度推动了AI行业的应用能力。然而,由于大模型本身在专业领域知识和特定场景的专属能力不足,且在训练部署时会面临数据安全、私有化部署等特定需求,大模型在To B的场景中仍存在着局限性。因此,中软国际提出,助力ToB场景应用大模型的关键在于以下4点:
1)使用行业专业知识和企业私域知识训练自有大模型;
2)需要训练特定领域/场景的模型,与企业应用结合,打造AI专属服务;
3)模型训练和应用门槛高,需要有懂训练的专业人员、配套平台和工具、高质量的训练数据,需要提供专业的工具、方法和服务,降低模型应用门槛;
4)对于不同阶段特点的部署方案,需要有对应的AI算力环境,满足企业自有数据的安全要求。
中软国际发布多款AIGC产品,助力AI大模型在行业ToB场景的应用落地。
产品1——“昇腾云云端GPU+混合云算力一体机”:以华为鲲鹏920+昇腾(最新昇腾910B)为硬件基础,除内置Model Lab全套相关软件外,该一体机还将私域化部署多元大模型,包括华为盘古、智谱GLM、竹间竹海、百川智能等主流开源大模型和标准的数据集。综合来看,该产品可以为数据要求度高的客户提供模型独立开发训练环境,确保私有数据安全;提供算力资源,模型开发训练能够直接使用;多种模型直接注入,客户无需再安装部署。
产品2——AIGC大模型服务、Model Lab(模型实验室):是面向大模型开发的模型软件和模型工具产品,能够助力客户实现模型开发、训练、推理、实施部署、运维管理,具体包括开源大模型和通用数据集、标注管理、训练数据管理、资源管理、模型评估、Prompt Builder、运维平台、Turn-Key solution自动集成到终端应用等功能。
产品3——模型工厂:基于软件工厂升级而来,以多架构的算力底座和多形态的大模型为底座,为客户提供前期设计咨询、数据建设、模型研发、模型评测、集成部署的全栈服务。
a)设计咨询:帮助企业梳理业务流程,找到可以被AI替代的点;b)数据建设:不仅是准备训练模型的数据,也需要对客户原有的数据结构进行治理;d)模型评估与精调:基于不同的应用场景,对模型的效率和准确性进行评测、精调与优化;e)集成部署与运维管理:包含接口集成、应用部署和模型运维等
产品4——HR大模型:暨“数字员工”,通过应用HR大模型实现智能招聘,赋能招聘全流程,提升工作效率和准确度。具体包括AI连接人才库、AI简历匹配和推荐、AI面试官等功能,目前HR大模型已落地使用,实现招聘的简历通过率提高2倍,人均招聘效能提升50%。
产品5——政务场景大模型:该模型可实现政务智能问数、智能问视、智能问服、智能问策等多种服务,可应用于城市治理、政务。目前该服务已在南京的城市治理、余姚的智慧交通里得到了应用。
1.2、华为贵安云算力中心:华为全球最大的云数据中心及昇腾云算力枢纽
除发布多款AIGC产品及解决方案外,中软国际此次发布会选择在华为全球最大的云数据中心及昇腾云算力枢纽——贵安华为云数据中心举办,我们认为这在一定程度上彰显出中软国际与华为紧密的合作关系,更有效地向市场传达华为AI计算+通用计算全局部署的生态繁荣。
贵安华为云数据中心是华为全球最大的云数据中心及昇腾云算力枢纽。项目规划总投资80亿元,总用地面积1521亩,一期建筑面积约48万平方米,可容纳100万台服务器,是华为云业务的重要承载节点,承载了华为云和华为流程IT、消费者云等业务。
贵安华为云数据中心具备智能、集约、绿色的特点,能效比PUE仅1.1,处于业界领先水平。
1)智能方面:①算力角度,相比于传统数据中心提供单一的通用算力,新型智算中心能够提供多元算力类型、特别是AI算力;②运维角度,华为云贵安数据中心通过数字孪生平台,能够实时检测数据中心供电和制冷全链路环境、以及服务器设备的工作状态;并结合华为河图VR/AR技术,便于运维工程师直观查看机房环境,如机柜温度、湿度和通风情况。凭借AI和大数据分析技术的加持,贵安华为云数据中心的可靠服务等级SLA达到99.99%,人均运维效率实现10倍的提升。
2)资源整合与集约方面:运用AI技术进行削峰平谷,使得各服务器负荷均衡,提升资源使用效率比。
3)绿色节能方面:①冷却/热回收角度:液冷高密度架构可直接带走服务器70%热量;同时,贵安华为云数据中心采用直通风自然冷却,冷风经大楼百叶窗送进机房,热风经热通道从楼顶排出;数据中心设施区和办公区域采用中温冷冻水系统,散发的热量一部分通过瀑布和湖面实现自然冷却,另一个部分通过热回收技术用于游泳池和办公区冬季制热,实现余热回收,减少热损耗。②耗电方面:在供电环节,用功率半导体替换铜器件,进一步降低供电损耗。满负荷运行的情况下,预计每年可节省电力10.1亿度,减少碳排放81万吨,相当于年植树3567万棵(按PUE 1.35对比节省的电量)。
华为云在中国布局了五大数据中心:分别为贵安云数据中心、乌兰察布数据中心,以及京津冀、长三角、粤港澳片区三大核心数据中心(具体为廊坊云数据中心,苏州华为云数据中心,东莞华为云数据中心)。在国内数据中心规划中,华为云主要基于时延来进行数据中心的冷、温、热布局,其中冷服务主要建在低成本地方,温服务贴近沿海的低成本地方,热服务则布局在贴近客户需求的地方。在海外,华为也在欧洲、中东、非洲、亚太、拉美等区域建立了本地数据中心。
我们将华为计算产业梳理为以下图示,可以清晰看到华为计算主要以昇腾+鲲鹏两个计算平台为基础,分别面向AI计算和通用计算领域;进一步的,昇腾和鲲鹏产业均包括硬件底座、基础软件/框架、以及上层行业应用与服务。
2.1、硬件底座:昇腾+鲲鹏为基础,构建坚实硬件底座
2.1.1、昇腾计算硬件:Ascend处理器+Atlas系列硬件
1)基于华为达芬奇内核的昇腾(HUAWEI Ascend) 系列处理器:具体包括昇腾310和昇腾910。
昇腾310采用自研华为达芬奇架构,集成丰富的计算单元, 提高AI计算完备度和效率,进而扩展该芯片的适用性。此外,基于高性能3D Cube计算引擎,可实现全AI业务流程加速,大幅提高AI全系统的性能,有效降低部署成本。算力方面,昇腾310在典型配置下半精度(FP16)算力为8TOPS,整数精度(INT8)算力可达到16TOPS,功耗仅为8W。
昇腾910基于自研华为达芬奇架构3D Cube技术,实现业界最佳AI性能与能效,架构灵活伸缩,支持云边端全栈全场景应用。算力方面,昇腾910完全达到设计规格,半精度(FP16)算力达到320 TFLOPS,整数精度(INT8)算力达到640 TOPS,功耗310W。
2)基于昇腾处理器的系列硬件产品:嵌入式模组、板卡、小站、Atlas 800服务器、集群等。
2.1.2、鲲鹏计算硬件:鲲鹏芯片+系列部件+TaiShan服务器
1)鲲鹏920处理器:采用7nm制造工艺,基于ARM架构授权,由华为公司自主设计完成。通过优化分支预测算法、提升运算单元数量、改进内存子系统架构等一系列微架构设计,大幅提高处理器性能。典型主频下, SPECint Benchmark评分超过930,超出业界标杆25%;同时,能效比优于业界标杆30%。
2)基于鲲鹏处理器的系列硬件产品:
一方面,华为提供以服务器主板为主的多种部件:具体包括鲲鹏服务器主板、智能网卡芯片、底板管理控制器(BMC)芯片、固态硬盘(SSD)、磁盘阵列卡(RAID卡)等部件。其中,鲲鹏服务器主板具有多核、超大内存带宽、支持PCIe 4.0和100GE网络等特点。
另一方面,华为自研TaiShan服务器,分为TaiShan
200和TaiShan 100两个系列:其中,TaiShan
200服务器基于鲲鹏920处理器,包含2280E边缘型、1280高密型、2280均衡型、2480高性能型、5280存储型和X6000高密型等产品型号;而TaiShan 100服务器,基于鲲鹏916处理器,包含2280均衡型和5280存储型等产品型号。TaiShan服务器适合为大数据、分布式存储、原生应用、高性能计算和数据库等应用高效加速,旨在满足数据中心多样性计算、绿色计算的需求。
2.1.3、华为计算产业的硬件商业模式
华为计算产业的硬件商业模式:华为不直接对外销售处理器,一方面以云服务面向下游客户;另一方面,以自有硬件+伙伴硬件相结合的方式,出售Atlas 800(AI推理/训练服务器)和Taishan自研服务器整机,同时向合作伙伴提供板卡、模组等部件,支持其发展自主品牌整机服务器。我们认为,这种“硬件开放”的模式将为华为硬件生态的持续壮大奠定基础。
2.2、软件+应用:软件开源,使能合作伙伴的开放生态
2.2.1、基础软件:昇腾异构计算架构CANN+鲲鹏openGauss/openEuler
1)昇腾计算基础软件体系包括:
异构计算架构 CANN(Compute
Architecture for Neural Networks):CANN是针对AI场景推出的异构计算架构,通过提供多层次的编程接口,支持用户快速构建基于昇腾平台的AI应用和业务。
开发工具链 MindStudio 和各种运维管理工具等:MindStudio为昇腾计算产业提供一套完整的工具链体系,针对算子开发、模型训练、模型推理、应用开发、应用部署的所有全流程的工具链进行了整合,通过MindStudio能够进行工程管理、编译、调试、运行、性能分析等全流程开发,提高开发效率。
Al计算框架MindSpore:华为提供开源 AI 计算框架 MindSpore,同时也支持业界主流 AI框架如TensorFlow、PyTorch、Caffe 等,同时华为提供模型转换工具支持主流模型便捷的转换到MindSpore。
- openGauss企业级开源数据库:适用于如大并发、大数据量、以联机事务处理为主的交易型应用和操作与分析并重的物联网数据场景,可满足个人和企业的开发和使用,并支持企业基于openGauss定制发行版。
- openEuler开源操作系统:其内核源于Linux,支持鲲鹏及其它多种处理器,能够充分释放计算芯片的潜能,是由全球开源贡献者构建的高效、稳定、安全的开源操作系统,适用于数据库、大数据、云计算、人工智能等应用场景。
2.2.2、应用使能套件:昇腾MindX+鲲鹏DevKit/BoostKit
华为配套提供多元的开发套件与应用使能套件,帮助开发者加速原生应用开发
1)对于昇腾,华为提供应用使能MindX,可以支持上层的ModelArts和HiAl等服务,同时也可以支持第三方平台提供应用使能服务。其中,MindX昇腾应用使能是由2个组件(深度学习组件MindX DL、智能边缘组件MindXEdge)、1个模型库(优选模型库ModelZoo)以及多个行业SDK组成,致力于让行业开发者以最简单的方式开发应用。
2)对于鲲鹏,华为为伙伴提供鲲鹏开发套件(鲲鹏DevKit)和鲲鹏应用使能套件(鲲鹏BoostKit)。其中鲲鹏开发套件 DevKit提供涵盖代码迁移、开发调试、编译、测试、调优及诊断等各环节的开发使能工具,方便开发者快速开发出鲲鹏亲和的高性能软件;而鲲鹏应用使能套件 BoostKit能够助力鲲鹏全栈性能优化,并提供高性能开源组件、基础加速软件包和应用加速软件包,使能应用极致性能。
1.1.2、华为计算产业的软件商业模式
华为计算产业的软件商业模式:坚持秉承“软件开源”的原则,使能合作伙伴,构建基础软件和应用软件生态的核心竞争力。
1)对于昇腾,昇腾计算基础软件生态主要目标为支持主流AI框架和核心网络模型,适配主流操作系统和云平台,并为重点行业和场景打造基础底座。
2)对于鲲鹏,华为通过软件开源的方式,共享在基础软件领域的多年积累,使能伙伴发行openEuler和openGauss商业版,繁荣基础软件产业生态;同时,提供开发套件和应用使能套件,支持伙伴快速迁移应用、持续扩充解决方案。
华为计算核心优势:芯片性能卓越+国产自主可控+生态伙伴多元3.1、昇腾910和鲲鹏920核心参数已可对标海外芯片,为国产替代提供先决条件
适用于通用计算的鲲鹏920在基准频率、功耗性能参数上已经可以对标英特尔至强处理器和AMD EPYC(霄龙)嵌入式处理器。多核性能方面,鲲鹏920基于ARM V8架构,最高可以集成64个物理核,主频高达2.6GHz;耗能方面,鲲鹏920采用7nm工艺,同时进行多核优化处理,降低功耗。
昇腾910 AI芯片算力、功耗、工艺等性能方面已经可以与英伟达A100对标。昇腾系列芯片适用于AI算力场景,其中,昇腾310主要应用在移动端的推理场景,而昇腾910主要应用在云端AI训练应用,因此具有更高性能。昇腾910在算力、功耗、工艺等性能方面已经可以与英伟达A100对标,但是距英伟达H100仍有一定差距。
3.2、美国高性能AI芯片禁止对华出口,国产算力替代迎来催化
美国AI芯片出口禁令进一步升级。10月17日,美国商务部工业和安全局(BIS)公布一则新的出口禁令,进一步收紧高端芯片的对华出口,其中最高性能芯片(TPP[1]超过4800/ TPP超过1600,且PD[2]超过5.92)以及次高性能芯片(TPP处于2400至4800之间,PD处于1.6至5.92之间/ TPP超过1600,且PD处于3.2至5.92之间)受到出口管制,并将璧仞、摩尔线程等13家公司列入实体清单。
[1] TPP:Total Processing Performance, 即20221007管制版本的算力+位宽的乘积
[2] PD:Performance Density, 即TPP除以芯片面积(非平面晶体管区域)
英伟达包括A800、H800在内的芯片对华出口都将受到影响。根据新禁令,此次出口管制涉及的产品包括但不限于:英伟达A100、A800、H100、H800、L40、L40S以及RTX4090(高端游戏芯片)。新禁令消息公布后,美东时间10月17日,英伟达股价一度重挫近8%,收盘仍有4.68%跌幅,市值一夜蒸发超535亿美元(近4000亿元人民币),反应出市场对于英伟达出口中国受限的悲观预期。由于算力对于构建生成式AI系统工程至关重要,国内头部互联网厂商对于英伟达高性能AI芯片需求旺盛,根据英国《金融时报》曾于2023年8月报道,百度、腾讯、阿里巴巴和字节跳动四家中国互联网巨头争相订购A800芯片,总价值达50亿美元。同时,据英伟达首席财务官科莱特柯蕾丝称,FY2Q24业绩会数据显示数据中心业务营收103.2亿美元,其中,大部分AI芯片需求来自中国,中国买家贡献的收入占英伟达数据中心产品总收入的20%-25%。展望未来,英伟达来自中国的AI业务营收未来大概率会消失,同时游戏相关业务也会受影响;此外,根据集微网分析,英特尔、AMD 的芯片对华销售也可能受到影响。
我们认为,美国芯片出口禁令的持续加码,将成为国产计算产业发展的进一步催化,其中,华为算力由于软硬件全栈国产自主可控,将有望承接被限制的海外头部厂商芯片需求。
3.3、华为生态伙伴体系庞大,助推国产计算应用场景的商业化落地
鲲鹏生态稳步发展,生态伙伴持续壮大。根据2023年7月华为鲲鹏计算业务副总裁马银川公布的消息,鲲鹏生态持续稳步发展:硬件开放方面,华为鲲鹏整机伙伴出货占比已经超过了95%,进入了电力、运营商、政务等核心系统;软件开源方面,欧拉服务器操作系统累计装机量突破430万套;合作模式上,华为通过开源实现产业生态共建,延长收益链,与合作伙伴共同受益,鲲鹏国计民生行业技术生态满足度从2019的9%快速提升到2022年的65%。截至2023年7月,鲲鹏合作伙伴超4500家,鲲鹏认证解决方案超13500件,鲲鹏开发者超200万个。
昇腾生态方面,合作伙伴包含整机硬件伙伴、IHV 硬件伙伴、应用软件伙伴、一体机解决方案伙伴以及生态运营伙伴五大类。2023年鲲鹏昇腾开发者峰会上,华为昇腾计算业务总裁张迪煊表示,截至5月6日,昇腾AI产业拥有20多家硬件伙伴,1100多家软件伙伴,并联合推出2000多个行业AI解决方案,开发者数量突破150万。华为昇腾计算业务副总裁刘鑫表示,大模型重塑产业格局,推动行业颠覆式变革,提高算力底座技术门槛,未来行业竞争核心将是集群系统能力之争,华为未来将与合作伙伴持续布局关键产业链,提供坚实算力底座。
1) 硬件伙伴:华为支持硬件开放,搭载华为芯片的硬件设备有望快速扩张。除销售自主硬件外,华为也为合作伙伴开放硬件,供合作伙伴在华为硬件基础上进行集成和二次开发,推出自有品牌并进行销售。对于昇腾,华为提供Atlas模组、板卡等部件,使能伙伴发展基于Atlas部件的智能端侧、智能边缘、服务器、集群等AI设备;对于鲲鹏,第三方硬件厂商可以基于鲲鹏主板发展自有品牌的产品和解决方案。华为整机硬件伙伴+IHV硬件伙伴有望核心受益,建议关注四川长虹、神州数码、拓维信息、同方股份等。
2)软件/解决方案伙伴:软件开源、使能伙伴,鲲鹏/昇腾软件生态日益壮大。其中,鲲鹏软件生态伙伴主要基于openEuler、openGuass开发、销售自有知识产权的操作系统、数据库、中间件、云平台、组件、工具链等基础软件产品,或者开发、销售自有知识产权的应用程序、软件产品、加载项、及垂直细分应用或解决方案。例如,宇信科技(300674.SZ)与华为共同研发大数据开发平台;海量数据(603138.SH)基于鲲鹏底座打造Vastbase G100数据库;东方通(300379.SZ)基于鲲鹏底座推出应用服务器中间件(简称TongWeb);应用方面,润和软件(300339.SZ)推出aive智能视觉分析引擎,全面适配鲲鹏硬件和openEuler开源操作系统等基础软硬件环境,完成兼容性验证。昇腾软件生态伙伴主要为能对接昇腾产品、且有能力进行应用程序、软件、垂直解决方案的二次开发的软件服务厂商,如华雁智科(831021.NQ)与华为共同推出变电站远程智能巡视系统,智洋创新(688191.SH)与华为共同推出电力场景AI应用联合解决方案。
3)一体机解决方案伙伴:多家厂商携手华为发布昇腾AI大模型训推一体化解决方案。华为基于昇腾AI提供澎湃算力与高效开发工具,携手云从科技(688327.SH)、科大讯飞(002230.SZ)等一同提升大模型开发、训练、微调、部署的效率,加速大模型创新业务上线。拓维信息(002261.SZ)作为华为“鲲鹏/昇腾AI+行业大模型+开源鸿蒙+云”全方位合作伙伴,围绕云计算、数据容灾备份、信创迁移、办公会议等行业场景构建了多款软硬件一体机产品。中软国际于10月20日发布的“昇腾云+混合云一体机”也是基于鲲鹏920系列+昇腾910系列的新一代GPU芯片的大模型训练和推理一体机,具备更高算力、极致能效比和高速网络宽带,可用于大模型开发、大模型使用和大模型的运维管理。
4)生态运营伙伴:作为算力中心的运营服务商,提供生态合作、软硬件迁移适配、应用场景创新以及人才培养等服务。昇腾/鲲鹏生态的运营伙伴,通常是指具备区域运营能力,可主导运营指定区域人工智能计算中心、生态创新中心或创新实验室等的运营服务商,或者基于鲲鹏计算平台进行软/硬件产品测评和认证的服务商。目前主要合作的上市公司有中软国际(0354.HK)、软通动力(301236.SZ)以及神州数码(000034.SZ)等。其中,中国软件国际(0354.HK)是华为昇腾生态伙伴,也是昇腾西安未来人工智能计算中心唯一运营服务商,未来公司有望将西安智算中心打造为标杆项目,并将运维经验和服务模式复刻推广,助力国产算力市场持续发展。
1) 算力研发不及预期:AI技术的发展需要强大的计算能力,如AI芯片、云计算等。如果算力研发未能满足AI技术的需求,可能会限制AI应用的效率和性能,从而影响AI技术的发展和应用;2) 技术发展不及预期:如果AI技术的研发速度放缓或停滞,可能会对AI的应用前景和市场发展产生负面影响;3) AI场景落地不及预期:AI技术的应用价值在于解决实际问题、实现场景落地,如果AI技术在应用场景的落地效果不佳,或者未能满足实际需求,可能会影响市场对AI技术的信任度和接受度;4)国内外政策风险:政策限制、法规制约、知识产权纠纷等都可能对AI技术的发展和应用产生一定影响。本订阅号是光大证券股份有限公司研究所(以下简称“光大证券研究所”)海外研究团队依法设立、独立运营的官方唯一订阅号。其他任何以光大证券研究所XX研究团队名义注册的、或含有“光大证券研究”、与光大证券研究所品牌名称等相关信息的订阅号均不是光大证券研究所海外研究团队的官方订阅号。
本订阅号所刊载的信息均基于光大证券研究所已正式发布的研究报告,仅供在新媒体形势下研究信息、研究观点的及时沟通交流,其中的资料、意见、预测等,均反映相关研究报告初次发布当日光大证券研究所的判断,可能需随时进行调整,本订阅号不承担更新推送信息或另行通知的义务。如需了解详细的证券研究信息,请具体参见光大证券研究所发布的完整报告。
在任何情况下,本订阅号所载内容不构成任何投资建议,任何投资者不应将本订阅号所载内容作为投资决策依据,本公司也不对任何人因使用本订阅号所载任何内容所引致的任何损失负任何责任。
本订阅号所载内容版权仅归光大证券股份有限公司所有。任何机构和个人未经书面许可不得以任何形式翻版、复制、转载、刊登、发表、篡改或者引用。如因侵权行为给光大证券造成任何直接或间接的损失,光大证券保留追究一切法律责任的权利。