社区
教程
Wiki
注册
登录
创作新主题
社区所有版块导航
Python
python开源
Django
Python
DjangoApp
pycharm
DATA
docker
Elasticsearch
分享
问与答
闲聊
招聘
翻译
创业
分享发现
分享创造
求职
区块链
支付之战
aigc
aigc
chatgpt
WEB开发
linux
MongoDB
Redis
DATABASE
NGINX
其他Web框架
web工具
zookeeper
tornado
NoSql
Bootstrap
js
peewee
Git
bottle
IE
MQ
Jquery
机器学习
机器学习算法
Python88.com
反馈
公告
社区推广
产品
短视频
印度
印度
一周十大热门主题
全文翻译 | 刚上台!特朗普废除了67项拜登行政命令,AIGC相关被废除,看看还保留了哪些?
图解深度学习 - 数据蒸馏和知识蒸馏
ChatGPT o1 Pro 与 DeepSeek R1 要求实-20250123095116
超越ChatGPT,DeepSeek在美国“登顶”!创始人将回广东过年
图灵奖得主,深度学习三巨头对 #DeepSeek# 的评价:开源-20250126193558
DeepSeek回应闪崩:可能与新模型发布后的访问量激增有关;马斯克考虑应用区块链技术来提高美国政府...
超越ChatGPT登顶!大量网友涌入,中国“神秘力量”震动美国科技圈,由杭州公司开发
国产AI DeepSeek下载排行第一,AI界拼多多要逆袭chatgpt
【Python技术】A股涨停最高板多个情况展示并附上表格明细
超强总结!十大聚类算法!附Python实现
关注
Py学习
»
chatgpt
华为版ChatGPT,7月7日发布
科技每日推送
• 1 年前 • 601 次点击
6月4日消息,据钛媒体,华为公司将发布一款直接对标 ChatGPT 的多模态千亿级大模型产品,名为“盘古 Chat”。
据介绍,盘古大模型于2020年11月在华为云内部立项成功。这款“盘古 Chat ”预计将于今年 7 月 7 日举行的华为云开发者大会 (HDC.Cloud 2023) 上对外发布以及内测,产品主要面向 To B/G 政企端客户。
根据华为公布的一份论文数据显示,华为盘古 PanGu-Σ 大模型参数最多为 1.085 万亿,基于华为自研的 MindSpore 框架开发。整体来看,PanGu-Σ 大模型在对话方面可能已接近 GPT-3.5 的水平。
公开资料显示,华为盘古大模型于 2021 年 4 月正式对外发布,后来又在 2022 年 4 月升级到 2.0 版本。目前,AI 大模型中的 NLP 大模型、CV 大模型以及科学计算大模型(气象大模型)均已被标记为即将上线状态。
据介绍,这是首个千亿参数中文预训练大模型,CV 大模型则首次达到 30 亿参数。盘古 CV 大模型业界最大 CV 大模型、首次实现兼顾判别与生成能力、在 ImageNet 上小样本学习能力上的业界第一;盘古气象大模型提供秒级天气预报;紫东.太初是全球首个图、文、音三模态大模型。
对于盘古大模型定位,华为内部团队确立了三项最关键的核心设计原则:一是模型要大,可以吸收海量数据;二是网络结构要强,能够真正发挥出模型的性能;三是要具有优秀的泛化能力,可以真正落地到各行各业的工作场景。
根据华为云高管的演讲 PPT 信息,目前华为“盘古系列 AI 大模型”基础层主要包括 NLP 大模型、CV 大模型、以及科学计算大模型等,上层则是与合作伙伴开发的华为行业大模型。
华为云官网显示,盘古大模型由 NLP 大模型、CV 大模型、多模态大模型、科学计算大模型等多个大模型构成,通过模型泛化,解决传统 AI 作坊式开发模式下不能解决的 AI 规模化、产业化难题,可以支持多种自然语言处理任务,包括文本生成、文本分类、问答系统等等。
具体来看,盘古 NLP 大模型首次使用 Encoder-Decoder 架构,兼顾 NLP 大模型的理解能力和生成能力,保证了模型在不同系统中的嵌入灵活性。下游应用中,仅需少量样本和可学习参数即可完成千亿规模大模型的快速微调和下游适配,这一模型在智能舆论以及智能营销方面都有不错的表现。
盘古 NLP 大模型
盘古 CV 大模型是首次实现模型按需抽取的业界最大 CV 大模型,首次实现兼顾判别与生成能力,基于模型大小和运行速度需求,自适应抽取不同规模模型,AI 应用开发快速落地。使用层次化语义对齐和语义调整算法,在浅层特征上获得了更好的可分离性,使小样本学习的能力获得了显著提升,达到业界第一,这一模型在智能巡检以及智慧物流方面有不错的表现。
盘古 CV 大模型
盘古气象大模型提供秒级天气预报,借助创新的 3DEST 网络结构以及分层时间聚合算法,在气象预报的关键要素和常用时间范围上精度均超过当前最先进的预报方法,速度相比传统方法提升 1000 倍以上。同时,盘古气象大模型支持广泛的下游预报方案,如在台风路径预测任务上,相比传统数值气象预报方法,盘古气象大模型可以降低 20% 以上的位置误差。
盘古气象大模型
浙商证券此前披露的信息显示,华为在训练千亿参数的盘古大模型时调用了超过 2000 块的昇腾 910 芯片,进行了超 2 个月的数据训练能力。华为内部称,每年大模型训练调用 GPU / TPU 卡超过 4000 片,3 年的大模型算力成本高达 9.6 亿元人民币。
东吴证券梳理的华为盘古大模型产业链研报中指出,华为盘古大模型的优势在于人才储备和算力自主可控,有望成为国内领先的大模型,其生态产业链标的有望迎来加速发展,包括拓维信息、四川长虹、麒麟软件(中国软件)、统信软件(诚迈科技)、麒麟信安等华为生态公司。国盛证券则认为,华为盘古为首个多模态千亿级大模型,有望赋能百业。
▲ 图源:东吴证券
文章来源:IT之家
•
END•
如需转载原创文章,
请联系微信:KJMRTS88
欢迎点击
科技每日推送视频号
,看最新视频~
↓
↓
↓
Python社区是高质量的Python/Django开发社区
本文地址:
http://www.python88.com/topic/155952
601 次点击
登录后回复