|
华为加入AI大模型行列,据报大模型命名为“盘古CHAT”。 |
中评社北京6月5日电/据大公报报道,人工智能(AI)聊天机器人程式ChatGPT的出现,令各科网企业加快拓展AI应用,继百度(09888)的“文心一言”、商汤(00020)的“日日新SenseNova”大模型体系,以及阿里巴巴(09988)的“通义千问”等之后,华为亦加入AI大模型的行列,据报将于下月公布详情。
内地媒体消息指出,华为AI大模型命名为“盘古CHAT”,早于2020年11月通过华为云内部立项。据报,趁7月7日举行的华为云开发者大会(HDC. Cloud),华为将对外正式发布详情及内测,产品主要面对商业(To B)及政企(To G)客户。
命名为“盘古CHAT”
根据华为公布的一份论文数据显示,华为盘古PanGu-Σ大模型参数最多为1.085万亿,基于华为自研AI计算框架MindSpore开发。消息指出,整体而言,PanGu-Σ大模型在对话方面可能已接近GPT-3.5的水平。
华为云官网显示,盘古大模型由自然语言处理(NLP)大模型、计算机视觉(CV)大模型、多模态大模型、科学计算大模型等多项构成,通过模型泛化,解决传统AI作坊式开发模式下不能解决的AI规模化、产业化难题,可以支持多种自然语言处理任务,包括文本生成、文本分类、问答系统等。
另外,根据浙商证券的信息显示,华为在训练千亿参数的盘古大模型时,调用超过2000片升腾910芯片,进行超过两个月的数据训练能力。
华为内部人士透露,集团每年在大模型训练调用处理器超过4000片,3年间的大模型算力成本达9.6亿元人民币。 |