欢迎访问杂志网站:www.zte.com.cn/magazine

中兴通讯技术2022年第2期  文章正文

鹏程·盘古:大规模自回归中文预训练语言模型及应用

字体:


  摘要:在鹏城云脑ⅱ上训练了全球首个拥有全开源2 000亿参数的自回归中文预训练语言大模型——鹏程·盘古。鹏程·盘古模型基于1.1 tb高质量中文训练数据,采用全场景人工智能计算框架mindspore自动并行技术实现了五维并行训练策略,从而可将训练任务高效扩展到4 096个处理器上。对比实验表明,在少样本或零样本情况下,鹏程·盘古模型在多个中文自然语言理解或生成任务上都具有较优的性能。在此基础上,鹏程·盘古模型在大模型压缩、提示微调学习、多任务学习以及持续学习等方面也取得了很好的应用效果。

  关键词:大规模预训练语言模型;鹏城云脑ⅱ;大规模分布式训练;中文理解与生成; ……阅读全文

主办: 中兴通讯技术杂志社 Copyright◎1997-2024
技术支持,电子版全球营销龙源
互联网出版许可证:新出网证(京)字066号
京公海网安备110108001919
京ICP备10216796号-6
电信与信息服务业务经营许可证: 京ICP证060024