阿里发布万亿参数AI大模型M6训练能耗大幅降低

2021-06-26 13:24:23 阅读：85017 来源：环球网作者：勃潺

【环球网科技综合报道记者勃潺】6月25日，阿里巴巴达摩院发布“低碳版”巨模型M6，在全球范围内首次大幅降低万亿参数超大模型训练能耗。通过一系列技术创新，达摩院团队仅使用480卡GPU，即训练出了规模达人类神经元10倍的万亿参数多模态大模型M6，与英伟达、谷歌等海外公司实现万亿参数规模相比，能耗降低超八成、效率提升近11倍。

据了解，达摩院及阿里云等团队改进了MOE（Mixture-of-Experts）框架，通过专家并行策略，扩增了单个模型的承载容量。同时，通过加速线性代数、混合精度训练、半精度通信等优化技术，达摩院团队提升了万亿模型训练速度，且在效果接近无损的前提下有效降低了所需计算资源。

同时，达摩院此次发布的M6巨模型拥有超越传统AI的认知和创造能力，擅长绘画、写作、问答，在电商、制造业、文学艺术等诸多领域拥有广泛应用前景。

据了解，经过一段时间的试用，M6将作为AI助理设计师正式上岗阿里新制造平台犀牛智造，通过结合潮流趋势进行快速设计、试穿效果模拟，有望大幅缩短快时尚新款服饰设计周期。M6还已应用于支付宝、淘宝等平台，参与跨模态搜索、文案撰写、图片设计等工作。

达摩院资深算法专家杨红霞表示：“接下来，M6团队将继续把低碳AI做到极致，推进应用进一步落地，并探索对通用大模型的理论研究。”

原标题：阿里发布万亿参数AI大模型M6训练能耗大幅降低

阿里发布万亿参数AI大模型M6训练能耗大幅降低

高通钱堃进博会分享，用5G+AI为可持续发展做出贡献

产业合作推动AI发展高通孟樸:携手伙伴共抓5G+AI新机遇

高通钱堃：5G、AI等有潜力为可持续发展做出贡献

影子传说再发力!格之格兼容惠普战系列W1680/1690硒鼓全球首发上

格之格受邀出席2024 零碳使命气候峰会,共同链接可持续发展未来

实力圈粉!格之格精彩亮相第十八届国际耗材展

阿里发布万亿参数AI大模型M6训练能耗大幅降低

高通钱堃进博会分享，用5G+AI为可持续发展做出贡献

产业合作推动AI发展 高通孟樸:携手伙伴共抓5G+AI新机遇

高通钱堃：5G、AI等有潜力为可持续发展做出贡献

影子传说再发力!格之格兼容惠普战系列W1680/1690硒鼓全球首发上

格之格受邀出席2024 零碳使命气候峰会,共同链接可持续发展未来

实力圈粉!格之格精彩亮相第十八届国际耗材展

产业合作推动AI发展高通孟樸:携手伙伴共抓5G+AI新机遇