【环球网科技综合报道 记者 勃潺】6月25日,阿里巴巴达摩院发布“低碳版”巨模型M6,在全球范围内首次大幅降低万亿参数超大模型训练能耗。通过一系列技术创新,达摩院团队仅使用480卡GPU,即训练出了规模达人类神经元10倍的万亿参数多模态大模型M6,与英伟达、谷歌等海外公司实现万亿参数规模相比,能耗降低超八成、效率提升近11倍。
据了解,达摩院及阿里云等团队改进了MOE(Mixture-of-Experts)框架,通过专家并行策略,扩增了单个模型的承载容量。同时,通过加速线性代数、混合精度训练、半精度通信等优化技术,达摩院团队提升了万亿模型训练速度,且在效果接近无损的前提下有效降低了所需计算资源。
同时,达摩院此次发布的M6巨模型拥有超越传统AI的认知和创造能力,擅长绘画、写作、问答,在电商、制造业、文学艺术等诸多领域拥有广泛应用前景。
据了解,经过一段时间的试用,M6将作为AI助理设计师正式上岗阿里新制造平台犀牛智造,通过结合潮流趋势进行快速设计、试穿效果模拟,有望大幅缩短快时尚新款服饰设计周期。M6还已应用于支付宝、淘宝等平台,参与跨模态搜索、文案撰写、图片设计等工作。
达摩院资深算法专家杨红霞表示:“接下来,M6团队将继续把低碳AI做到极致,推进应用进一步落地,并探索对通用大模型的理论研究。”
原标题:阿里发布万亿参数AI大模型M6训练能耗大幅降低