昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

2025-08-20 18:20:58     来源:

随着人工智能技术的飞速发展,大模型参数量激增。MoE 稀疏大模型因能在提升容量的同时保持训练计算量,成为了当下的研究热点,但推理时的性能瓶颈仍制约着其进一步发展。在此背景下,中国科学技术大学人工智能与数据科学学院执行院长张燕咏率领团队,在中国科学技术大学 鲲鹏昇腾科教创新卓越中心的算力支持下,成功研发出了基于专家选择分布预测的专家负载均衡和all2all通信均衡框架。

该框架的研究致力于解决两大难题——专家负载不均及较大的计算通信开销,并通过“三步走”成功实现了推理性能的优化。为了让模型在并行推理时能更合理地分配资源,团队首先从专家选择的规律入手,通过分析相似 token 在 MoE 层选择专家的特征并归类,成功预测出token的专家选择路径偏好。

接着便是解决推理过程中的专家负载不均衡问题。团队依据token对专家选择偏好的预测结果,精准判断出专家动态访问的频率和重要性,通过复制高频专家、替换非重要专家的方式实现了负载平衡。其中昇腾推理引擎MindIE提供的性能分析工具可实现性能数据的可视化,在实时监测专家负载、统计访问频率等方面提供数据参考,发挥了重要作用。

降低分布式计算的通信时延是第三步。团队根据计算节点上的数据对专家选择的预测结果,将专家提前部署到对应的节点上,并联合需要紧密协作的专家放在同一计算单元,让数据与所需专家在物理位置上更接近,同时结合昇腾384超节点采用的高速总线互联技术,最终大幅降低了跨节点和跨计算单元的通信消耗。

在系列技术突破下,此次项目成果显著。基于该创新框架,在多尺寸、多结构的 MoE 模型中,推理时间、all2all 时间、MoE 层时间及负载不均分数较现有主流方案提升超 30%;多卡复杂场景里,前三项指标提升 30%,推理时间提升 20%。

本次项目的成果,为开发者借助昇腾技术优化 MoE 稀疏大模型推理性能提供了可贵借鉴,将加速其在各领域的落地应用。未来,中国科学技术大学 鲲鹏昇腾科教创新卓越中心将持续深化产学研协同创新,依托昇腾软硬件平台,在前沿AI模型优化领域持续突破,为自主创新人工智能战略与数字经济发展贡献力量。

标签:

猜你喜欢

激活户外场景多元价值,2025《小红书运动户外场景白皮书》最新发布
奥林巴斯医学生教育活动走进云南乡村,共绘乡村健康图景
爱伯馨Vernova® Caps+微胶囊技术升级,以创新技术引领香精绿色转型
南国书香节收官 京东图书五折直降叠加满200减30优惠不限购火爆持续
业内首个支持500M大文件处理,WPS知识库亮相2025全球产品经理大会
备思复联合帕博利珠单抗围手术期治疗显著改善特定膀胱癌患者的生存期
经典昆曲剧目《烂柯山》正乙祠开演 8月22日袁国良、于雪娇联袂演绎经典——
别让自拍成“诈骗工具”:AI时代,守护个人信息就是守护钱包
推荐几款让大学生从“吃土”到“有余”的鸿蒙记账App!
“水中贵族+顶级赛事” 百岁山携手世运会开启新征程
雪球大V视角:永捷量化杯来了,四大操盘手正面对决
名创优品盘活存量旧物业,以潮流IP设计助力北京路焕发新活力
Mac Mac正式登陆中国:一座连接黎巴嫩与中国的美食桥梁
数据堆成山,决策拍脑袋?“浙”里有华为云MaaS秘籍!
职场新人实用好物 花王“祝”你步履生风
SKG再度携手王一博,共赴全球健康科技新征程
生而竞速,领先一步,ARISUN(艾瑞森)轮胎品牌战略发布暨中策赛道嘉年华活动圆满成功
沃克风机盘管荣获尚普咨询集团系列市场地位声明
汗水铸就荣耀!MLB CUP总决赛兴义落幕,风雨无阻热血棒魂
万豪一号·湖畔锦庭EB-5乡村项目独家首发盛典在广州圆满举办
突破直播电商运营困局的常熟智慧
百岁山世运季:高端自在,由心而贵
朱林瑶推动华宝国际落地国产大模型 开启“管理智能化”战略新实践
唯一拥有2项二硫化硒国家专利技术洗发水品牌
欧韦宁®正式供应长三角,助力阿尔茨海默病精准诊断广泛可及
欧姆龙正式发布新型便携网式雾化器:轻松掌控呼吸健康,居家出行随心享
获世运会德国运动员“冠军T恤”礼赞!揭秘成都东部新区酒店服务硬实力
中国大陆第一株《婴幼儿名单菌株BLa80白皮书》
避险资产再添利器!ATFX铂金钯金品种重磅上线
联通5G-A助你抢抓“苏超”金球时刻