云天励飞DeepEdge10实现DeepSeek来源项目FlashMLA适配,打造国产大模型算力新底座

2025-02-27 11:15:00     来源:

2月24日,DeepSeek"开源周"正式启动,并发布首个代码库FlashMLA,引发全球关注。

FlashMLA是针对英伟达Hopper GPU优化的高效MLA解码内核,专为可变长度序列优化设计,是DeepSeek高效使用算力的核心程序模块。FlashMLA通过MLA解码优化与分页KV缓存技术,显著提升硬件利用率,加速大语言模型解码过程,有效提高响应速度与吞吐量,适用于各种实时对话生成场景。

云天励飞芯片团队在FlashMLA开源后,迅速完成了DeepEdge10平台与FlashMLA的适配工作。在适配过程中,云天励飞采用了Op fusion tiling、Online softmax、Double buffer、细粒度存算并行等先进技术,并基于自研的Triton-like编程语言快速开发验证了高效的FlashMLA算子。通过一系列优化,不仅显著提升了计算效率,还大幅降低了显存占用,充分展现了DeepEdge10平台“算力积木”芯片架构的卓越优势,以及其与DeepSeek生态的高度契合性。

今日,云天励飞已将相关代码提交至开源平台Gitee,为开源AI贡献了重要的技术力量。

算子的源码地址为:

https://gitee.com/Intellifusion_2025/tyllm/blob/master/python/tylang/flash_mla.py

DeepEdge10系列芯片是专门针对大模型时代打造的芯片,支持包括 Transformer 模型、BEV 模型、CV 大模型、LLM 大模型等各类不同架构的主流模型;基于自主可控的先进国产工艺打造,采用独特的“算力积木”架构,可灵活满足智慧城市、智慧交通、智能制造、智慧仓储、机器人、边缘智算中心等不同场景对算力的需求,为大模型推理提供强大动力。

目前,DeepEdge10芯片平台已成功适配DeepSeek R1系列模型及国产鸿蒙操作系统。未来,云天励飞将持续加大研发力度,推动芯片在国产化领域取得更大突破,为国产AI生态建设贡献更多力量。

 

标签:

猜你喜欢

玲珑轮胎3A级产品开发量产成功 新能源轮胎技术实现三重突破
趣链科技创始人、董事长李伟:在“浙”里,破局全球科技博弈
新希望集团、小米等蓝凌客户,出席民营企业家座谈会
董超:医疗器械行业的创新领跑者
达索系统推出AI驱动的业务解决方案 SOLIDWORKS CPQ,实现快速精准的配置、定价与报价
AI赋能小微 宜人智科以创新科技助力民营经济新发展
15.3吨极限装载测试 江西五十铃翼放EMT猛犸象不惧重物 高效运输
全擎投入 焕新在即 美孚1号助力红牛车队开启2025 F1新征程
浙江文交所与鲸探科技合作取得突破 共同推动数字资产市场规范化发展
比音勒芬集团:KENT&CURWE二登伦敦大秀尽显国际范,多品牌战略再推进
江淮汽车推进合肥市低空产业园建设,推动新型立体交通生态发展
Levi’s® 携手流行天后Beyoncé 推出重塑想象第二章《Pool Hall》
从华为到字节跳动,揭秘头部企业达成年度目标的股权激励法则
百年东亚扎根中国 九项荣誉倍受肯定
《国家突发事件总体应急预案》正式发布,专网通信领军企业震有科技有望深度受益
万人合唱预定!小糊涂仙经典时光群星演唱会3月22日唱响河南周口
小鹅通 × 腾讯元宝:创新智能模式,解锁课程高效学习密码
只接纳梦想 免收租金——【紫荆1号】国家级孵化器助力创业启航
瑞隆安健康产业集团成立14周年暨2025年工作启动会议圆满成功
中华慈善总会“新技筑家·日喀则灾后援建计划”物资顺利抵达曲当乡援建工作取得阶段性进展
“机票一站通 免费游温州” :温州文旅北京推介,开启畅游新篇
Alat埃耐特成为蒂升电梯主要长期股东,双方将在沙特成立战略合资企业
尚普咨询集团:权威市场地位证明—香铭“泡鸭爪全国销量第一”
诺赛国际医学研究院携手雅蘭国际共建全球新质生物医药制造高地
好剧真香!优酷获“2025酷云数娱影响力榜单”19项荣誉
京东企业购携手得力开启“得力政企开工季”,18000元开工大礼包助力企业全年采购降本
HTFX外汇:全球网络支持下的高效跨境交易
产品热销、获消费者广泛认可的背后,百草味做对了什么?
百草味高增长密码:以产业生态建设为基,履行社会责任为翼
金蝶卡塔尔公司成立 国际化版图再落一子