信息网 > 浙江信息 > 杭州信息 > 正文
蚂蚁、人大发布原生MoE扩散语言模型,将于近期开源
网络整理 2025-12-249月12日消息,在外滩大会上,蚂蚁集团与中国人民大学联合发布原生MoE架构的扩散语言模型(dLLM)“LLaDA-MoE”。
![]()
据介绍,这款新模型通过非自回归的掩码扩散机制,首次通过原生训练的MoE在大规模语言模型中实现了与Qwen2.5相当的语言智能(如上下文学习、指令遵循、代码和数学推理等)。
蚂蚁方面公布的数据显示,LLaDA-MoE模型性能效果在代码、数学、Agent等任务上领先于LLaDA1.0/1.5和Dream-7B等扩散语言模型,接近或超越了自回归模型 Qwen2.5-3B-Instruct,仅激活1.4B 参数即可实现等效3B稠密模型的性能。
![]()
蚂蚁集团通用人工智能研究中心主任、西湖大学特聘研究员、西湖心辰创始人蓝振忠表示,“LLaDA-MoE模型验证了工业级大规模训练的扩展性和稳定性,意味我们在把dLLM训扩到更大规模的路上又往前走了一步。”
中国人民大学高瓴人工智能学院副教授李崇轩介绍,“两年过去,AI大模型能力突飞猛进,但存在一些问题始终没有得到本质上的解决。究其原因,这是当前大模型普遍采用的自回归生成范式所造成的——模型天然是单向建模的,从前往后依次生成下一个token。这导致它们难以捕tokens 之间的双向依赖关系。”
蓝振忠还表示,“我们将于近期向全球完全开源模型权重和自研推理框架,与社区共同推动 AGI 新一轮突破。”
据了解,蚂蚁与人大团队攻关3个月,在LLaDA-1.0基础上重写训练代码,并且基于蚂蚁自研分布式框架 ATorch提供EP 并行等一系列并行加速技术,基于蚂蚁Ling2.0基础模型的训练数据,在负载均衡、噪声采样漂移等核心难题上取得突破,最终采用7B-A1B(总7B、激活1.4B)的MOE架构完成约20T 数据的高效训练。
在蚂蚁自研的统一评测框架下,LLaDA-MoE 在 HumanEval、MBPP、GSM8K、MATH、IFEval、BFCL 等17项基准上平均提升8.4%,领先 LLaDA-1.5达到13.2%,与 Qwen2.5-3B-Instruct 打平。实验再次验证“MoE 放大器”定律在 dLLM 领域同样成立,为后续10B–100B 稀疏模型提供可行路径。
据蓝振忠介绍,除模型权重外,蚂蚁还将同步开源针对 dLLM 并行特性深度优化的推理引擎。相比 NVIDIA 官方 fast-dLLM,该引擎实现了显著加速。相关代码与技术报告将于近期在 GitHub 及 Hugging Face 社区同步发布。
蓝振忠还透露,蚂蚁将持续投入包括基于dLLM的AGI领域,下一阶段将联合学界和全球AI社区共同推动AGI新的突破。“自回归不是终点,扩散模型同样可以成为通向 AGI 的主干道。”蓝振忠如是说。
免责声明:信息网转载此文目的在于传递更多信息,不代表本站的观点和立场。文章内容仅供参考,不构成投资建议。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
转载请标注:信息网——蚂蚁、人大发布原生MoE扩散语言模型,将于近期开源
- 上一篇:没有了
- 下一篇:没有了
- 搜索
-
- 2025-12-24蚂蚁、人大发布原生MoE扩
- 2025-12-24华为云张平安:Token服务是
- 2025-12-24全新深蓝S07上市交付:标
- 2025-12-24蔚来全新ES8正式上市:售
- 2025-12-24猛士M817 Max+版上市:纯电
- 2025-12-24OceanBase CEO杨冰发布全员信
- 2025-12-24唯品会:全面接入中国中
- 2025-12-2451Talk第二届黑客马拉松大
- 2025-12-24一加15发布:首部性能 U
- 2025-12-24广汽昊铂GT全新Lite版上市
- 2025-09-01马斯克:Grok Code Fast 1击败
- 2025-09-01小红书市集:让「好货」
- 2025-09-01阿里巴巴二季度收入为2
- 2025-11-16抖音电商双11非遗铁锅销售
- 2025-12-23今起,石家庄部分区域可
- 2025-12-23一批直播电商典型案例公
- 2025-12-23美团2025年三季度营收955亿
- 2025-12-23告别流量战,深耕价值场
- 2025-09-01最新版本 Xcode 26 发布:现
- 2025-09-01阿里巴巴:将围绕大消费
- 2025-12-24蚂蚁、人大发布原生MoE扩
- 2025-12-24华为云张平安:Token服务是
- 2025-12-24全新深蓝S07上市交付:标
- 2025-12-24蔚来全新ES8正式上市:售
- 2025-12-24猛士M817 Max+版上市:纯电
- 2025-12-24OceanBase CEO杨冰发布全员信
- 2025-12-24唯品会:全面接入中国中
- 2025-12-2451Talk第二届黑客马拉松大
- 2025-12-24一加15发布:首部性能 U
- 2025-12-24广汽昊铂GT全新Lite版上市
- 网站分类
