2026年06月03日 星期三
在大学路  体验“街头毕业季” MiniMax发布新一代旗舰模型 “韧性小孩”运动会把校园变乐园 读懂压力信号  拒绝标签化孩子
第6版:科教卫新闻 2026-06-02

MiniMax发布新一代旗舰模型

AI大模型竞争转向长上下文与智能体能力

本报讯(记者 郜阳)昨天,上海AI企业MiniMax发布了新一代旗舰大模型MiniMax M3。M3采用全新的自研稀疏注意力架构MiniMax Sparse Attention(MSA),在编程及智能体能力、超长上下文及原生多模态等多个关键方向,都实现代际突破。

据悉,M3是国内首个同时具备“前沿Coding能力、1M超长上下文、原生多模态”三项核心能力的大模型,也是目前全球唯一具备完整能力组合的开源选项。支撑M3三大能力合一的,是MiniMax自研的稀疏注意力架构MSA。相较传统全注意力机制,MSA能够显著降低长上下文的计算成本,并将上下文窗口提升至100万Token。这意味着模型在处理长文档、复杂代码仓库、多轮任务协作等场景时,能够在一次推理中保留更完整的信息链路。MiniMax披露,在100万上下文规模下,M3单Token计算量仅为上一代模型的约1/20,推理效率显著提升。

除模型架构升级外,MiniMax在底层推理算子层面也做了进一步优化。通过重新设计数据读取与计算路径,相关性能较主流开源方案提升4倍以上。

在业内看来,这也是全球大模型竞赛的重要新变量——随着Agent任务复杂度不断提高,“更长上下文、更稳定记忆、更低成本推理”正在成为决定产品可用性的关键能力。

业内人士告诉记者,随着M3发布,MiniMax在全球AI竞赛中的定位进一步清晰:以“开源+多能力合一”的前沿模型为差异化定位,填补国内AI生态在这一维度的空白。值得一提的是,MiniMax已在上周向上海证监局提交了上市辅导备案报告,开启A股上市进程,冲刺A股大模型第一股。

放大

缩小

上一版

下一版

下载

读报纸首页