【AI前沿】MiniMax发布M3 大模型:首创MSA架构并支持1M上下文,全面开源对标海外旗舰
AI资讯AI新闻资讯正文MiniMax发布M3 大模型:首创MSA架构并支持1M上下文,全面开源对标海外旗舰发布于AI新闻资讯发布时间 :2026年6月1号 9:29阅读 :1分钟MiniMax 稀宇科技于2026年6月1日正式发布新一代前沿大模型MiniMax M3,这是国内首个集成了顶尖编程、1M超长上下文及原生多模态能力的开源大模型,旨在全面对标海外闭源旗舰。针对复杂智能体任务中的上下文扩展瓶颈,M3在底层自主研发了稀疏注意力架构(MSA),相比传统方案实现更精确的KV分块与算子层优化,计算速度较同类开源方案提升4倍以上;在1M上下文下,其每Token计算量仅为上代模型的二分之一十分之一,预填与解码阶段分别实现超9倍和15倍的加速。在原生百万亿量级交错数据的混合训练下,M3的语义空间高度融合,在SWE-Bench Pro等软件工程及多模态权威评测中超越GPT-5.5和Gemini3.1Pro。在极限任务实测中,M3展现出极强的长线程自主规划力,不仅历时12小时自主复现ICLR顶级论文实验,更在无参考代码下连续运行24小时、调用工具近两千次,将Hopper架构上的FP8矩阵乘硬件利用率从7.6%提升至71.3%,并在开放式PostTrainBench中自主调度模型完成“数据-训练-迭代”全流程。伴随M3发布,专为长程复杂协作设计的MiniMax Code智能体产品与极具价格竞争力的Token Plan及API服务也同步上线,并承诺在10天内开源模型权重。MiniMax M3的推出不仅打破了前沿多模态与长上下文技术由海外闭源模型垄断的格局,更以全要素开源的形式重塑了国内开发者生态的性价比边界。