【AI前沿】MiniMaxæ�¨å‡ºMiniMax M3模å�‹
1小时前MiniMax推出MiniMax M3模型国内AI独角兽 MiniMax 近日确认,其新一代大模型 MiniMax M3 已进入发布准备阶段,核心升级在于引入自研稀疏注意力架构 MiniMax Sparse Attention(MSA),通过“索引分支+稀疏分支”的两级结构重构注意力层级。 该架构在支持 100万(1M)tokens 超长上下文 的同时,将相较上一代 M2 在注意力计算上的时延,在 Prefill 阶段压缩至约原来的十分之一、在 Decode 阶段压缩至约原来的十五分之一,引发业内对其长上下文应用潜力的关注。2 来源MiniMax确认M3进入发布准备阶段2 来源架构层级重构:索引分支+稀疏分支的自研注意力2 来源支持100万token上下文,注意力延迟最高降至十五分之一1 来源M3在国内大模型竞争中的定位与潜在影响2 来源本内容由AI生成