01
MiniMax 发布开源权重模型 M3: 引入 MSA 架构支持 1M 上下文与原生多模态
MiniMax 发布开源权重模型 MiniMax M3,采用全新的 MSA 稀疏注意力架构支持 1M tokens 上下文,在 SWE-Bench Pro 上达到 59.0% 评分,且原生支持多模态输入与电脑操作。
本期 1 篇要闻 · 约 4 分钟阅读 · 覆盖 1 类
MiniMax 发布开源权重模型 MiniMax M3,采用全新的 MSA 稀疏注意力架构支持 1M tokens 上下文,在 SWE-Bench Pro 上达到 59.0% 评分,且原生支持多模态输入与电脑操作。