01
微软发布 MAI-Code-1-Flash 编程模型:性能超越 Claude Haiku 4.5 且更省 token
微软发布 MAI-Code-1-Flash 编程模型,在 SWE-bench Pro 上通过率达 51.2%,领先 Claude Haiku 4.5 达 16 个百分点,并能降低最高 60% 的 token 消耗。
本期 3 篇要闻 · 约 12 分钟阅读 · 覆盖 1 类
微软发布 MAI-Code-1-Flash 编程模型,在 SWE-bench Pro 上通过率达 51.2%,领先 Claude Haiku 4.5 达 16 个百分点,并能降低最高 60% 的 token 消耗。
微软发布推理模型 MAI-Thinking-1,采用 35B 激活参数的 MoE 架构,在 AIME 2026 上达到 94.5% 准确率,且在人类偏好盲测中优于 Claude Sonnet 4.6。
OpenAI 发布报告称 Codex 周活跃用户突破 500 万,自 2 月桌面版发布后增长 6 倍。知识工作者占比达 20% 且增长速度快于开发者的 3 倍,标志着 Codex 转型为通用生产力工具。