VOL.26 · #33 · 2026 年 6 月 3 日 · 周三 · 4 天前

6 月 3 日大模型邮报

本期 3 篇要闻 · 约 12 分钟阅读 · 覆盖 1 类

2026 · 4 天前

6月3日周三

共 3 篇

微软发布 MAI-Code-1-Flash 编程模型,在 SWE-bench Pro 上通过率达 51.2%,领先 Claude Haiku 4.5 达 16 个百分点,并能降低最高 60% 的 token 消耗。

模型 / llmposts.com 阅读原文

微软发布推理模型 MAI-Thinking-1,采用 35B 激活参数的 MoE 架构,在 AIME 2026 上达到 94.5% 准确率,且在人类偏好盲测中优于 Claude Sonnet 4.6。

模型 / llmposts.com 阅读原文

OpenAI 发布报告称 Codex 周活跃用户突破 500 万，自 2 月桌面版发布后增长 6 倍。知识工作者占比达 20% 且增长速度快于开发者的 3 倍，标志着 Codex 转型为通用生产力工具。

模型 / llmposts.com 阅读原文