VOL.26 · #12 · 2026 年 5 月 11 日 · 周一

5 月 11 日大模型邮报

本期 6 篇要闻 · 约 24 分钟阅读 · 覆盖 1 类

2026

5月11日周一

共 6 篇

Artificial Analysis 发布 Coding Agent Index，覆盖 3 个编码 agent benchmark；Opus 4.7 在 Cursor CLI 得分 61 领先，API 成本从每任务 0.07 美元到 2.26 美元不等。

模型 / llmposts.com 阅读原文

OpenRouter 推出 Pareto Code 编码路由，开发者可设置 0 到 1 的 min_coding_score，在 13 个代码模型中按能力门槛路由，最高支持 2,000,000 上下文。

模型 / llmposts.com 阅读原文

OpenAI Deployment Company 已由 OpenAI 官方推出，新公司将获得超过 40 亿美元初始投资，并在收购 Tomoro 后纳入约 150 名 FDE 与部署专家，面向企业部署 AI 系统。

模型 / llmposts.com 阅读原文

Codex Ultra-Fast 模式被社区从 OpenAI Codex GitHub 提交中发现，随后相关内容被删除。提交描述称其面向延迟敏感工作，agentic code generation 最高可提速 5 倍，但 OpenAI 尚未官方确认。

模型 / llmposts.com 阅读原文

Codex 移动端控制被用户在 ChatGPT 应用内页面中发现，OpenAI 员工据报道指向周四发布窗口；硬件手机传闻仍缺乏确认，2027 年上半年量产说法仅来自分析师预测。

模型 / llmposts.com 阅读原文

OpenAI o1 急诊诊断在 Science 报道的新研究中达到约 67% 精确或接近诊断率，高于医生约 50% 至 55%，但测试仅覆盖书面病例信息。

模型 / llmposts.com 阅读原文