LLM 日报 · 大模型邮报

今日号外 · TODAY'S COVER

Claude Opus 5 领跑 AA-Briefcase 评测，单任务成本降低 20%

Claude Opus 5 在 AA-Briefcase 评测中以 1720 Elo 夺冠，单次任务成本较 Claude Fable 5 降低 20% 至 17.79 美元，但在呈现质量上仍落后于 GPT-5.6 Sol。

1 篇要闻

4min 阅读时长

1 个类别

66 期累计

阅读今日 →

本周邮报 This Week

查看完整归档 →

2026 · 今天

7月25日周六

共 2 篇

Fable 5.1 或于 8 月发布, 定价维持不变以竞争 GPT-6

Fable 5.1 或将于 2026 年 8 月发布,定价预计与 Fable 5 相同。据爆料,该模型可能抢在 GPT-6 之前推出以形成直接竞争。

模型 / llmposts.com 阅读原文

Claude Opus 5 发布：代码能力达 SOTA，成本减半逼近 Fable 5

Anthropic 发布 Claude Opus 5，输入定价 5 美元/百万 token，在 Frontier-Bench 等代码评测中达到 SOTA，部分任务性能达 Opus 4.8 的 2 倍且成本更低。

模型 / llmposts.com 阅读原文

2026 · 2 天前

7月23日周四

共 1 篇

Anthropic 或将于今日发布 Claude Opus 5，性能预计与 Fable 5 持平

Anthropic 或于 2026 年 7 月 23 日发布旗舰模型 Claude Opus 5。据爆料，其 benchmark 性能将与 Fable 5 相当但不会超越，发布时间定于周四。

模型 / llmposts.com 阅读原文

2026 · 3 天前

7月22日周三

共 1 篇

Claude Cowork 发布教导技能功能:支持录屏口述转化为自动化工作流

Claude Cowork 发布教导技能功能,用户可通过录屏与口述让 AI 习得特定任务。该功能于 2026 年 7 月 22 日面向 Pro、Max 及 Team 计划用户开放。

模型 / llmposts.com 阅读原文

2026

7月16日周四

共 1 篇

月之暗面已正式推出 Kimi K3 模型, 参数量达 3T 挑战 Opus 4.8

月之暗面或将发布 Kimi K3 模型,参数量预计达 2T-3T,在主流 benchmark 上有望超越 Opus 4.8。该模型将以 open-weight 形式开放,融资估值目标约为 315 亿美元。

模型 / llmposts.com 阅读原文

2026

7月15日周三

共 2 篇

Kimi K3 或于明日发布, 被曝为对标 Opus 4.7 的编程模型

Kimi K3 模型或于 7 月 16 日发布,据爆料该模型对标 Opus 4.7 编程能力,在部分评测中优于 GPT 5.5 和 GPT 5.6 Terra,目前已在 Beta 站点上线。

模型 / llmposts.com 阅读原文

Claude Opus 5 或将于本周发布，Anthropic 计划于 8 月推出 Fable 5 继任者

据爆料，Anthropic 计划最快于 2026 年 7 月本周内发布 Claude Opus 5。此外，Fable 5 的订阅包含期限将至 7 月 19 日截止，其继任者预计在 8 月推出以竞争 GPT-6。

模型 / llmposts.com 阅读原文

2026

7月14日周二

共 1 篇

Claude Code Artifacts 支持公开分享与多人协作编辑

Claude Code Artifacts 于 2026 年 7 月 14 日更新,新增公开链接分享与多人实时编辑功能,且支持通过 Claude Tag 在 Slack 中直接构建内部页面。

模型 / llmposts.com 阅读原文

2026

7月10日周五

共 1 篇

Anthropic 发布 Claude 反思功能, 通过 4D 框架优化 AI 协作模式

Anthropic 发布 Claude 反思功能 Beta 版,支持回顾 1 到 12 个月的使用模式,并基于 4D AI 流畅度框架提供协作建议,旨在优化用户与 AI 的交互习惯。

模型 / llmposts.com 阅读原文