OpenAI 或下周发布 GPT-5.6:性能对标 Claude Fable 5 并计划降价
OpenAI 或于下周发布 GPT-5.6,据披露该版本在推理、代码及 agent 工作流方面有显著提升,性能可对标 Claude Fable 5 且定价或大幅下调。
每日精选 · 由编辑团队与 AI 协同摘要 · 仅作存档
美国政府以国家安全为由要求暂停外国国民访问 Fable 5 与 Mythos 5。Anthropic 已于 2026 年 6 月 12 日禁用这两款模型的所有用户访问,但 GPT-5.5 等同类模型亦具备相关能力。
OpenAI 或于下周发布 GPT-5.6,据披露该版本在推理、代码及 agent 工作流方面有显著提升,性能可对标 Claude Fable 5 且定价或大幅下调。
Moonshot 发布开源代码模型 Kimi-K2.7-Code,总参数 1T,激活参数 32B。该模型在 Kimi Code Bench v2 提升 21.8%,且推理 token 消耗降低 30%,支持 256K 上下文。
Claude Fable 5 在 Arena.ai 的 Code Arena 和 Agent Arena 评测中均夺冠,综合排名提升 11.2%,确认任务成功率提升 18.2%,在前端开发和智能体任务上领先 Opus-4.8 和 GPT-5.5。
Anthropic 发布 Claude Fable 5,在软件工程与科学研究领域达到 SOTA 水平。该模型定价为 10 美元/百万输入 token,性能在 5000 万行代码迁移任务中表现出色。
据爆料 Anthropic 内部测试模型 Mythos 5 在代码优化任务中可实现最高 52 倍加速,且在 SVG 与前端生成领域表现强劲,但因成本过高公开版或被削弱。
谷歌与 SpaceX 达成协议,每月支付 9.2 亿美元租用 11 万块 NVIDIA GPU,租期从 2026 年 10 月至 2029 年 6 月,旨在支持 Gemini Enterprise 的 agent 平台需求。
OpenAI 计划将 ChatGPT 转型为集成编程工具与 AI agents 的超级应用,以提升高利润产品占比。目前企业客户贡献约 40% 营收,Codex 周活用户已超 500 万,旨在为今年 IPO 驱动增长。
Anthropic 披露 AI 正在加速自身开发,工程师代码产出达以往 8 倍,且 80% 以上代码由 Claude 编写。报告探讨了递归自我改进的路径,指出任务处理时长每 4 个月翻倍,并警示完全自主迭代模型带来的对齐风险。
Anthropic 或将发布新版 Mythos 模型,内部红队测试代号为 Oceanus。预计定价为 16 美元/百万 input tokens 和 80 美元/百万 output tokens,测试于 6 月 5 日启动。
谷歌发布 Gemma 4 QAT 模型版本,通过量化感知训练将 E2B 模型内存占用降低至 1 GB 以下,支持 Q4_0 及移动端专用量化格式,旨在提升手机与笔记本的本地运行效率。
谷歌发布 Gemma 4 12B 多模态模型,采用无编码器统一架构,仅需 16 GB 显存即可在笔记本本地运行,性能接近 26B MoE 模型并支持原生音频输入。