GLM-5.2 发布:支持 1M 上下文,专注长程编码任务且 MIT 开源
Z.ai 发布 GLM-5.2 旗舰模型,支持 1M tokens 上下文,并在 FrontierSWE 等长程编码评测中表现强劲,部分指标仅落后 Opus 4.8 1%。该模型采用 IndexShare 架构将计算量降低 2.9 倍,并以 MIT 协议开源。
每日精选 · 由编辑团队与 AI 协同摘要 · 仅作存档
OpenAI 招募 Transformer 架构共同作者 Noam Shazeer。他在 2000 年加入 Google 并共同撰写了奠基性论文,此前曾参与 27 亿美元的 Character.AI 交易。
Z.ai 发布 GLM-5.2 旗舰模型,支持 1M tokens 上下文,并在 FrontierSWE 等长程编码评测中表现强劲,部分指标仅落后 Opus 4.8 1%。该模型采用 IndexShare 架构将计算量降低 2.9 倍,并以 MIT 协议开源。
Anthropic 派遣安全团队前往 DC 沟通,但未能解除 Claude Fable 5 出口管制。美国政府与厂商就 Mythos 能力解锁风险存在分歧,目前该模型访问权限仍被禁用。
美国政府以国家安全为由要求暂停外国国民访问 Fable 5 与 Mythos 5。Anthropic 已于 2026 年 6 月 12 日禁用这两款模型的所有用户访问,但 GPT-5.5 等同类模型亦具备相关能力。
OpenAI 或于下周发布 GPT-5.6,据披露该版本在推理、代码及 agent 工作流方面有显著提升,性能可对标 Claude Fable 5 且定价或大幅下调。
Moonshot 发布开源代码模型 Kimi-K2.7-Code,总参数 1T,激活参数 32B。该模型在 Kimi Code Bench v2 提升 21.8%,且推理 token 消耗降低 30%,支持 256K 上下文。
Claude Fable 5 在 Arena.ai 的 Code Arena 和 Agent Arena 评测中均夺冠,综合排名提升 11.2%,确认任务成功率提升 18.2%,在前端开发和智能体任务上领先 Opus-4.8 和 GPT-5.5。
Anthropic 发布 Claude Fable 5,在软件工程与科学研究领域达到 SOTA 水平。该模型定价为 10 美元/百万输入 token,性能在 5000 万行代码迁移任务中表现出色。
据爆料 Anthropic 内部测试模型 Mythos 5 在代码优化任务中可实现最高 52 倍加速,且在 SVG 与前端生成领域表现强劲,但因成本过高公开版或被削弱。