01
智谱发布 GLM-5.1-HighSpeed:400 tokens/s 刷新大模型速度上限
智谱发布 GLM-5.1-HighSpeed 速度表现达 400 tokens/s 的旗舰模型,采用自研 TileRT 推理引擎重构底层架构,在 8 块 H200 GPU 环境下实现极低首字延迟与生产级稳定输出。
本期 4 篇要闻 · 约 16 分钟阅读 · 覆盖 1 类
智谱发布 GLM-5.1-HighSpeed 速度表现达 400 tokens/s 的旗舰模型,采用自研 TileRT 推理引擎重构底层架构,在 8 块 H200 GPU 环境下实现极低首字延迟与生产级稳定输出。
Cloudflare 在营收创纪录背景下裁掉超 20% 员工,CEO 撰文详解 AI 正逐步替代内部测量岗位。此举不仅未缩减招聘规模,反而将资源集中于核心构建与销售人才。
Artificial Analysis 发布 Cursor Composer 2.5 评测报告,该模型在 Coding Agent Index 获 62 分位列第三,SWE-Bench 得分跃升 35 分,单任务成本仅 0.07 美元,显著低于 Opus 4.7 与 GPT-5.5 变体。
OpenAI 更新 Codex 电脑控制功能,锁定电脑使用支持 Mac 锁屏后远程操作桌面应用。内置授权插件与临时解锁窗口,提供输入监测与审批机制。