01
Coding Agent Index 发布 编码智能体组合评测
Artificial Analysis 发布 Coding Agent Index,覆盖 3 个编码 agent benchmark;Opus 4.7 在 Cursor CLI 得分 61 领先,API 成本从每任务 0.07 美元到 2.26 美元不等。
阅读原文Artificial Analysis 发布 Coding Agent Index,覆盖 3 个编码 agent benchmark;Opus 4.7 在 Cursor CLI 得分 61 领先,API 成本从每任务 0.07 美元到 2.26 美元不等。
阅读原文OpenRouter 推出 Pareto Code 编码路由,开发者可设置 0 到 1 的 min_coding_score,在 13 个代码模型中按能力门槛路由,最高支持 2,000,000 上下文。
阅读原文OpenAI Deployment Company 已由 OpenAI 官方推出,新公司将获得超过 40 亿美元初始投资,并在收购 Tomoro 后纳入约 150 名 FDE 与部署专家,面向企业部署 AI 系统。
阅读原文Codex Ultra-Fast 模式被社区从 OpenAI Codex GitHub 提交中发现,随后相关内容被删除。提交描述称其面向延迟敏感工作,agentic code generation 最高可提速 5 倍,但 OpenAI 尚未官方确认。
阅读原文Codex 移动端控制被用户在 ChatGPT 应用内页面中发现,OpenAI 员工据报道指向周四发布窗口;硬件手机传闻仍缺乏确认,2027 年上半年量产说法仅来自分析师预测。
阅读原文OpenAI o1 急诊诊断在 Science 报道的新研究中达到约 67% 精确或接近诊断率,高于医生约 50% 至 55%,但测试仅覆盖书面病例信息。
阅读原文