LLM·DAILY
RSS
为 2026 年 5 月 7 日 生成可分享海报
2026

57 周四

4
01

Scale Labs 发布 Refactoring Leaderboard

Scale Labs 发布 Refactoring Leaderboard,评测 AI coding agents 的复杂重构能力。SWE Atlas Refactoring 任务代码改动行数约为 SWE-Bench Pro 的 2 倍,文件编辑次数约为 1.7 倍。

阅读原文
01

Qwen 3.6 MTP 推理加速 2.5 倍

Qwen 3.6 MTP 推理加速已进入 llama.cpp PR 22673,作者在 M2 Max 96 GB 上报告 2.5 倍提速与 28 tok/s,并称 48 GB 级硬件可支持 262144 tokens 上下文。

阅读原文