<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>LLM 日报</title>
    <link>https://archive.llmposts.com</link>
    <atom:link href="https://archive.llmposts.com/rss.xml" rel="self" type="application/rss+xml" />
    <description>大模型邮报 · 每日 AI 要闻汇总(摘要 + 原文链接,完整文章在官网)</description>
    <language>zh-Hans</language>
    <lastBuildDate>Fri, 15 May 2026 09:08:13 GMT</lastBuildDate>
    <item>
      <title><![CDATA[Gemini 3.2 Flash 将更名为 Gemini 3.5 Flash，内部参数已曝光]]></title>
      <link>https://llmposts.com/models/gemini-3-5-flash-leak/</link>
      <guid isPermaLink="true">https://llmposts.com/models/gemini-3-5-flash-leak/</guid>
      <pubDate>Fri, 15 May 2026 15:28:49 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[谷歌或推出重命名版 Gemini 3.5 Flash 模型，定价泄露至 0.25 美元每百万 token 且响应延迟传闻压至 200 毫秒内，性能逼近 Pro 级水平，预计 5 月前后亮相。]]></description>
    </item>
    <item>
      <title><![CDATA[Claude Code 部署模式的正确用法：分层配置与大代码库工作流]]></title>
      <link>https://llmposts.com/models/claude-code-deployment-patterns/</link>
      <guid isPermaLink="true">https://llmposts.com/models/claude-code-deployment-patterns/</guid>
      <pubDate>Fri, 15 May 2026 15:28:37 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[百万行 monorepo 环境中决定工具效率的关键并非基准跑分，而是工程配置层。掌握 CLAUDE.md 分层、Hooks 等技巧，构建稳定高效的 Claude Code 部署模式。]]></description>
    </item>
    <item>
      <title><![CDATA[OpenAI 确认 npm 供应链攻击事件，强制更新代码签名证书]]></title>
      <link>https://llmposts.com/models/openai-npm-supply-chain-attack-response/</link>
      <guid isPermaLink="true">https://llmposts.com/models/openai-npm-supply-chain-attack-response/</guid>
      <pubDate>Fri, 15 May 2026 14:06:47 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[OpenAI 供应链攻击事件曝光，TeamPCP 通过恶意 npm 包入侵两名员工设备。为阻断潜在恶意代码分发，官方强制 macOS 用户在 2026 年 6 月 12 日前完成应用更新，核心业务与客户数据未受影响。]]></description>
    </item>
    <item>
      <title><![CDATA[Anthropic 2028 AI 竞争报告: 中美算力优势与未来推演]]></title>
      <link>https://llmposts.com/industry/anthropic-2028-ai-leadership-report/</link>
      <guid isPermaLink="true">https://llmposts.com/industry/anthropic-2028-ai-leadership-report/</guid>
      <pubDate>Fri, 15 May 2026 11:14:17 GMT</pubDate>
      <category>行业观察</category>
      <description><![CDATA[Anthropic 发布 2028 AI 竞争报告, 提出民主国家领先与中国追平两种推演情景。报告指出 compute 是核心瓶颈, 建议收紧出口管制以锁定 12 至 24 个月优势。]]></description>
    </item>
    <item>
      <title><![CDATA[Codex 上线 ChatGPT 移动端：手机远程开发预览版开放]]></title>
      <link>https://llmposts.com/models/codex-chatgpt-mobile-remote-preview/</link>
      <guid isPermaLink="true">https://llmposts.com/models/codex-chatgpt-mobile-remote-preview/</guid>
      <pubDate>Fri, 15 May 2026 09:30:07 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[OpenAI 宣布 Codex 接入 ChatGPT 移动应用，iOS 与 Android 预览版已向所有套餐用户开放。支持远程 SSH 连接与实时状态同步，Windows 版手机连接支持即将推出。]]></description>
    </item>
    <item>
      <title><![CDATA[Kimi Web Bridge 浏览器扩展发布：支持 Claude Code 与 Cursor 本地网页自动化]]></title>
      <link>https://llmposts.com/models/kimi-web-bridge-browser-extension-2/</link>
      <guid isPermaLink="true">https://llmposts.com/models/kimi-web-bridge-browser-extension-2/</guid>
      <pubDate>Fri, 15 May 2026 00:27:03 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[Kimi Web Bridge 浏览器扩展发布，支持 Claude Code、Cursor、Codex 等 AI Agent 通过 Chrome DevTools Protocol 操控本地浏览器。据官方文档，该工具采用本地桥接架构，登录状态与网页内容不上传云端，适用于电商比价、批量表单填写等重复性网页操作。]]></description>
    </item>
    <item>
      <title><![CDATA[蚂蚁百灵开源 Ring-2.6-1T 万亿参数模型，主打 Agent 执行与深度推理]]></title>
      <link>https://llmposts.com/models/ring-2-6-1t-open-source/</link>
      <guid isPermaLink="true">https://llmposts.com/models/ring-2-6-1t-open-source/</guid>
      <pubDate>Thu, 14 May 2026 23:45:16 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[蚂蚁百灵开源 Ring-2.6-1T 万亿参数思考模型，采用 IcePop 异步强化学习算法。该模型在 PinchBench 与 SWE-Bench 等 benchmark 中表现突出，支持 high 与 xhigh 两种推理力度，面向复杂企业自动化与长程任务部署。]]></description>
    </item>
    <item>
      <title><![CDATA[Ramp 数据：Anthropic 企业采用率首超 OpenAI，达 34.4%]]></title>
      <link>https://llmposts.com/models/anthropic-business-adoption-overtakes-openai/</link>
      <guid isPermaLink="true">https://llmposts.com/models/anthropic-business-adoption-overtakes-openai/</guid>
      <pubDate>Thu, 14 May 2026 22:22:36 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[据 Ramp AI Index，Anthropic 企业采用率 4 月升至 34.4%，首次超过 OpenAI 的 32.3%。过去一年 Anthropic 企业采用率增长约 4 倍，但分析师指出其面临成本上涨与服务质量下滑三重逆风。]]></description>
    </item>
    <item>
      <title><![CDATA[Google I/O 或将发布 Gemini Spark Agent：曝 24/7 AI 助手支持学习用户行为]]></title>
      <link>https://llmposts.com/models/gemini-spark-agent-io-preview/</link>
      <guid isPermaLink="true">https://llmposts.com/models/gemini-spark-agent-io-preview/</guid>
      <pubDate>Thu, 14 May 2026 17:19:40 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[Google I/O 前夕，社交媒体爆料显示 Gemini Spark Agent 或将作为 24/7 AI 助手发布。据披露，该 Agent 支持从用户行为中学习，可调用 Connected Apps 与第三方服务集成。]]></description>
    </item>
    <item>
      <title><![CDATA[OpenAI Codex 企业推广：签约企业即送 2 个月免费额度]]></title>
      <link>https://llmposts.com/models/openai-codex-enterprise-promo/</link>
      <guid isPermaLink="true">https://llmposts.com/models/openai-codex-enterprise-promo/</guid>
      <pubDate>Thu, 14 May 2026 16:40:34 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[OpenAI 宣布针对计划切换的企业客户提供激励政策。签约即送 2 个月免费 OpenAI Codex 企业推广额度。活动持续至 6 月中旬，旨在与 Anthropic 争夺开发者市场。]]></description>
    </item>
    <item>
      <title><![CDATA[OpenAI 重构 Windows 平台 Codex 沙箱实现方案]]></title>
      <link>https://llmposts.com/models/codex-windows-sandbox-implementation/</link>
      <guid isPermaLink="true">https://llmposts.com/models/codex-windows-sandbox-implementation/</guid>
      <pubDate>Thu, 14 May 2026 16:16:29 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[OpenAI 详细公开了 Codex 编码智能体在 Windows 平台的沙箱实现路径。该方案历经非提权与提权架构迭代，通过合成 SID、受限 token 与专属防火墙规则，在保障系统隔离的同时保留了智能体对开发者环境的读写兼容性。]]></description>
    </item>
    <item>
      <title><![CDATA[Claude computer use 最佳实践：分辨率配置、思考深度与回放机制]]></title>
      <link>https://llmposts.com/models/claude-computer-use-best-practices/</link>
      <guid isPermaLink="true">https://llmposts.com/models/claude-computer-use-best-practices/</guid>
      <pubDate>Thu, 14 May 2026 13:57:31 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[Anthropic 正式公布 Claude computer use 最佳实践，明确 1280x720 默认配置与 3.75M 像素硬性上限，完整拆解点击精度对齐、自适应思考阈值调度及工作流录制回放架构。]]></description>
    </item>
    <item>
      <title><![CDATA[Claude 订阅计划将推 Agent SDK 专属月度额度]]></title>
      <link>https://llmposts.com/models/claude-agent-sdk-monthly-credit/</link>
      <guid isPermaLink="true">https://llmposts.com/models/claude-agent-sdk-monthly-credit/</guid>
      <pubDate>Thu, 14 May 2026 10:51:27 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[6 月 15 日起 Claude 订阅套餐将引入 Claude Agent SDK 月度额度，Pro 套餐 $20 起，隔离交互与程序化计费，规避自动化脚本抢占订阅限额。]]></description>
    </item>
    <item>
      <title><![CDATA[Claude Code 周限额临时提升 50% 至 7 月 13 日]]></title>
      <link>https://llmposts.com/models/claude-code-weekly-limits-increase/</link>
      <guid isPermaLink="true">https://llmposts.com/models/claude-code-weekly-limits-increase/</guid>
      <pubDate>Thu, 14 May 2026 10:22:15 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[Anthropic 宣布 Claude Code 周使用限额临时提升 50%，覆盖 Pro、Max、Team 及企业用户，有效期至 7 月 13 日，可与上周 2 倍时长上限叠加生效。]]></description>
    </item>
    <item>
      <title><![CDATA[Anthropic 收购 Stainless 或达 3 亿美元]]></title>
      <link>https://llmposts.com/models/anthropic-stainless-acquisition/</link>
      <guid isPermaLink="true">https://llmposts.com/models/anthropic-stainless-acquisition/</guid>
      <pubDate>Thu, 14 May 2026 01:14:13 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[Anthropic 收购 Stainless 的谈判被曝进入后期，The Information 称金额至少 3 亿美元；Stainless 为 OpenAI、谷歌和 Anthropic 提供 SDK、API 文档与 agent 接口。]]></description>
    </item>
    <item>
      <title><![CDATA[Anthropic 发布 20 余 Claude 法律插件与连接器]]></title>
      <link>https://llmposts.com/models/anthropic-claude-legal-connectors-plugins/</link>
      <guid isPermaLink="true">https://llmposts.com/models/anthropic-claude-legal-connectors-plugins/</guid>
      <pubDate>Wed, 13 May 2026 23:01:31 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[Anthropic 推出 20 余个 MCP 连接器与 12 个专业 Claude 法律插件，深度整合 Microsoft 办公套件及合同、研究等核心系统，底层依托 Opus 4.7 模型提升文书自动化处理效率。]]></description>
    </item>
    <item>
      <title><![CDATA[吴恩达驳 AI 失业论，预测 AI 就业繁荣即将来临]]></title>
      <link>https://llmposts.com/models/andrew-ng-jobapalooza-prediction/</link>
      <guid isPermaLink="true">https://llmposts.com/models/andrew-ng-jobapalooza-prediction/</guid>
      <pubDate>Wed, 13 May 2026 22:10:08 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[吴恩达 AI jobapalooza 预测指出现阶段美国失业率仅为 4.3%，反驳 AI 引发大规模失业的恐慌叙事。本文剖析前沿实验室夸大技术影响力的商业动机，并探讨劳动力市场转型路径。]]></description>
    </item>
    <item>
      <title><![CDATA[亚马逊 MeshClaw 工具 token 刷量现象引发争议]]></title>
      <link>https://llmposts.com/models/amazon-meshclaw-tool-token-pressure/</link>
      <guid isPermaLink="true">https://llmposts.com/models/amazon-meshclaw-tool-token-pressure/</guid>
      <pubDate>Wed, 13 May 2026 21:03:42 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[亚马逊部署内部 AI 智能体平台 MeshClaw 工具后，员工面临超 80% 开发者周使用目标与内部分数排行榜压力，出现为刷 token 量自动化非必要任务的现象。两千亿美元资本开支背景下，企业 AI 工具推广与安全权限治理面临行业共性挑战。]]></description>
    </item>
    <item>
      <title><![CDATA[Claude Opus 4.7 fast mode 开放预览]]></title>
      <link>https://llmposts.com/models/claude-opus-47-fast-mode/</link>
      <guid isPermaLink="true">https://llmposts.com/models/claude-opus-47-fast-mode/</guid>
      <pubDate>Wed, 13 May 2026 09:32:29 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[Claude Opus 4.7 fast mode 已在 API 与 Claude Code 开放 research preview，官方称速度为 2.5 倍，价格为输入 30 美元/MTok、输出 150 美元/MTok。]]></description>
    </item>
    <item>
      <title><![CDATA[Google 重构 AI 指针交互：Gemini 驱动与 Chrome 落地]]></title>
      <link>https://llmposts.com/models/ai-pointer-gemini-chrome/</link>
      <guid isPermaLink="true">https://llmposts.com/models/ai-pointer-gemini-chrome/</guid>
      <pubDate>Wed, 13 May 2026 01:52:41 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[Google 提出基于 Gemini 的 AI 指针交互新范式，通过深层意图理解实现跨应用无缝调用。该设计已集成至 Chrome 浏览器及新款 Googlebook 中，开启自然语音与指向结合的交互时代。]]></description>
    </item>
    <item>
      <title><![CDATA[Arena 最新榜单：Claude Opus 4.7 领跑五大前沿模型]]></title>
      <link>https://llmposts.com/models/arena-model-ranking-may-2026/</link>
      <guid isPermaLink="true">https://llmposts.com/models/arena-model-ranking-may-2026/</guid>
      <pubDate>Wed, 13 May 2026 00:20:34 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[Arena 模型排名显示五大主流前沿模型能力分化。Claude Opus 4.7 在主要评测类别占据榜首，Gemini 3.1 Pro 与 GPT-5.5 High 紧随其后，展现各厂商在推理与创意任务上的技术权衡。]]></description>
    </item>
    <item>
      <title><![CDATA[Interfaze 模型发布：融合 CNN 与 Transformer 的精度架构]]></title>
      <link>https://llmposts.com/models/interfaze-model-arch/</link>
      <guid isPermaLink="true">https://llmposts.com/models/interfaze-model-arch/</guid>
      <pubDate>Tue, 12 May 2026 22:33:07 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[Interfaze模型发布全新混合架构，融合CNN与Transformer。官方公布9项基准测试成绩，光学字符识别与结构化输出准确率领先同级闪省模型，定价为1.50美元每百万输入标记。]]></description>
    </item>
    <item>
      <title><![CDATA[OpenAI 警告未经授权股权交易]]></title>
      <link>https://llmposts.com/models/openai-unauthorized-equity-transactions/</link>
      <guid isPermaLink="true">https://llmposts.com/models/openai-unauthorized-equity-transactions/</guid>
      <pubDate>Tue, 12 May 2026 21:06:19 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[OpenAI 于 2026 年 5 月 12 日警告未经授权的 OpenAI 股权交易，称未获书面同意的直接或间接转让可能无效，并可能违反美国证券法。]]></description>
    </item>
    <item>
      <title><![CDATA[/Goal 模式的正确用法：明确目标、缩短反馈、记录过程]]></title>
      <link>https://llmposts.com/engineering/using-goals-effectively-in-codex-and-claude-code/</link>
      <guid isPermaLink="true">https://llmposts.com/engineering/using-goals-effectively-in-codex-and-claude-code/</guid>
      <pubDate>Tue, 12 May 2026 19:49:13 GMT</pubDate>
      <category>工程实践</category>
      <description><![CDATA[随着 Claude Code 和 Codex 相继支持 /Goal 模式，OpenAI 的 Chris Hayduk 分享了 3 个核心使用技巧：明确目标设定、缩短反馈循环，并通过 Markdown 文件记录过程，帮助 AI 智能体更稳定地完成持续迭代任务。]]></description>
    </item>
    <item>
      <title><![CDATA[vLLM 登顶 Artificial Analysis 榜单，开源推理栈反超专有栈]]></title>
      <link>https://llmposts.com/models/vllm-artificial-analysis-leaderboard-engine-optimization/</link>
      <guid isPermaLink="true">https://llmposts.com/models/vllm-artificial-analysis-leaderboard-engine-optimization/</guid>
      <pubDate>Tue, 12 May 2026 16:53:07 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[DigitalOcean 最新基准测试显示，vLLM 登顶 Artificial Analysis 推理排行榜，DeepSeek V3.2 输出吞吐达 230 TPS 且 Qwen 3.5 397B TTFT 低于 1 秒，多项内核优化已合入主线。]]></description>
    </item>
    <item>
      <title><![CDATA[OpenAI 发布 Daybreak：面向网络安全防御方的 AI 工具]]></title>
      <link>https://llmposts.com/engineering/openai-daybreak-cybersecurity-ai-agent/</link>
      <guid isPermaLink="true">https://llmposts.com/engineering/openai-daybreak-cybersecurity-ai-agent/</guid>
      <pubDate>Tue, 12 May 2026 15:16:50 GMT</pubDate>
      <category>工程实践</category>
      <description><![CDATA[OpenAI 发布 Daybreak，结合 OpenAI 模型与 Codex agentic harness，提供漏洞扫描、代码审查、威胁建模、补丁验证等能力，将在未来几周与合作伙伴部署更高网络安全能力的模型。]]></description>
    </item>
    <item>
      <title><![CDATA[Ilya Sutskever 持有 OpenAI 约 70 亿美元股份]]></title>
      <link>https://llmposts.com/industry/ilya-sutskever-openai-70-billion-stake-musk-trial/</link>
      <guid isPermaLink="true">https://llmposts.com/industry/ilya-sutskever-openai-70-billion-stake-musk-trial/</guid>
      <pubDate>Tue, 12 May 2026 14:20:53 GMT</pubDate>
      <category>行业观察</category>
      <description><![CDATA[在 Musk 诉 OpenAI 案的庭审中，Ilya Sutskever 披露持有 OpenAI 约 70 亿美元股份，Brockman 持股约 300 亿美元，Nadella 证词显示 Microsoft 已从 OpenAI 获得 95 亿美元收入。]]></description>
    </item>
    <item>
      <title><![CDATA[Claude Code 新增 /goal 命令 支持显式设定会话完成目标]]></title>
      <link>https://llmposts.com/engineering/claude-code-goal-command-agent-view/</link>
      <guid isPermaLink="true">https://llmposts.com/engineering/claude-code-goal-command-agent-view/</guid>
      <pubDate>Tue, 12 May 2026 11:09:44 GMT</pubDate>
      <category>工程实践</category>
      <description><![CDATA[Claude Code 2.1.139 新增 /goal 命令允许用户显式设定会话完成目标,支持 /goal [ | clear] 语法,配合 CLAUDE_CODE_MAX_TURNS 形成双重边界控制,同版本推出 Agent View 多会话面板。]]></description>
    </item>
    <item>
      <title><![CDATA[MiniCPM-V 4.6 1.3B 刷新 2B 以下开源权重得分]]></title>
      <link>https://llmposts.com/models/minicpm-v-4-6-1-3b/</link>
      <guid isPermaLink="true">https://llmposts.com/models/minicpm-v-4-6-1-3b/</guid>
      <pubDate>Tue, 12 May 2026 10:16:11 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[MiniCPM-V 4.6 1.3B 在 Artificial Analysis Intelligence Index 上得分 13，并以 5.4M 输出 token 完成评测，支持文本、图像与视频输入，采用 Apache 2.0 许可证。]]></description>
    </item>
    <item>
      <title><![CDATA[Claude Code 推出 agent view 管理并行会话]]></title>
      <link>https://llmposts.com/models/claude-code-agent-view/</link>
      <guid isPermaLink="true">https://llmposts.com/models/claude-code-agent-view/</guid>
      <pubDate>Tue, 12 May 2026 09:53:21 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[Anthropic 于 2026 年 5 月 11 日推出 Claude Code agent view，支持在 CLI 中集中管理并行会话，现以 Research Preview 向 Pro、Max、Team、Enterprise 和 Claude API 计划开放。]]></description>
    </item>
    <item>
      <title><![CDATA[Claude Platform on AWS 上线 支持 IAM 与统一账单]]></title>
      <link>https://llmposts.com/models/claude-platform-aws-ga/</link>
      <guid isPermaLink="true">https://llmposts.com/models/claude-platform-aws-ga/</guid>
      <pubDate>Tue, 12 May 2026 00:24:15 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[Claude Platform on AWS 于 2026 年 5 月 11 日正式可用，支持 AWS IAM、CloudTrail、统一账单和承诺用量抵扣，并开放 Opus 4.7、Sonnet 4.6、Haiku 4.5。]]></description>
    </item>
    <item>
      <title><![CDATA[Coding Agent Index 发布 编码智能体组合评测]]></title>
      <link>https://llmposts.com/models/coding-agent-index/</link>
      <guid isPermaLink="true">https://llmposts.com/models/coding-agent-index/</guid>
      <pubDate>Mon, 11 May 2026 23:59:13 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[Artificial Analysis 发布 Coding Agent Index，覆盖 3 个编码 agent benchmark；Opus 4.7 在 Cursor CLI 得分 61 领先，API 成本从每任务 0.07 美元到 2.26 美元不等。]]></description>
    </item>
    <item>
      <title><![CDATA[OpenRouter 推出 Pareto Code 编码路由]]></title>
      <link>https://llmposts.com/models/openrouter-pareto-code-router/</link>
      <guid isPermaLink="true">https://llmposts.com/models/openrouter-pareto-code-router/</guid>
      <pubDate>Mon, 11 May 2026 23:37:45 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[OpenRouter 推出 Pareto Code 编码路由，开发者可设置 0 到 1 的 min_coding_score，在 13 个代码模型中按能力门槛路由，最高支持 2,000,000 上下文。]]></description>
    </item>
    <item>
      <title><![CDATA[OpenAI Deployment Company 推出并收购 Tomoro]]></title>
      <link>https://llmposts.com/models/openai-deployment-company-tomoro/</link>
      <guid isPermaLink="true">https://llmposts.com/models/openai-deployment-company-tomoro/</guid>
      <pubDate>Mon, 11 May 2026 21:37:56 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[OpenAI Deployment Company 已由 OpenAI 官方推出，新公司将获得超过 40 亿美元初始投资，并在收购 Tomoro 后纳入约 150 名 FDE 与部署专家，面向企业部署 AI 系统。]]></description>
    </item>
    <item>
      <title><![CDATA[Codex Ultra-Fast 模式被曝提速 5 倍]]></title>
      <link>https://llmposts.com/models/codex-ultra-fast-mode/</link>
      <guid isPermaLink="true">https://llmposts.com/models/codex-ultra-fast-mode/</guid>
      <pubDate>Mon, 11 May 2026 20:55:39 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[Codex Ultra-Fast 模式被社区从 OpenAI Codex GitHub 提交中发现，随后相关内容被删除。提交描述称其面向延迟敏感工作，agentic code generation 最高可提速 5 倍，但 OpenAI 尚未官方确认。]]></description>
    </item>
    <item>
      <title><![CDATA[ChatGPT 曝 Codex 移动端控制功能]]></title>
      <link>https://llmposts.com/models/chatgpt-codex-mobile-control/</link>
      <guid isPermaLink="true">https://llmposts.com/models/chatgpt-codex-mobile-control/</guid>
      <pubDate>Mon, 11 May 2026 16:12:34 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[Codex 移动端控制被用户在 ChatGPT 应用内页面中发现，OpenAI 员工据报道指向周四发布窗口；硬件手机传闻仍缺乏确认，2027 年上半年量产说法仅来自分析师预测。]]></description>
    </item>
    <item>
      <title><![CDATA[OpenAI o1 急诊诊断超越医生]]></title>
      <link>https://llmposts.com/models/openai-o1-er-diagnosis/</link>
      <guid isPermaLink="true">https://llmposts.com/models/openai-o1-er-diagnosis/</guid>
      <pubDate>Mon, 11 May 2026 03:25:07 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[OpenAI o1 急诊诊断在 Science 报道的新研究中达到约 67% 精确或接近诊断率，高于医生约 50% 至 55%，但测试仅覆盖书面病例信息。]]></description>
    </item>
    <item>
      <title><![CDATA[Anthropic 用宪法文档降低 Claude 代理失准]]></title>
      <link>https://llmposts.com/research/anthropic-claude-agentic-misalignment/</link>
      <guid isPermaLink="true">https://llmposts.com/research/anthropic-claude-agentic-misalignment/</guid>
      <pubDate>Sun, 10 May 2026 11:19:48 GMT</pubDate>
      <category>研究前沿</category>
      <description><![CDATA[Anthropic 于 2026 年 5 月 9 日称，Claude 代理失准可通过宪法文档与对齐故事减少超过 3 倍，效果在 reinforcement learning 后仍保留，并可叠加常规 harmlessness training。]]></description>
    </item>
    <item>
      <title><![CDATA[Opus 4.7 提示词需重写：7 个修复法]]></title>
      <link>https://llmposts.com/engineering/opus-4-7-prompt-fixes/</link>
      <guid isPermaLink="true">https://llmposts.com/engineering/opus-4-7-prompt-fixes/</guid>
      <pubDate>Sun, 10 May 2026 07:56:53 GMT</pubDate>
      <category>工程实践</category>
      <description><![CDATA[据 God of Prompt 发帖，Opus 4.7 提示词需从 4.6 写法迁移。帖文称 Opus 4.7 在 SWE-bench 达到 87.6%，但旧提示词可能因字面执行更强而失效。]]></description>
    </item>
    <item>
      <title><![CDATA[Hermes Agent 排名登顶 OpenRouter 全球榜]]></title>
      <link>https://llmposts.com/engineering/hermes-agent-openrouter-ranking/</link>
      <guid isPermaLink="true">https://llmposts.com/engineering/hermes-agent-openrouter-ranking/</guid>
      <pubDate>Sun, 10 May 2026 05:49:00 GMT</pubDate>
      <category>工程实践</category>
      <description><![CDATA[Hermes Agent 排名升至 OpenRouter 全球 token 榜第 1，近 30 天使用量达 6.4T tokens，并在生产力、编码智能体、个人智能体与 CLI 智能体分类中均列第 1。]]></description>
    </item>
    <item>
      <title><![CDATA[微软 OpenAI 合作文件披露曾担忧转投 AWS]]></title>
      <link>https://llmposts.com/industry/microsoft-openai-azure-aws-court-docs/</link>
      <guid isPermaLink="true">https://llmposts.com/industry/microsoft-openai-azure-aws-court-docs/</guid>
      <pubDate>Sun, 10 May 2026 01:54:52 GMT</pubDate>
      <category>行业观察</category>
      <description><![CDATA[法庭文件披露微软 OpenAI 合作早期谈判：2017 年 OpenAI 曾提出约 3 亿美元 Azure 算力需求，微软内部担忧其转投 AWS，随后在 2019 年宣布 10 亿美元投资。]]></description>
    </item>
    <item>
      <title><![CDATA[Anthropic 融资估值被曝近 1 万亿美元]]></title>
      <link>https://llmposts.com/industry/anthropic-funding-valuation/</link>
      <guid isPermaLink="true">https://llmposts.com/industry/anthropic-funding-valuation/</guid>
      <pubDate>Sat, 09 May 2026 17:34:47 GMT</pubDate>
      <category>行业观察</category>
      <description><![CDATA[据 FT 报道，Anthropic 融资估值或按 9000 亿美元投前估值推进，最高筹集 500 亿美元。其年化收入预计很快超过 450 亿美元，较 2025 年底增长约 5 倍。]]></description>
    </item>
    <item>
      <title><![CDATA[ChatGPT 老是爱回复 ” 稳稳接住你 ” 是怎么回事？]]></title>
      <link>https://llmposts.com/industry/chatgpt-chinese-verbal-tic-mode-collapse/</link>
      <guid isPermaLink="true">https://llmposts.com/industry/chatgpt-chinese-verbal-tic-mode-collapse/</guid>
      <pubDate>Sat, 09 May 2026 16:38:00 GMT</pubDate>
      <category>行业观察</category>
      <description><![CDATA[ChatGPT 在中文对话中反复输出"我会稳稳地接住你"，已成中文互联网热梗。这一现象涉及后训练 mode collapse、英文语料翻译偏差与阿谀倾向三条成因，Claude 和 DeepSeek 新版本近期也出现类似表达。]]></description>
    </item>
    <item>
      <title><![CDATA[Amp CLI 全面重构（代号 Neo） 上下文满了自动压缩续接]]></title>
      <link>https://llmposts.com/engineering/amp-cli-neo-rebuild-auto-compaction/</link>
      <guid isPermaLink="true">https://llmposts.com/engineering/amp-cli-neo-rebuild-auto-compaction/</guid>
      <pubDate>Sat, 09 May 2026 15:00:00 GMT</pubDate>
      <category>工程实践</category>
      <description><![CDATA[Sourcegraph 完成 Amp CLI 重构（代号 Neo），上下文窗口达 90% 时自动压缩续接，取代手动切线，同步上线 Plugin API 与远程控制，CPU 占用降低 79%、内存降低 70%。]]></description>
    </item>
    <item>
      <title><![CDATA[Claude Sonnet 4.5 将于 5 月 15 日下架]]></title>
      <link>https://llmposts.com/models/claude-sonnet-4-5-deprecation-may-15-2026/</link>
      <guid isPermaLink="true">https://llmposts.com/models/claude-sonnet-4-5-deprecation-may-15-2026/</guid>
      <pubDate>Sat, 09 May 2026 12:46:00 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[Claude Sonnet 4.5 将于 2026 年 5 月 15 日从 Claude 模型选择器中下架，距 2025 年 9 月 29 日发布约 7.5 个月。API 端 claude-sonnet-4-5-20250929 保留至最少 9 月 29 日。]]></description>
    </item>
    <item>
      <title><![CDATA[Claude Mythos 时间跨度达 17 小时但超可靠范围]]></title>
      <link>https://llmposts.com/research/claude-mythos-time-horizon-17-hours/</link>
      <guid isPermaLink="true">https://llmposts.com/research/claude-mythos-time-horizon-17-hours/</guid>
      <pubDate>Sat, 09 May 2026 09:29:31 GMT</pubDate>
      <category>研究前沿</category>
      <description><![CDATA[METR 于 2026 年 5 月 8 日更新评测，Claude Mythos 时间跨度在 50% 成功率下测得 17 小时，但 16 小时以上结果已超出现有任务集可靠范围。]]></description>
    </item>
    <item>
      <title><![CDATA[OpenAI 详解 Codex 安全部署边界]]></title>
      <link>https://llmposts.com/engineering/openai-codex-safe-deployment/</link>
      <guid isPermaLink="true">https://llmposts.com/engineering/openai-codex-safe-deployment/</guid>
      <pubDate>Sat, 09 May 2026 06:04:31 GMT</pubDate>
      <category>工程实践</category>
      <description><![CDATA[OpenAI 披露 Codex 安全部署方案，覆盖沙箱、审批、网络策略、身份绑定与 OpenTelemetry。Codex 可导出用户 prompt、工具审批、执行结果、MCP 使用和网络代理事件等 5 类日志。]]></description>
    </item>
    <item>
      <title><![CDATA[Mozilla 用 Claude Mythos 做 Firefox 安全加固]]></title>
      <link>https://llmposts.com/engineering/claude-mythos-firefox-hardening/</link>
      <guid isPermaLink="true">https://llmposts.com/engineering/claude-mythos-firefox-hardening/</guid>
      <pubDate>Sat, 09 May 2026 05:56:39 GMT</pubDate>
      <category>工程实践</category>
      <description><![CDATA[Mozilla 披露 Firefox 安全加固流程，Claude Mythos Preview 在 Firefox 150 中识别 271 个漏洞修复；2026 年 4 月安全修复量升至 423 个。]]></description>
    </item>
    <item>
      <title><![CDATA[OpenAI 和 Anthropic 人均营收超科技巨头]]></title>
      <link>https://llmposts.com/industry/openai-anthropic-revenue-per-employee/</link>
      <guid isPermaLink="true">https://llmposts.com/industry/openai-anthropic-revenue-per-employee/</guid>
      <pubDate>Sat, 09 May 2026 05:02:00 GMT</pubDate>
      <category>行业观察</category>
      <description><![CDATA[OpenAI 和 Anthropic 人均营收据 Epoch AI 估算分别约为 550 万美元和 900 万美元，若上市将高于 Forbes Global 2000 中主要公开科技公司。]]></description>
    </item>
    <item>
      <title><![CDATA[文心 5.1 发布 预训练成本降至 6%]]></title>
      <link>https://llmposts.com/models/ernie-5-1-release/</link>
      <guid isPermaLink="true">https://llmposts.com/models/ernie-5-1-release/</guid>
      <pubDate>Sat, 09 May 2026 04:37:10 GMT</pubDate>
      <category>模型动态</category>
      <description><![CDATA[百度正式发布文心 5.1，总参数压缩至文心 5.0 约 1/3，激活参数降至约 1/2，预训练算力成本约为同规模模型的 6%，并以 1223 分位列 Arena 搜索榜全球第 4。]]></description>
    </item>
  </channel>
</rss>
