OpenAI 确认 npm 供应链攻击事件,强制更新代码签名证书
OpenAI 供应链攻击事件曝光,TeamPCP 通过恶意 npm 包入侵两名员工设备。为阻断潜在恶意代码分发,官方强制 macOS 用户在 2026 年 6 月 12 日前完成应用更新,核心业务与客户数据未受影响。
阅读原文OpenAI 供应链攻击事件曝光,TeamPCP 通过恶意 npm 包入侵两名员工设备。为阻断潜在恶意代码分发,官方强制 macOS 用户在 2026 年 6 月 12 日前完成应用更新,核心业务与客户数据未受影响。
阅读原文OpenAI 宣布 Codex 接入 ChatGPT 移动应用,iOS 与 Android 预览版已向所有套餐用户开放。支持远程 SSH 连接与实时状态同步,Windows 版手机连接支持即将推出。
阅读原文Kimi Web Bridge 浏览器扩展发布,支持 Claude Code、Cursor、Codex 等 AI Agent 通过 Chrome DevTools Protocol 操控本地浏览器。据官方文档,该工具采用本地桥接架构,登录状态与网页内容不上传云端,适用于电商比价、批量表单填写等重复性网页操作。
阅读原文Anthropic 发布 2028 AI 竞争报告, 提出民主国家领先与中国追平两种推演情景。报告指出 compute 是核心瓶颈, 建议收紧出口管制以锁定 12 至 24 个月优势。
阅读原文蚂蚁百灵开源 Ring-2.6-1T 万亿参数思考模型,采用 IcePop 异步强化学习算法。该模型在 PinchBench 与 SWE-Bench 等 benchmark 中表现突出,支持 high 与 xhigh 两种推理力度,面向复杂企业自动化与长程任务部署。
阅读原文据 Ramp AI Index,Anthropic 企业采用率 4 月升至 34.4%,首次超过 OpenAI 的 32.3%。过去一年 Anthropic 企业采用率增长约 4 倍,但分析师指出其面临成本上涨与服务质量下滑三重逆风。
阅读原文Google I/O 前夕,社交媒体爆料显示 Gemini Spark Agent 或将作为 24/7 AI 助手发布。据披露,该 Agent 支持从用户行为中学习,可调用 Connected Apps 与第三方服务集成。
阅读原文OpenAI 宣布针对计划切换的企业客户提供激励政策。签约即送 2 个月免费 OpenAI Codex 企业推广额度。活动持续至 6 月中旬,旨在与 Anthropic 争夺开发者市场。
阅读原文OpenAI 详细公开了 Codex 编码智能体在 Windows 平台的沙箱实现路径。该方案历经非提权与提权架构迭代,通过合成 SID、受限 token 与专属防火墙规则,在保障系统隔离的同时保留了智能体对开发者环境的读写兼容性。
阅读原文Anthropic 正式公布 Claude computer use 最佳实践,明确 1280x720 默认配置与 3.75M 像素硬性上限,完整拆解点击精度对齐、自适应思考阈值调度及工作流录制回放架构。
阅读原文6 月 15 日起 Claude 订阅套餐将引入 Claude Agent SDK 月度额度,Pro 套餐 $20 起,隔离交互与程序化计费,规避自动化脚本抢占订阅限额。
阅读原文Anthropic 宣布 Claude Code 周使用限额临时提升 50%,覆盖 Pro、Max、Team 及企业用户,有效期至 7 月 13 日,可与上周 2 倍时长上限叠加生效。
阅读原文Anthropic 收购 Stainless 的谈判被曝进入后期,The Information 称金额至少 3 亿美元;Stainless 为 OpenAI、谷歌和 Anthropic 提供 SDK、API 文档与 agent 接口。
阅读原文Anthropic 推出 20 余个 MCP 连接器与 12 个专业 Claude 法律插件,深度整合 Microsoft 办公套件及合同、研究等核心系统,底层依托 Opus 4.7 模型提升文书自动化处理效率。
阅读原文吴恩达 AI jobapalooza 预测指出现阶段美国失业率仅为 4.3%,反驳 AI 引发大规模失业的恐慌叙事。本文剖析前沿实验室夸大技术影响力的商业动机,并探讨劳动力市场转型路径。
阅读原文亚马逊部署内部 AI 智能体平台 MeshClaw 工具后,员工面临超 80% 开发者周使用目标与内部分数排行榜压力,出现为刷 token 量自动化非必要任务的现象。两千亿美元资本开支背景下,企业 AI 工具推广与安全权限治理面临行业共性挑战。
阅读原文Claude Opus 4.7 fast mode 已在 API 与 Claude Code 开放 research preview,官方称速度为 2.5 倍,价格为输入 30 美元/MTok、输出 150 美元/MTok。
阅读原文Google 提出基于 Gemini 的 AI 指针交互新范式,通过深层意图理解实现跨应用无缝调用。该设计已集成至 Chrome 浏览器及新款 Googlebook 中,开启自然语音与指向结合的交互时代。
阅读原文Arena 模型排名显示五大主流前沿模型能力分化。Claude Opus 4.7 在主要评测类别占据榜首,Gemini 3.1 Pro 与 GPT-5.5 High 紧随其后,展现各厂商在推理与创意任务上的技术权衡。
阅读原文Interfaze模型发布全新混合架构,融合CNN与Transformer。官方公布9项基准测试成绩,光学字符识别与结构化输出准确率领先同级闪省模型,定价为1.50美元每百万输入标记。
阅读原文DigitalOcean 最新基准测试显示,vLLM 登顶 Artificial Analysis 推理排行榜,DeepSeek V3.2 输出吞吐达 230 TPS 且 Qwen 3.5 397B TTFT 低于 1 秒,多项内核优化已合入主线。
阅读原文MiniCPM-V 4.6 1.3B 在 Artificial Analysis Intelligence Index 上得分 13,并以 5.4M 输出 token 完成评测,支持文本、图像与视频输入,采用 Apache 2.0 许可证。
阅读原文Anthropic 于 2026 年 5 月 11 日推出 Claude Code agent view,支持在 CLI 中集中管理并行会话,现以 Research Preview 向 Pro、Max、Team、Enterprise 和 Claude API 计划开放。
阅读原文Claude Platform on AWS 于 2026 年 5 月 11 日正式可用,支持 AWS IAM、CloudTrail、统一账单和承诺用量抵扣,并开放 Opus 4.7、Sonnet 4.6、Haiku 4.5。
阅读原文随着 Claude Code 和 Codex 相继支持 /Goal 模式,OpenAI 的 Chris Hayduk 分享了 3 个核心使用技巧:明确目标设定、缩短反馈循环,并通过 Markdown 文件记录过程,帮助 AI 智能体更稳定地完成持续迭代任务。
阅读原文OpenAI 发布 Daybreak,结合 OpenAI 模型与 Codex agentic harness,提供漏洞扫描、代码审查、威胁建模、补丁验证等能力,将在未来几周与合作伙伴部署更高网络安全能力的模型。
阅读原文Claude Code 2.1.139 新增 /goal 命令允许用户显式设定会话完成目标,支持 /goal [ | clear] 语法,配合 CLAUDE_CODE_MAX_TURNS 形成双重边界控制,同版本推出 Agent View 多会话面板。
阅读原文在 Musk 诉 OpenAI 案的庭审中,Ilya Sutskever 披露持有 OpenAI 约 70 亿美元股份,Brockman 持股约 300 亿美元,Nadella 证词显示 Microsoft 已从 OpenAI 获得 95 亿美元收入。
阅读原文Artificial Analysis 发布 Coding Agent Index,覆盖 3 个编码 agent benchmark;Opus 4.7 在 Cursor CLI 得分 61 领先,API 成本从每任务 0.07 美元到 2.26 美元不等。
阅读原文OpenRouter 推出 Pareto Code 编码路由,开发者可设置 0 到 1 的 min_coding_score,在 13 个代码模型中按能力门槛路由,最高支持 2,000,000 上下文。
阅读原文OpenAI Deployment Company 已由 OpenAI 官方推出,新公司将获得超过 40 亿美元初始投资,并在收购 Tomoro 后纳入约 150 名 FDE 与部署专家,面向企业部署 AI 系统。
阅读原文Codex Ultra-Fast 模式被社区从 OpenAI Codex GitHub 提交中发现,随后相关内容被删除。提交描述称其面向延迟敏感工作,agentic code generation 最高可提速 5 倍,但 OpenAI 尚未官方确认。
阅读原文Codex 移动端控制被用户在 ChatGPT 应用内页面中发现,OpenAI 员工据报道指向周四发布窗口;硬件手机传闻仍缺乏确认,2027 年上半年量产说法仅来自分析师预测。
阅读原文OpenAI o1 急诊诊断在 Science 报道的新研究中达到约 67% 精确或接近诊断率,高于医生约 50% 至 55%,但测试仅覆盖书面病例信息。
阅读原文Anthropic 于 2026 年 5 月 9 日称,Claude 代理失准可通过宪法文档与对齐故事减少超过 3 倍,效果在 reinforcement learning 后仍保留,并可叠加常规 harmlessness training。
阅读原文据 God of Prompt 发帖,Opus 4.7 提示词需从 4.6 写法迁移。帖文称 Opus 4.7 在 SWE-bench 达到 87.6%,但旧提示词可能因字面执行更强而失效。
阅读原文Hermes Agent 排名升至 OpenRouter 全球 token 榜第 1,近 30 天使用量达 6.4T tokens,并在生产力、编码智能体、个人智能体与 CLI 智能体分类中均列第 1。
阅读原文法庭文件披露微软 OpenAI 合作早期谈判:2017 年 OpenAI 曾提出约 3 亿美元 Azure 算力需求,微软内部担忧其转投 AWS,随后在 2019 年宣布 10 亿美元投资。
阅读原文Claude Sonnet 4.5 将于 2026 年 5 月 15 日从 Claude 模型选择器中下架,距 2025 年 9 月 29 日发布约 7.5 个月。API 端 claude-sonnet-4-5-20250929 保留至最少 9 月 29 日。
阅读原文百度正式发布文心 5.1,总参数压缩至文心 5.0 约 1/3,激活参数降至约 1/2,预训练算力成本约为同规模模型的 6%,并以 1223 分位列 Arena 搜索榜全球第 4。
阅读原文METR 于 2026 年 5 月 8 日更新评测,Claude Mythos 时间跨度在 50% 成功率下测得 17 小时,但 16 小时以上结果已超出现有任务集可靠范围。
阅读原文Sourcegraph 完成 Amp CLI 重构(代号 Neo),上下文窗口达 90% 时自动压缩续接,取代手动切线,同步上线 Plugin API 与远程控制,CPU 占用降低 79%、内存降低 70%。
阅读原文OpenAI 披露 Codex 安全部署方案,覆盖沙箱、审批、网络策略、身份绑定与 OpenTelemetry。Codex 可导出用户 prompt、工具审批、执行结果、MCP 使用和网络代理事件等 5 类日志。
阅读原文Mozilla 披露 Firefox 安全加固流程,Claude Mythos Preview 在 Firefox 150 中识别 271 个漏洞修复;2026 年 4 月安全修复量升至 423 个。
阅读原文据报道,Grok Build 桌面应用已在早期访问中出现,计划支持 macOS、Linux 与 Windows 3 个平台,并支持 MCP、插件和本地文件操作,发布时间仍未确认。
阅读原文Claude Code HTML 工作流强调用 HTML artifact 承载规格、评审和交互界面。Thariq 指出,超过 100 行的 Markdown 难读,HTML 虽慢 2-4 倍,但更利于共享与反馈。
阅读原文据 FT 报道,Anthropic 融资估值或按 9000 亿美元投前估值推进,最高筹集 500 亿美元。其年化收入预计很快超过 450 亿美元,较 2025 年底增长约 5 倍。
阅读原文ChatGPT 在中文对话中反复输出"我会稳稳地接住你",已成中文互联网热梗。这一现象涉及后训练 mode collapse、英文语料翻译偏差与阿谀倾向三条成因,Claude 和 DeepSeek 新版本近期也出现类似表达。
阅读原文OpenAI 和 Anthropic 人均营收据 Epoch AI 估算分别约为 550 万美元和 900 万美元,若上市将高于 Forbes Global 2000 中主要公开科技公司。
阅读原文