Grok Build CLI 早期测试开放:面向终端的全栈编码代理
xAI 正式推出 Grok Build CLI 编码代理,率先面向 SuperGrok Heavy 订阅用户开放内测。该终端工具支持计划审查、多子 agent 并行开发与无头模式接入,为开发者提供开箱即用的本地代码工作流。
阅读原文xAI 正式推出 Grok Build CLI 编码代理,率先面向 SuperGrok Heavy 订阅用户开放内测。该终端工具支持计划审查、多子 agent 并行开发与无头模式接入,为开发者提供开箱即用的本地代码工作流。
阅读原文据《金融时报》报道,Anthropic 已达成 300 亿美元融资协议,估值将达 9000 亿美元,年化收入预计突破 450 亿美元,三个月内实现估值近三倍跃升。
阅读原文谷歌或推出重命名版 Gemini 3.5 Flash 模型,定价泄露至 0.25 美元每百万 token 且响应延迟传闻压至 200 毫秒内,性能逼近 Pro 级水平,预计 5 月前后亮相。
阅读原文百万行 monorepo 环境中决定工具效率的关键并非基准跑分,而是工程配置层。掌握 CLAUDE.md 分层、Hooks 等技巧,构建稳定高效的 Claude Code 部署模式。
阅读原文OpenAI 供应链攻击事件曝光,TeamPCP 通过恶意 npm 包入侵两名员工设备。为阻断潜在恶意代码分发,官方强制 macOS 用户在 2026 年 6 月 12 日前完成应用更新,核心业务与客户数据未受影响。
阅读原文OpenAI 宣布 Codex 接入 ChatGPT 移动应用,iOS 与 Android 预览版已向所有套餐用户开放。支持远程 SSH 连接与实时状态同步,Windows 版手机连接支持即将推出。
阅读原文Kimi Web Bridge 浏览器扩展发布,支持 Claude Code、Cursor、Codex 等 AI Agent 通过 Chrome DevTools Protocol 操控本地浏览器。据官方文档,该工具采用本地桥接架构,登录状态与网页内容不上传云端,适用于电商比价、批量表单填写等重复性网页操作。
阅读原文Anthropic 发布 2028 AI 竞争报告, 提出民主国家领先与中国追平两种推演情景。报告指出 compute 是核心瓶颈, 建议收紧出口管制以锁定 12 至 24 个月优势。
阅读原文蚂蚁百灵开源 Ring-2.6-1T 万亿参数思考模型,采用 IcePop 异步强化学习算法。该模型在 PinchBench 与 SWE-Bench 等 benchmark 中表现突出,支持 high 与 xhigh 两种推理力度,面向复杂企业自动化与长程任务部署。
阅读原文据 Ramp AI Index,Anthropic 企业采用率 4 月升至 34.4%,首次超过 OpenAI 的 32.3%。过去一年 Anthropic 企业采用率增长约 4 倍,但分析师指出其面临成本上涨与服务质量下滑三重逆风。
阅读原文Google I/O 前夕,社交媒体爆料显示 Gemini Spark Agent 或将作为 24/7 AI 助手发布。据披露,该 Agent 支持从用户行为中学习,可调用 Connected Apps 与第三方服务集成。
阅读原文OpenAI 宣布针对计划切换的企业客户提供激励政策。签约即送 2 个月免费 OpenAI Codex 企业推广额度。活动持续至 6 月中旬,旨在与 Anthropic 争夺开发者市场。
阅读原文OpenAI 详细公开了 Codex 编码智能体在 Windows 平台的沙箱实现路径。该方案历经非提权与提权架构迭代,通过合成 SID、受限 token 与专属防火墙规则,在保障系统隔离的同时保留了智能体对开发者环境的读写兼容性。
阅读原文Anthropic 正式公布 Claude computer use 最佳实践,明确 1280x720 默认配置与 3.75M 像素硬性上限,完整拆解点击精度对齐、自适应思考阈值调度及工作流录制回放架构。
阅读原文6 月 15 日起 Claude 订阅套餐将引入 Claude Agent SDK 月度额度,Pro 套餐 $20 起,隔离交互与程序化计费,规避自动化脚本抢占订阅限额。
阅读原文Anthropic 宣布 Claude Code 周使用限额临时提升 50%,覆盖 Pro、Max、Team 及企业用户,有效期至 7 月 13 日,可与上周 2 倍时长上限叠加生效。
阅读原文Anthropic 收购 Stainless 的谈判被曝进入后期,The Information 称金额至少 3 亿美元;Stainless 为 OpenAI、谷歌和 Anthropic 提供 SDK、API 文档与 agent 接口。
阅读原文Anthropic 推出 20 余个 MCP 连接器与 12 个专业 Claude 法律插件,深度整合 Microsoft 办公套件及合同、研究等核心系统,底层依托 Opus 4.7 模型提升文书自动化处理效率。
阅读原文吴恩达 AI jobapalooza 预测指出现阶段美国失业率仅为 4.3%,反驳 AI 引发大规模失业的恐慌叙事。本文剖析前沿实验室夸大技术影响力的商业动机,并探讨劳动力市场转型路径。
阅读原文亚马逊部署内部 AI 智能体平台 MeshClaw 工具后,员工面临超 80% 开发者周使用目标与内部分数排行榜压力,出现为刷 token 量自动化非必要任务的现象。两千亿美元资本开支背景下,企业 AI 工具推广与安全权限治理面临行业共性挑战。
阅读原文Claude Opus 4.7 fast mode 已在 API 与 Claude Code 开放 research preview,官方称速度为 2.5 倍,价格为输入 30 美元/MTok、输出 150 美元/MTok。
阅读原文Google 提出基于 Gemini 的 AI 指针交互新范式,通过深层意图理解实现跨应用无缝调用。该设计已集成至 Chrome 浏览器及新款 Googlebook 中,开启自然语音与指向结合的交互时代。
阅读原文Arena 模型排名显示五大主流前沿模型能力分化。Claude Opus 4.7 在主要评测类别占据榜首,Gemini 3.1 Pro 与 GPT-5.5 High 紧随其后,展现各厂商在推理与创意任务上的技术权衡。
阅读原文Interfaze模型发布全新混合架构,融合CNN与Transformer。官方公布9项基准测试成绩,光学字符识别与结构化输出准确率领先同级闪省模型,定价为1.50美元每百万输入标记。
阅读原文DigitalOcean 最新基准测试显示,vLLM 登顶 Artificial Analysis 推理排行榜,DeepSeek V3.2 输出吞吐达 230 TPS 且 Qwen 3.5 397B TTFT 低于 1 秒,多项内核优化已合入主线。
阅读原文MiniCPM-V 4.6 1.3B 在 Artificial Analysis Intelligence Index 上得分 13,并以 5.4M 输出 token 完成评测,支持文本、图像与视频输入,采用 Apache 2.0 许可证。
阅读原文Anthropic 于 2026 年 5 月 11 日推出 Claude Code agent view,支持在 CLI 中集中管理并行会话,现以 Research Preview 向 Pro、Max、Team、Enterprise 和 Claude API 计划开放。
阅读原文Claude Platform on AWS 于 2026 年 5 月 11 日正式可用,支持 AWS IAM、CloudTrail、统一账单和承诺用量抵扣,并开放 Opus 4.7、Sonnet 4.6、Haiku 4.5。
阅读原文随着 Claude Code 和 Codex 相继支持 /Goal 模式,OpenAI 的 Chris Hayduk 分享了 3 个核心使用技巧:明确目标设定、缩短反馈循环,并通过 Markdown 文件记录过程,帮助 AI 智能体更稳定地完成持续迭代任务。
阅读原文OpenAI 发布 Daybreak,结合 OpenAI 模型与 Codex agentic harness,提供漏洞扫描、代码审查、威胁建模、补丁验证等能力,将在未来几周与合作伙伴部署更高网络安全能力的模型。
阅读原文Claude Code 2.1.139 新增 /goal 命令允许用户显式设定会话完成目标,支持 /goal [ | clear] 语法,配合 CLAUDE_CODE_MAX_TURNS 形成双重边界控制,同版本推出 Agent View 多会话面板。
阅读原文在 Musk 诉 OpenAI 案的庭审中,Ilya Sutskever 披露持有 OpenAI 约 70 亿美元股份,Brockman 持股约 300 亿美元,Nadella 证词显示 Microsoft 已从 OpenAI 获得 95 亿美元收入。
阅读原文Artificial Analysis 发布 Coding Agent Index,覆盖 3 个编码 agent benchmark;Opus 4.7 在 Cursor CLI 得分 61 领先,API 成本从每任务 0.07 美元到 2.26 美元不等。
阅读原文OpenRouter 推出 Pareto Code 编码路由,开发者可设置 0 到 1 的 min_coding_score,在 13 个代码模型中按能力门槛路由,最高支持 2,000,000 上下文。
阅读原文OpenAI Deployment Company 已由 OpenAI 官方推出,新公司将获得超过 40 亿美元初始投资,并在收购 Tomoro 后纳入约 150 名 FDE 与部署专家,面向企业部署 AI 系统。
阅读原文Codex Ultra-Fast 模式被社区从 OpenAI Codex GitHub 提交中发现,随后相关内容被删除。提交描述称其面向延迟敏感工作,agentic code generation 最高可提速 5 倍,但 OpenAI 尚未官方确认。
阅读原文Codex 移动端控制被用户在 ChatGPT 应用内页面中发现,OpenAI 员工据报道指向周四发布窗口;硬件手机传闻仍缺乏确认,2027 年上半年量产说法仅来自分析师预测。
阅读原文OpenAI o1 急诊诊断在 Science 报道的新研究中达到约 67% 精确或接近诊断率,高于医生约 50% 至 55%,但测试仅覆盖书面病例信息。
阅读原文Anthropic 于 2026 年 5 月 9 日称,Claude 代理失准可通过宪法文档与对齐故事减少超过 3 倍,效果在 reinforcement learning 后仍保留,并可叠加常规 harmlessness training。
阅读原文据 God of Prompt 发帖,Opus 4.7 提示词需从 4.6 写法迁移。帖文称 Opus 4.7 在 SWE-bench 达到 87.6%,但旧提示词可能因字面执行更强而失效。
阅读原文Hermes Agent 排名升至 OpenRouter 全球 token 榜第 1,近 30 天使用量达 6.4T tokens,并在生产力、编码智能体、个人智能体与 CLI 智能体分类中均列第 1。
阅读原文法庭文件披露微软 OpenAI 合作早期谈判:2017 年 OpenAI 曾提出约 3 亿美元 Azure 算力需求,微软内部担忧其转投 AWS,随后在 2019 年宣布 10 亿美元投资。
阅读原文Claude Sonnet 4.5 将于 2026 年 5 月 15 日从 Claude 模型选择器中下架,距 2025 年 9 月 29 日发布约 7.5 个月。API 端 claude-sonnet-4-5-20250929 保留至最少 9 月 29 日。
阅读原文百度正式发布文心 5.1,总参数压缩至文心 5.0 约 1/3,激活参数降至约 1/2,预训练算力成本约为同规模模型的 6%,并以 1223 分位列 Arena 搜索榜全球第 4。
阅读原文METR 于 2026 年 5 月 8 日更新评测,Claude Mythos 时间跨度在 50% 成功率下测得 17 小时,但 16 小时以上结果已超出现有任务集可靠范围。
阅读原文Sourcegraph 完成 Amp CLI 重构(代号 Neo),上下文窗口达 90% 时自动压缩续接,取代手动切线,同步上线 Plugin API 与远程控制,CPU 占用降低 79%、内存降低 70%。
阅读原文OpenAI 披露 Codex 安全部署方案,覆盖沙箱、审批、网络策略、身份绑定与 OpenTelemetry。Codex 可导出用户 prompt、工具审批、执行结果、MCP 使用和网络代理事件等 5 类日志。
阅读原文Mozilla 披露 Firefox 安全加固流程,Claude Mythos Preview 在 Firefox 150 中识别 271 个漏洞修复;2026 年 4 月安全修复量升至 423 个。
阅读原文据报道,Grok Build 桌面应用已在早期访问中出现,计划支持 macOS、Linux 与 Windows 3 个平台,并支持 MCP、插件和本地文件操作,发布时间仍未确认。
阅读原文Claude Code HTML 工作流强调用 HTML artifact 承载规格、评审和交互界面。Thariq 指出,超过 100 行的 Markdown 难读,HTML 虽慢 2-4 倍,但更利于共享与反馈。
阅读原文据 FT 报道,Anthropic 融资估值或按 9000 亿美元投前估值推进,最高筹集 500 亿美元。其年化收入预计很快超过 450 亿美元,较 2025 年底增长约 5 倍。
阅读原文ChatGPT 在中文对话中反复输出"我会稳稳地接住你",已成中文互联网热梗。这一现象涉及后训练 mode collapse、英文语料翻译偏差与阿谀倾向三条成因,Claude 和 DeepSeek 新版本近期也出现类似表达。
阅读原文OpenAI 和 Anthropic 人均营收据 Epoch AI 估算分别约为 550 万美元和 900 万美元,若上市将高于 Forbes Global 2000 中主要公开科技公司。
阅读原文