谷歌每月支付 9.2 亿美元租用 SpaceX 算力以支持 Gemini agent 平台
谷歌与 SpaceX 达成协议,每月支付 9.2 亿美元租用 11 万块 NVIDIA GPU,租期从 2026 年 10 月至 2029 年 6 月,旨在支持 Gemini Enterprise 的 agent 平台需求。
每日精选 · 由编辑团队与 AI 协同摘要 · 仅作存档
据爆料 Anthropic 内部测试模型 Mythos 5 在代码优化任务中可实现最高 52 倍加速,且在 SVG 与前端生成领域表现强劲,但因成本过高公开版或被削弱。
谷歌与 SpaceX 达成协议,每月支付 9.2 亿美元租用 11 万块 NVIDIA GPU,租期从 2026 年 10 月至 2029 年 6 月,旨在支持 Gemini Enterprise 的 agent 平台需求。
OpenAI 计划将 ChatGPT 转型为集成编程工具与 AI agents 的超级应用,以提升高利润产品占比。目前企业客户贡献约 40% 营收,Codex 周活用户已超 500 万,旨在为今年 IPO 驱动增长。
Anthropic 披露 AI 正在加速自身开发,工程师代码产出达以往 8 倍,且 80% 以上代码由 Claude 编写。报告探讨了递归自我改进的路径,指出任务处理时长每 4 个月翻倍,并警示完全自主迭代模型带来的对齐风险。
Anthropic 或将发布新版 Mythos 模型,内部红队测试代号为 Oceanus。预计定价为 16 美元/百万 input tokens 和 80 美元/百万 output tokens,测试于 6 月 5 日启动。
谷歌发布 Gemma 4 QAT 模型版本,通过量化感知训练将 E2B 模型内存占用降低至 1 GB 以下,支持 Q4_0 及移动端专用量化格式,旨在提升手机与笔记本的本地运行效率。
谷歌发布 Gemma 4 12B 多模态模型,采用无编码器统一架构,仅需 16 GB 显存即可在笔记本本地运行,性能接近 26B MoE 模型并支持原生音频输入。
微软发布 MAI-Code-1-Flash 编程模型,在 SWE-bench Pro 上通过率达 51.2%,领先 Claude Haiku 4.5 达 16 个百分点,并能降低最高 60% 的 token 消耗。
微软发布推理模型 MAI-Thinking-1,采用 35B 激活参数的 MoE 架构,在 AIME 2026 上达到 94.5% 准确率,且在人类偏好盲测中优于 Claude Sonnet 4.6。
OpenAI 发布报告称 Codex 周活跃用户突破 500 万,自 2 月桌面版发布后增长 6 倍。知识工作者占比达 20% 且增长速度快于开发者的 3 倍,标志着 Codex 转型为通用生产力工具。
Anthropic 宣布扩大 Project Glasswing 规模至 150 家机构,利用 Claude Mythos Preview 漏洞扫描能力。该项目首批伙伴已发现逾 10,000 个高危漏洞,预计 6-12 个月内行业将迎来同类能力模型。
MiniMax 发布开源权重模型 MiniMax M3,采用全新的 MSA 稀疏注意力架构支持 1M tokens 上下文,在 SWE-Bench Pro 上达到 59.0% 评分,且原生支持多模态输入与电脑操作。
Anthropic 完成 650 亿美元 H 轮融资,投后估值达 9650 亿美元。公司年度经常性收入已突破 470 亿美元,并与 Amazon、Google 及 SpaceX 签署大规模算力协议以支持 Claude 扩展。
Claude Code 研究预览版发布动态工作流功能,支持实时编排并行子智能体处理大规模迁移等复杂任务,现已面向 Max、Team 及 Enterprise 计划开放。
Anthropic 发布 Claude Opus 4.8,增强了模型的诚实度与独立工作能力,且代码缺陷漏检率降低为前代的 4 倍。该版本维持 5 美元/百万 input token 的定价,并同步推出快速模式。