Gemma 4 推出 MTP drafter 推理加速最高 3 倍
Google 官方发布 Gemma 4 MTP drafter 推理加速方案,基于推测解码架构最高实现 3 倍提速。模型权重沿用 Apache 2.0 协议开源,无缝衔接主流本地部署框架,输出质量无损。
阅读原文Google 官方发布 Gemma 4 MTP drafter 推理加速方案,基于推测解码架构最高实现 3 倍提速。模型权重沿用 Apache 2.0 协议开源,无缝衔接主流本地部署框架,输出质量无损。
阅读原文OpenAI 推送 GPT-5.5 Instant 模型,API 标识为 gpt-5.5-chat-latest。该模型在医学、法律等场景的事实性显著提升,并新增基于聊天记录与 Gmail 的个性化记忆功能,将在两天内覆盖所有 ChatGPT 用户。
阅读原文据泄露信息,Gemini 3.2 Flash 预期发布或于 2026 年 5 月 Google I/O 大会前后,定价输入 0.25 美元/百万 token,输出 2.00 美元,定位平衡速度与推理能力。
阅读原文Peanut 图像生成模型于 5 月 4 日在 Artificial Analysis 专业横评中公开亮相,与 MAI-Image-2、grok-imagine-image 及 FLUX.2 [dev] Turbo 并列测试,涵盖 5 组复杂提示词。
阅读原文TestingCatalog 代码分析指出,Anthropic 正开发 Orbit 助手,深度集成 Gmail、GitHub、Figma 等六款连接器至 Claude Cowork,该功能或将于 5 月 6 日开发者大会前后正式发布。
阅读原文Google Gemini 应用设计泄露流出,iOS 采用 Liquid Glass 透明面板,Android 采用 Material 3 Expressive。界面布局向 ChatGPT 靠拢,预计配合 5 月 19 日至 20 日 Google I/O 大会推进 Agent 化战略,重塑移动 AI 交互入口。
阅读原文Manus 上线连接器推荐功能,在对话流程中自动识别任务所需的第三方服务。用户确认后即可启用授权,免除手动跳转设置的门槛,现已覆盖桌面端与移动端全场景任务。
阅读原文TickerTrends 数据显示 OpenAI Codex 下载量一周激增 1397% 至 8610 万次,于 4 月 30 日版本更新后迅速超越 Anthropic Claude Code 720 万下载,开发者工具生态出现明显转向。
阅读原文据工程师团队公开的技术文档,OpenAI WebRTC 架构优化方案直面 9 亿每周活跃用户规模。团队采用中继与收发器分离设计适配 Kubernetes,将公网 UDP 暴露面压缩至固定小范围,在保持标准协议兼容的同时实现全球低延迟首跳。
阅读原文TinyFish 推出免费 Agent API Search 与 Fetch 工具,p50 延迟低于 0.5 秒,支持 MCP 与多框架集成,对标 Firecrawl 抢占智能体基础设施层。
阅读原文OpenAI 将 GPT-5.5 定价较 GPT-5.4 翻倍,OpenRouter 实测显示实际使用成本增幅达 49%至 92%。长提示词场景因生成缩短存在部分抵消。
阅读原文