Qwen3.7-Max 发布:重构智能体长程自主执行
阿里云正式发布 Qwen3.7-Max 模型,面向智能体时代。该模型支持长周期自主执行,在 35 小时无中断任务中跨越千次工具调用,编程基准 SWE-Pro 达 60.6,即将通过阿里云百炼 API 上线。
本期 7 篇要闻 · 约 28 分钟阅读 · 覆盖 1 类
阿里云正式发布 Qwen3.7-Max 模型,面向智能体时代。该模型支持长周期自主执行,在 35 小时无中断任务中跨越千次工具调用,编程基准 SWE-Pro 达 60.6,即将通过阿里云百炼 API 上线。
Google 推出 Gemini App 重大升级,基于 Gemini 3.5 与 Antigravity Harness 构建 Gemini Spark 智能体,支持 7×24 小时云端常驻及多工具工作流自动化。该功能将于下周面向美国 Google AI Ultra 用户推送 Beta,反映云端长周期智能体在意图驱动自动化领域的工程演进。
Google 正式发布新一代多模态旗舰模型 Gemini Omni。首发变体 Gemini Omni Flash 登陆 Gemini app 与 Google Flow,主打自然语言视频编辑。该模型支持多模态输入生成视频,内置 SynthID 数字水印与可验证数字分身。
Google 发布新款 Flash 系列模型 Gemini 3.5 Flash,在 Intelligence Index 综合评测中斩获 55 分。该模型支持全模态输入与 1M tokens 上下文窗口,定价高达输入端 1.50 美元、输出端 9.00 美元,实际运行成本较上代增加 5.5 倍。
Google 发布 Gemini 3.5 Flash,基准测试在智能体任务上得分达 1656 Elo,推理速度为其他前沿模型 4 倍。该模型将作为 Gemini Spark 默认架构全面部署,并于 6 月中旬推出 Pro 版本。
据 Google 官方披露, Antigravity 2.0 独立桌面应用今日上线, 集成 CLI、SDK 与原生语音支持。演示中 93 个并行 Agent 12 小时内构建完整操作系统, API 成本低于 1000 美元, 标志着多智能体编排进入工程化阶段。
Google DeepMind 发布 Gemini 3.5 Flash 模型,在 coding 与 agentic 任务上超越 3.1 Pro,支持子代理并行处理大规模代码库,定价仅为竞品的一部分。已上线 Gemini App 与 Google AI Studio。