模型自己迭代自己：MiniMax M2.7发布，编程接近Opus水平

据 1M AI News 监测，MiniMax 发布 M2.7，称其为「第一个模型深度参与迭代自己的模型」。团队基于 M2 早期版本构建研究型 Agent 框架，让模型自主完成强化学习 Skill 构建、记忆更新和过程优化。在一项内部实验中，M2.7 自主运行超 100 轮迭代循环（分析失败轨迹、修改脚手架、运行评测、对比结果），最终在内部评测上效果提升 30%。在 MLE Bench Lite 的 22 个机器学习任务中，三次测试平均得牌率 66.6%，与 Gemini-3.1 持平，仅次于 Opus 4.6（75.7%）和 GPT-5.4（71.2%）。

编程方面，M2.7 在 SWE-Pro 得分 56.22%，追平 GPT-5.3-Codex；VIBE-Pro 55.6%，接近 Opus 4.6；Terminal Bench 2 得分 57.0%。MiniMax 称已多次将线上生产故障恢复时间缩短至三分钟以内。办公场景方面，GDPval-AA ELO 得分 1500，在 45 个模型中仅次于 Opus 4.6、Sonnet 4.6 和 GPT-5.4。OpenClaw 评测 MM-Claw 正确率 62.7%，接近 Sonnet 4.6，40 个复杂 Skill（>2000 Token）遵循率达 97%。

MiniMax 同时开源 Agent 交互系统 OpenRoom（github.com/MiniMax-AI/OpenRoom），将 AI 互动置入可视化 Web 空间。M2.7 已在 MiniMax Agent 和开放平台全量上线。

原文链接

纠错/举报