据 1M AI News 监测,MiniMax 发布 M2.7,称其为「第一个模型深度参与迭代自己的模型」。团队基于 M2 早期版本构建研究型 Agent 框架,让模型自主完成强化学习 Skill 构建、记忆更新和过程优化。在一项内部实验中,M2.7 自主运行超 100 轮迭代循环(分析失败轨迹、修改脚手架、运行评测、对比结果),最终在内部评测上效果提升 30%。在 MLE Bench Lite 的 22 个机器学习任务中,三次测试平均得牌率 66.6%,与 Gemini-3.1 持平,仅次于 Opus 4.6(75.7%)和 GPT-5.4(71.2%)。
编程方面,M2.7 在 SWE-Pro 得分 56.22%,追平 GPT-5.3-Codex;VIBE-Pro 55.6%,接近 Opus 4.6;Terminal Bench 2 得分 57.0%。MiniMax 称已多次将线上生产故障恢复时间缩短至三分钟以内。办公场景方面,GDPval-AA ELO 得分 1500,在 45 个模型中仅次于 Opus 4.6、Sonnet 4.6 和 GPT-5.4。OpenClaw 评测 MM-Claw 正确率 62.7%,接近 Sonnet 4.6,40 个复杂 Skill(>2000 Token)遵循率达 97%。
MiniMax 同时开源 Agent 交互系统 OpenRoom(github.com/MiniMax-AI/OpenRoom),将 AI 互动置入可视化 Web 空间。M2.7 已在 MiniMax Agent 和开放平台全量上线。