研究：AGENTS.md文件可使AI编程Agent运行时间缩短29%、输出token减少17%

据 1M AI News 消息，新加坡管理大学、海德堡大学、班贝格大学和伦敦国王学院的研究团队在 arXiv 发表论文，首次量化评估了仓库级配置文件 AGENTS.md 对 AI 编程 Agent 效率的影响。AGENTS.md 是一种存放在代码仓库根目录的指令文件，用于向 AI Agent 说明项目架构、构建命令、编码规范和操作约束，类似于 Anthropic Claude Code 的 CLAUDE.md 和 GitHub Copilot 的 copilot-instructions.md，目前已被超过 6 万个 GitHub 仓库采用。

研究团队在 10 个仓库的 124 个已合并 PR（代码改动均不超过 100 行）上使用 OpenAI Codex（gpt-5.2-codex）进行配对实验，分别在有和无 AGENTS.md 两种条件下运行。结果显示，存在 AGENTS.md 时中位数运行时间从 98.57 秒降至 70.34 秒（降幅 28.64%），中位数输出 token 从 2,925 降至 2,440（降幅 16.58%），任务完成行为无显著差异（Wilcoxon signed-rank test, p < 0.05）。

研究者指出，AGENTS.md 将 Agent 指导从「短暂的提示词」转变为「版本控制、可审查、协作维护的配置工件」，建议开发团队将其作为标准实践纳入仓库。局限性方面，该研究仅测试了 OpenAI Codex 单一 Agent，样本限于小规模 PR，且未进行全面的代码正确性评估。

AI 解读

这项研究从工程实践的角度看，是一个相当有价值的量化验证。它证实了通过提供结构化、版本化的上下文配置来引导AI编程Agent，能显著提升其执行效率，这完全符合我们对系统优化方向的预期。

AGENTS.md这类文件本质上是一种工程化的提示词管理方案。它将原本可能零散、临时、易变的提示词，转变为一个可维护、可协作、可版本控制的工程构件。这步转变至关重要，尤其是在企业级或大型开源项目中，它确保了AI Agent行为的一致性和可预测性，减少了因上下文模糊或缺失导致的无效计算和冗余输出。

研究数据显示的运行时间和输出token的下降，直接转化为了更低的计算成本和更快的反馈循环，这对开发体验和项目成本都是实质性的改善。它证明了在追求更强模型能力的同时，优化人机交互的接口和上下文供给方式，是提升整体系统效能的另一个关键杠杆。

当然，研究的局限性也指出了一个事实：这种优化策略的有效性可能因模型、任务复杂度和代码质量评估标准的不同而有所差异。但这并不削弱其核心价值——它为我们提供了一种简单、可落地的最佳实践，将提示工程从一种“艺术”更向“工程” discipline 推进了一步。

展开

原文链接

纠错/举报