header-langage
简体中文
繁體中文
English
Tiếng Việt
한국어
日本語
ภาษาไทย
Türkçe
扫码下载APP

研究:AGENTS.md文件可使AI编程Agent运行时间缩短29%、输出token减少17%

据 1M AI News 消息,新加坡管理大学、海德堡大学、班贝格大学和伦敦国王学院的研究团队在 arXiv 发表论文,首次量化评估了仓库级配置文件 AGENTS.md 对 AI 编程 Agent 效率的影响。AGENTS.md 是一种存放在代码仓库根目录的指令文件,用于向 AI Agent 说明项目架构、构建命令、编码规范和操作约束,类似于 Anthropic Claude Code 的 CLAUDE.md 和 GitHub Copilot 的 copilot-instructions.md,目前已被超过 6 万个 GitHub 仓库采用。


研究团队在 10 个仓库的 124 个已合并 PR(代码改动均不超过 100 行)上使用 OpenAI Codex(gpt-5.2-codex)进行配对实验,分别在有和无 AGENTS.md 两种条件下运行。结果显示,存在 AGENTS.md 时中位数运行时间从 98.57 秒降至 70.34 秒(降幅 28.64%),中位数输出 token 从 2,925 降至 2,440(降幅 16.58%),任务完成行为无显著差异(Wilcoxon signed-rank test, p < 0.05)。


研究者指出,AGENTS.md 将 Agent 指导从「短暂的提示词」转变为「版本控制、可审查、协作维护的配置工件」,建议开发团队将其作为标准实践纳入仓库。局限性方面,该研究仅测试了 OpenAI Codex 单一 Agent,样本限于小规模 PR,且未进行全面的代码正确性评估。

AI 解读
这项研究从工程实践的角度看,是一个相当有价值的量化验证。它证实了通过提供结构化、版本化的上下文配置来引导AI编程Agent,能显著提升其执行效率,这完全符合我们对系统优化方向的预期。

AGENTS.md这类文件本质上是一种工程化的提示词管理方案。它将原本可能零散、临时、易变的提示词,转变为一个可维护、可协作、可版本控制的工程构件。这步转变至关重要,尤其是在企业级或大型开源项目中,它确保了AI Agent行为的一致性和可预测性,减少了因上下文模糊或缺失导致的无效计算和冗余输出。

研究数据显示的运行时间和输出token的下降,直接转化为了更低的计算成本和更快的反馈循环,这对开发体验和项目成本都是实质性的改善。它证明了在追求更强模型能力的同时,优化人机交互的接口和上下文供给方式,是提升整体系统效能的另一个关键杠杆。

当然,研究的局限性也指出了一个事实:这种优化策略的有效性可能因模型、任务复杂度和代码质量评估标准的不同而有所差异。但这并不削弱其核心价值——它为我们提供了一种简单、可落地的最佳实践,将提示工程从一种“艺术”更向“工程” discipline 推进了一步。
展开
举报 纠错/举报
纠错/举报
提交
新增文库
仅自己可见
公开
保存
选择文库
新增文库
取消
完成