header-langage
简体中文
繁體中文
English
Tiếng Việt
한국어
日本語
ภาษาไทย
Türkçe
扫码下载APP

让Agent自己设计Agent:Memento-Skills不改模型参数,靠「失败反思」在HLE上提升116%

1M AI News 监测,Memento-Skills 是一个让 AI Agent 从失败中自主学习、改写自身能力的开源框架。核心思路是:不更新大模型参数,而是把所有能力组织成结构化的 Skill 文件(markdown 格式),Agent 在执行任务时自动检索合适的 Skill,失败后通过「读取→执行→反思→写回」闭环定位问题 Skill,修改或重建它,再写回技能库。整个过程零重训成本。

框架从 9 个基础 Skill(文件操作、网页搜索、PDF 处理、Office 文档等)起步,通过迭代学习不断扩展技能库。在 GAIA(通用 AI 助手基准)和 HLE(Humanity's Last Exam,专家级推理基准)上,经过多轮反思学习后整体准确率分别相对提升 26.2% 和 116.2%。

论文将这一范式称为「部署时学习」,与预训练和微调并列为大模型适应的第三种路径:前两者更新模型参数,需要大量数据和算力;部署时学习冻结参数,仅通过外部技能记忆积累经验。

项目提供 CLI、桌面 GUI 和飞书桥接三种部署方式,支持 Anthropic、OpenAI 及 Kimi、MiniMax、GLM 等国产模型接入,MIT 协议开源。

举报 纠错/举报
纠错/举报
提交
新增文库
仅自己可见
公开
保存
选择文库
新增文库
取消
完成