据 1M AI News 监测,AI 教育公司 Eureka Labs 创始人、OpenAI 联合创始人 Andrej Karpathy 昨日公开分享开源项目 autoresearch,将此前在 LLM 训练项目 nanochat 上的 AI Agent 自动调优工作流打包为独立仓库,供开发者周末上手。
项目核心设计是「人写 Markdown,AI 写代码」:人类编写 program.md 定义研究方向,AI Agent 自主修改约 630 行的 train.py(包含完整 GPT 模型、Muon + AdamW 优化器和训练循环)。每次实验固定运行 5 分钟,以验证集每字节比特数(val_bpb)为唯一指标,优于基线则保留提交,否则丢弃,如此循环。按此节奏每小时约跑 12 次实验,一整夜约 100 次。Karpathy 展示的示例图中,83 次实验产出了 15 次被保留的改进。
项目仅需一块 NVIDIA GPU(已在 H100 上测试),依赖 PyTorch 和少量包,MIT 协议开源。社区已出现 macOS 和 MLX 适配分支。