Karpathy开源autoresearch：睡一觉，AI自动跑100次LLM训练

据 1M AI News 监测，AI 教育公司 Eureka Labs 创始人、OpenAI 联合创始人 Andrej Karpathy 昨日公开分享开源项目 autoresearch，将此前在 LLM 训练项目 nanochat 上的 AI Agent 自动调优工作流打包为独立仓库，供开发者周末上手。

项目核心设计是「人写 Markdown，AI 写代码」：人类编写 program.md 定义研究方向，AI Agent 自主修改约 630 行的 train.py（包含完整 GPT 模型、Muon + AdamW 优化器和训练循环）。每次实验固定运行 5 分钟，以验证集每字节比特数（val_bpb）为唯一指标，优于基线则保留提交，否则丢弃，如此循环。按此节奏每小时约跑 12 次实验，一整夜约 100 次。Karpathy 展示的示例图中，83 次实验产出了 15 次被保留的改进。

项目仅需一块 NVIDIA GPU（已在 H100 上测试），依赖 PyTorch 和少量包，MIT 协议开源。社区已出现 macOS 和 MLX 适配分支。

原文链接

纠错/举报