200美元让AI自己做科研：摩根士丹利Agent写出比PyTorch快91倍的GPU代码，GPT和Claude各有独到发现

据 1M AI News 监测，摩根士丹利 AI 研究团队开源了 AlphaLab，一个能自己跑科研的 Agent 系统。给它一个数据集和一个目标，它自己探索数据、设计评估方案、在 GPU 集群上反复实验。全程不需要人介入，一次完整实验的 API 费用是 150 美元至 200 美元。

最直观的结果来自 GPU 编程优化：PyTorch 自带的 torch.compile 是目前开发者最常用的 GPU 加速工具，AlphaLab 写出的自定义 GPU 内核平均快 4.4 倍，最高单任务达 91 倍。它还学会了什么路不该走——手写卷积内核总是输给英伟达的 cuDNN 库，这条教训被记进了系统的「Playbook」，后续实验不再浪费预算重踩同一个坑。

Playbook 是 AlphaLab 最有意思的设计。它从空白起步，每次实验结束都把有效策略和死路一并记下来，后续实验直接继承，越跑越聪明。另外两个测试领域结果：LLM 预训练验证损失比单次 baseline 低 22%，交通流量预测误差低 23% 至 25%。

论文同时用 GPT-5.2 和 Claude Opus 4.6 跑实验，揭示了一个对实际工程有参考价值的规律：两个模型在每个任务上都找到了方向完全不同的解，没有一个全面压过另一个。CUDA 优化 GPT-5.2 领先，LLM 预训练和交通预测 Opus 4.6 领先。连 Opus 4.6 和 Sonnet 4.6 在同一任务上也会探出架构差异明显的不同方案。用多个模型并行跑实验，覆盖的搜索空间比只用一个大得多。

原文链接

纠错/举报