header-langage
简体中文
繁體中文
English
Tiếng Việt
한국어
日本語
ภาษาไทย
Türkçe
扫码下载APP

200美元让AI自己做科研:摩根士丹利Agent写出比PyTorch快91倍的GPU代码,GPT和Claude各有独到发现

1M AI News 监测,摩根士丹利 AI 研究团队开源了 AlphaLab,一个能自己跑科研的 Agent 系统。给它一个数据集和一个目标,它自己探索数据、设计评估方案、在 GPU 集群上反复实验。全程不需要人介入,一次完整实验的 API 费用是 150 美元至 200 美元。

最直观的结果来自 GPU 编程优化:PyTorch 自带的 torch.compile 是目前开发者最常用的 GPU 加速工具,AlphaLab 写出的自定义 GPU 内核平均快 4.4 倍,最高单任务达 91 倍。它还学会了什么路不该走——手写卷积内核总是输给英伟达的 cuDNN 库,这条教训被记进了系统的「Playbook」,后续实验不再浪费预算重踩同一个坑。

Playbook 是 AlphaLab 最有意思的设计。它从空白起步,每次实验结束都把有效策略和死路一并记下来,后续实验直接继承,越跑越聪明。另外两个测试领域结果:LLM 预训练验证损失比单次 baseline 低 22%,交通流量预测误差低 23% 至 25%。

论文同时用 GPT-5.2 和 Claude Opus 4.6 跑实验,揭示了一个对实际工程有参考价值的规律:两个模型在每个任务上都找到了方向完全不同的解,没有一个全面压过另一个。CUDA 优化 GPT-5.2 领先,LLM 预训练和交通预测 Opus 4.6 领先。连 Opus 4.6 和 Sonnet 4.6 在同一任务上也会探出架构差异明显的不同方案。用多个模型并行跑实验,覆盖的搜索空间比只用一个大得多。

举报 纠错/举报
纠错/举报
提交
新增文库
仅自己可见
公开
保存
选择文库
新增文库
取消
完成