据 1M AI News 监测,AMD 旗下 AGI 团队开源了 Apex,一个强化学习训练环境,任务是让 LLM Agent 优化 AMD ROCm 硬件上的 GPU 内核。Agent 接收一个基线内核和包含源码及文档的沙盒环境,输出优化后的内核,由评分系统按编译通过(+20 分)、正确性(+100 分)和加速比(加速倍数 × 100 分)三个维度打分。
Apex 目前支持 Claude Code 和 OpenAI Codex 两种 Agent,为 Agent 配备了 5 个 MCP 服务器(源码检索、内核 RAG、GPU 信息、融合顾问、Magpie 评测)和 13 个领域技能(Triton 优化、HIP 调优、架构指南等)。内核类型覆盖 12 种,包括 Flash Attention(prefill 和 decode)、MLA Attention、Fused MoE、FP8/BF16 GEMM、RMSNorm、RoPE、KV Cache 操作等。模型注册表包含 19 个开源模型,涵盖 Llama 3、Mistral/Mixtral、Qwen 2.5、Gemma 2、DeepSeek R1/V3、Phi 等家族。
默认优化目标为 AMD Instinct MI355X(CDNA4),同时支持 MI300X、MI300A 和 MI250X。项目采用 MIT 协议,代码已在 GitHub 开源。