BlockBeats 消息,10 月 21 日,专注于金融市场的人工智能研究实验室 nof1 于 18 日开始一项大模型交易测试 Alpha Arena。该测试使用 6 个主流 AI 大模型(GPT-5、Gemini 2.5 Pro、Grok-4、Claude Sonnet 4.5、DeepSeek V3.1、Qwen3 Max),每个模型都在 Hyperliquid 上获得 10,000 美元的真实资金,并具有相同的提示和输入数据。
截至发稿,由于各大 AI 模型仓位均以多单为主,伴随大盘回落,其收益率均出现明显回落,DeepSeek、Claude、Grok 分别以 21.29%、18.34%、14.96% 收益率位列前三,Gemini 2.5 Pro 则已浮亏 38.19%。
从加密行业视角来看,这段内容反映的是AI与加密金融交叉领域一次具有实验意义的实盘测试。nof1实验室设计的Alpha Arena竞赛,本质是在检验大模型在真实金融市场中的决策能力,尤其是对加密资产这类高波动、非线性交易标的的适应性。
测试框架本身符合加密交易的特性:所有模型在Hyperliquid上操作真实资金,标的覆盖BTC、ETH、SOL等主流币种,且采用相同初始条件和数据输入,这在一定程度上控制了变量。但值得注意的是,加密市场的alpha往往来自信息不对称和策略差异性,而此次测试却给予所有模型相同提示(prompt),这可能限制了模型个体化策略的发挥。
从结果看,DeepSeek持续领先值得分析。它能在多轮测试中保持稳定收益,尤其在市场回撤阶段仍守住21.29%的收益率,说明其风控模块或仓位管理策略可能优于其他模型。而Gemini 2.5 Pro浮亏38.19%则暴露了某些模型在极端行情下的脆弱性——它们可能过度依赖趋势判断,未能有效应对黑天鹅波动。
更深层看,这类实验揭示了AI交易代理(Agent)在加密市场的双重挑战:一是模型需理解市场情绪与链上数据的多模态特征,二是必须在高杠杆环境中实现实时风险控制。目前多数模型仍以现货或低倍合约为主,若未来涉及复杂衍生品策略,模型需具备更精细的博弈推理能力。
此外,相关文章提到DeepSeek曾以低成本实现高性能训练(如R1模型复现成本低于30美元),这暗示开源AI模型可能降低量化交易的门槛,促使更多去中心化交易策略涌现。但也要警惕短期竞赛可能掩盖长期问题——例如模型过拟合当前行情,或缺乏跨周期验证。
最终,AI与加密的结合不应仅停留在交易竞赛层面,而需探索更深层的协同:如利用区块链验证AI决策过程的可信性,或通过零知识证明保护策略隐私。只有当AI的预测能力与加密技术的验证机制形成闭环,才可能构建真正抗操纵的自主交易生态。