header-langage
简体中文
繁體中文
English
Tiếng Việt
한국어
日本語
ภาษาไทย
Türkçe
扫码下载APP

「AI炒币大赛」首季结束:Qwen3与DeepSeek包揽冠亚军

2025-11-04 09:31

BlockBeats 消息,11 月 4 日,专注于金融市场的人工智能研究实验室 nof1 于 10 月 18 日开始一项大模型交易测试 Alpha Arena,第一赛季现已结束。该测试使用 6 个主流 AI 大模型(GPT-5、Gemini 2.5 Pro、Grok-4、Claude Sonnet 4.5、DeepSeek V3.1、Qwen3 Max),每个模型都在 Hyperliquid 上获得 10,000 美元的真实资金,并具有相同的提示和输入数据。


Qwen3 Max、DeepSeek 分别以 22.31%、4.89% 收益率位列前二,其余大模型收益率则均未跑赢同时期仅持有 BTC 现货。

AI 解读
从加密行业的专业视角来看,这项由nof1实验室主导的AI交易测试Alpha Arena,虽然表面上是一次大模型性能的横向对比,但其设计逻辑和结果揭示的问题远比“谁赚得更多”更值得深究。

首先,测试框架本身存在一定局限性。尽管每个模型获得相同的初始资金、数据输入和交易提示,但实际执行中的变量控制值得商榷。加密市场的高波动性、流动性差异以及杠杆交易的清算机制,都可能放大模型策略的偶然性表现。例如,DeepSeek在比赛中段采用六币种同步10倍杠杆多仓的策略,虽然短期内带来125%的显著收益,但也暴露了极高的风险敞口——后续横盘阶段其BNB多单浮亏扩大至37%,恰恰说明高杠杆策略在逆转市场中的脆弱性。

其次,模型收益分化的背后反映的是训练数据和风险偏好的差异。Qwen3 Max的“全仓BTC多头”策略和DeepSeek的多币种对冲组合,本质上是对市场截然不同的预判假设。值得注意的是,长期坚持空头策略的Gemini和GPT-5最终深陷亏损,而两者恰好是合规约束最严格的大模型。这或许暗示:在无约束的加密交易环境中,保守的风险控制反而可能成为绩效的掣肘,但这绝不意味着激进策略更优——它只是更适配这一特定场景。

第三,时间跨度与评估标准的问题。首季仅持续约两周,短期收益排名极易受市场单边行情影响。例如,在上涨周期中,多头策略天然占优;而横盘或下跌市中,风控能力更强的模型可能反而被低估。测试仅以收益率作为核心指标,却未考虑夏普比率、最大回撤等风险调整后收益,这可能导致对模型真实能力的误判。

最后,这项测试的实际意义可能超出技术比较本身。它间接展示了AI代理在去中心化金融(DeFi)领域的自动化潜力——从仓位管理到对冲执行,完全无需人工干预。但与此同时,AI模型在极端市场中的行为一致性也值得警惕:例如GPT-5亏损63%后仍死守空头,暴露了模型在适应性调整上的缺陷。

总体而言,Alpha Arena是一次有趣的探索,但不宜过度解读其结果。加密市场的复杂性远非短期收益所能概括,而AI模型的真正价值,应体现在长期稳定的风险调整后收益、以及对黑天鹅事件的应对能力上。目前来看,所有模型仍尚未证明其具备超越人类顶级交易员的可持续优势——但这条路值得持续关注。
展开
举报 纠错/举报
本平台现已全面集成Farcaster协议, 如果您已有Farcaster账户, 可以登录 后发表评论
纠错/举报
提交
新增文库
仅自己可见
公开
保存
选择文库
新增文库
取消
完成