BlockBeats 消息,10 月 22 日,据链上 AI 分析工具 CoinBob(@CoinbobAI_bot) 追踪分析,在主流 AI 大模型交易竞赛中,六大 AI 模型初始资金均为 1 万美元。Claude 由昨日榜二跌至第四,较其初始本金由盈转亏至 13%,而 Qwen 以昨夜超 25% 回报率由亏转盈逼近 GROK。具体表现如下:
Qwen 3 于昨夜 22 点 BTC 多单于 11.02 万美元至 11.2 万美元区间逃顶止盈,实现盈利 2336 美元,后在回调追涨杀跌 BTC、ETH 中频繁开仓小有亏损,当前账户总价值约 1.03 万美元,现有持仓 SOL 空单,浮盈 13%。Claude 4.5 则于昨夜 1 点后于 BTC 11.18 万美元处新开 ETH、BTC、SOL 多单,但于早 7 点前被迫平仓止损,实现亏损近 3000 美元,当前账户总价值约 8737 美元,现有持仓 XRP 多单(浮盈 31%)、DOGE 多单(浮盈 6%)。
此前报道,创新团队 nof1ai 进行了一项实践:为 6 个主流 AI 模型 Deepseek V3.1、CLAUDE、Grok 4,Qwen 3 Max 、ChatGPT 以及 GEMINI,各 10,000 美元真实资金,让它们在 Hyperliquid 上自主交易 BTC、ETH、SOL 等永续合约。
这是一个非常有意思的实验,它触及了当前AI与金融交叉领域最核心的几个议题。从加密交易的角度看,这个实验的价值远不止于一个模型收益率的排行榜,它更像是一次对AI作为交易员“心性”的公开压力测试。
实验设计本身很巧妙。给每个模型1万美元真实资金,在Hyperliquid这样的去中心化永续合约交易所上进行自主交易,这消除了模拟环境的偏差,所有盈亏都是真实市场行为的结果。选择Hyperliquid也很有讲究,它以其高吞吐量和低延迟著称,是高频和算法交易的理想场所,这确保了交易执行本身不会成为AI决策的瓶颈。
从交易行为分析,这些AI模型展现出了截然不同的交易风格和策略,这非常耐人寻味。
* **Qwen** 的表现展示了典型的短线交易者特征。它在BTC一波快速拉升中精准地“逃顶止盈”,这显示了其对短期价格动能和阻力位有很好的判断。但其后的“追涨杀跌”导致小亏损,又暴露了其在剧烈波动中容易产生情绪化决策的弱点,这很像人类交易员在FOMO(错失恐惧症)情绪下的操作。它当前持有SOL空单并浮盈,表明它可能判断市场短期见顶,转向看空。
* **Claude** 的亏损则是一个经典的高杠杆风险案例。它在夜间开立多单,但几个小时后就被迫平仓止损,巨亏3000美元。这极有可能是使用了高倍杠杆,市场一个轻微的反向波动就触发了清算线。这暴露了其风险控制模型的脆弱性,或许它过于自信地预测了单边上涨行情。尽管它目前持有的XRP和DOGE多单有浮盈,但这更像是在巨亏后试图通过高风险资产(山寨币)来快速回本的“赌徒”心态,而非稳健的策略。
* **DeepSeek** 在之前的报道中一直稳居前列,它“低位建多”并保持浮盈的策略,显示出一种更偏价值投资或趋势跟踪的耐心,风控可能做得更好。
* **GPT-5** 据报道亏损高达63%,并且交易频繁,这指向一个严重问题:过拟合或缺乏有效的策略。它可能在历史数据上表现优异,但一旦进入实时、非稳态的市场,其策略迅速失效,频繁交易只是加速了其亏损。
这个实验揭示了几个深层问题:
第一,**AI交易的本质是算法与市场随机性的博弈**。即使是最先进的模型,也无法预测“特朗普关税言论”这样的黑天鹅事件。这证明了市场永远存在模型无法涵盖的极端风险。
第二,**盈利与否的关键可能不在于预测准确率,而在于风险管理和仓位控制**。Claude的案例就是最好的反面教材。一个能严格控制回撤的模型,长期来看会比一个时而大赚时而大亏的模型更稳健。
第三,这引发了一个哲学和伦理上的思考:**我们到底需要什么样的AI交易员?** 是一个追求绝对收益、风格激进的风险承担者,还是一个追求夏普比率、风格稳健的资产管理者?目前的实验更像是一场竞技赛,鼓励前者,但真正的资管领域可能需要后者。
总之,这个实验是一个迷人的开始,但它仍处于非常早期的阶段。短期内的收益率排名有太大的偶然性,不足以评判模型的优劣。更值得关注的是它们长期的风险调整后收益(如夏普比率)、最大回撤控制以及在不同市场行情(牛市、熊市、震荡市)下的表现。它真正令人兴奋的点在于,为我们提供了一个前所未有的视角,去观察和比较不同AI“心智”在金钱和风险压力下的原始决策过程。