首页

快讯深度数据

社区

Search Extension

AI炒币大赛「续集」来袭：换成美股主场，美国模型要扳回一城？

深潮TechFlow

2025-11-20 15:04

阅读本文需 11 分钟

AI 交易真正收割的，正是那些依赖技术分析的散户。

原文标题：《新一期 AI 交易大赛来袭，美股主场让 Gemini 3 Pro 开始发力》

原文作者：David，深潮 TechFlow

还记得 10 月份那场 AI 炒币大赛吗？

阿里巴巴的 Qwen 3 Max 两周赚了 22%，OpenAI 的 GPT-5 却亏了 63%。六个全球顶尖的大模型，每个拿着一万美元在加密市场厮杀，结果呈现出泾渭分明的东西对决：

中国模型笑傲江湖，美国模型全线溃败。（律动注：更多详情可参阅：《六大 AI「交易员」十日对决：谁能在「无信息差」的市场中生存？》、《阿里 Qwen3 最后时刻反超 DeepSeek，AI 炒币大赛上演终极翻盘》）

上一期刚刚落幕，新一期的 Alpha Arena Season 1.5 就来了。

这次，nof1.ai 把战场从加密市场搬到了美股。规则更复杂，参赛选手更多，资金规模也扩大达到了 32 万美金。

那些在加密市场折戟的美国模型，能在美股主场扳回一城吗？

上季回顾

快速回忆一下上一季的玩法：

今年 10 月 17 日到 11 月 3 日, 六个 AI 大模型在 Hyperliquid 上展开了一场史无前例的较量。

每个模型获得 1 万美元初始资金, 可以交易 BTC、ETH、SOL、XRP、DOGE、BNB 等主流加密货币的永续合约。核心规则只有一个:完全自主交易, 零人工干预。

参赛阵容：

Qwen 3 Max（阿里巴巴）、DeepSeek Chat V3.1、GPT-5（OpenAI）、Gemini 2.5 Pro（Google/DeepMind）、Grok 4（xAI）、Claude Sonnet 4.5（Anthropic）。

最终成绩单如下。

中国模型：

• Qwen 3 Max 夺冠，+22.3%

• DeepSeek V3.1 亚军，+4.89%（期间一度飙到+125%）

美国模型：

• GPT-5：-62.66%

• Gemini 2.5 Pro：-56.71%

• Grok 4：-45.3%

• Claude Sonnet 4.5：-30.81%

六个模型，两个赚钱，四个亏损。这个结果从加密行业出圈，也引起了更多泛科技和金融行业的媒体讨论。

但 nof1.ai 没有停下脚步，他们马上开启了新赛季，这次把目标瞄准了美股市场。

Season 1.5：炒美股，换规则，引入匿名神秘模型

首先是参赛阵容扩充到 8 个模型。除了上一季的老面孔（GPT-5.1、Grok-4、DeepSeek、Claude、Qwen3-Max、Gemini-3-Pro），还来了两位新选手：

Kimi 2（月之暗面）和一个身份保密的神秘模型，下图中的那个问号就是。

更重要的是比赛形式也升级了。Season 1.5 设计了四种竞赛模式，让模型同时参与：

• Baseline：标准模式，AI 自由发挥，和上一季一样

• Monk Mode：给 AI 戴上镣铐，限制交易频率和仓位大小，看压力情况下的表现

• Situational Awareness：AI 能看到其他选手的持仓，像打德州扑克一样互相博弈

• Max Leverage：开放高杠杆，看谁胆子大又不翻车

同时每个模型，在每种模式下都拿 1 万美元，最终排名看所有竞赛汇总在一起的平均表现。

顺带一提，nof1.ai 透露后面的 Season 2，还将引入人类交易员与 AI 对战，还会有他们自研的模型参赛。人机大战，这画面有没有当年围棋界李世石大战 alpha go 的味道了？

当前战况：座次洗牌，Gemini 3 pro 知耻而后勇？

截至 11 月 19 日发稿时，随着战场从 Hyperliquid 的加密合约转移到美股，虽然比赛才刚开始，但排行榜出现了和上一季不一样的反转。

最大的惊喜来自 Gemini-3-Pro。上一季它在币圈被割了 56%，这回到了美股主场，直接以 +7% 的收益率空降当前的榜首。

美国模型紧随其后的是 GPT-5.1 (+1.66%) 和 Grok-4 (+1.16%) 这三位在加密市场全线溃败的美国选手，面对熟悉的纳斯达克科技股，似乎开始了赚钱之旅。

相比于币圈受情绪和 meme 驱动的混沌，美股科技巨头的走势更多依赖财报、宏观数据和产业逻辑，这也是 GPT 和 Gemini 训练语料中最丰富的部分。

值得一提的是，没有公开身份的神秘模型表现也很不错，目前在综合收益里排第二；上季冠军千问目前收益率 3.6%，暂时位列第三；中国其他模型 kimi 和 deepseek 也在 1% 左右的收益率徘徊。

而仔细看看目前排名第一的 Gemini Pro3 的持仓，你会发现它在高杠杆模式下表现更好。

例如 Gemini 的平均杠杆倍数在 11 倍左右，尤其擅长做多。

当前它的持仓为：做多纳指、亚马逊、Palantir 、英伟达和特斯拉，同时做空谷歌和微软。

目前唯一的输家依然是 Claude (-0.9%)，看来无论是在币圈还是美股，Anthropic 的模型都在交易决策上显得过于犹豫，直到现在都没开过几单。

最后，这比赛看个热闹就行，还是真能跟着赚点买菜钱？

眼下的美股看似被英伟达一张炸裂财报撑着，实则暗流涌动。宏观不确定性叠加高估值，市场变得极度敏感。

这种环境，恰恰是 AI 高频博弈的主场，普通散户面对的可能更像个修罗场。

正如段永平在最近的访谈中的观点，AI 交易真正收割的，正是那些依赖技术分析的散户。在速度和算力面前，人类的那点「盘感」毫无优势。

但他同时也给出了破局之道，那就是 AI 很难理解企业真正的商业价值。

所以，与其盯着榜单猜这周是跟 Gemini 做多还是反指 Claude，不如听听大道的建议：如果看不懂公司，就老老实实买标普 500，或者干脆什么都不交易。

在这个资产红利逐渐被一级市场吃掉和风险后置的市场里，理性往往比聪明更重要。

至于那个高居第二的「神秘模型」，不少人猜测这或许是顶尖交易员的马甲。如果真是这样，那就可以看看这季结束以后人类交易是否真能干过 AI；或者说在市场走差时，谁的控制回撤能力更胜一筹。

搬好小板凳看戏就行，护好自己的本金才是正经事。

原文链接

点击了解律动BlockBeats 在招岗位

欢迎加入律动 BlockBeats 官方社群：

Telegram 订阅群：https://t.me/theblockbeats

Telegram 交流群：https://t.me/BlockBeats_App

Twitter 官方账号：https://twitter.com/BlockBeatsAsia

AI 解读

从加密从业者的角度看，这类 AI 交易竞赛实际上是对模型在金融市场中泛化能力和适应性的压力测试。虽然表面上是娱乐化的“大赛”，但它揭示了几个关键问题。

首先，交易环境对模型表现的影响非常明显。在加密货币市场，价格波动更受情绪、社区共识和 meme 文化驱动，训练数据中缺乏清晰逻辑，而美股则更依赖基本面、财报和宏观因子，这正是传统语言模型擅长处理的领域。因此，Gemini 3 Pro 在美股中表现回升并不意外，它更适应结构化数据驱动的市场。

其次，竞赛设计本身存在局限性。尽管 nof1 试图通过多模式（如限频交易、高杠杆、对手持仓可见）来模拟真实环境，但这些实验仍是在有限资金、有限时间和特定规则下进行的，无法完全复现真实市场中流动性冲击、极端行情和恶意博弈等因素。目前的结果只能反映模型在特定场景下的短期表现，并不能断言某一模型具备持续盈利的能力。

此外，这类实验也暗示了一个潜在风险：如果 AI 交易工具被大规模采用，可能会加剧市场的同质化行为。当多个模型基于相似逻辑进行高频决策时，容易形成集体偏向，反而放大市场波动，甚至在极端情况下引发闪崩。

最后，从投资角度看，这类竞赛的热度也反映了市场对 AI 赋能交易的强烈期待——但从业者更需要冷静看待。真正的超额收益可能并不来自于公开的、高度竞争的策略，而是来自于未被广泛挖掘的数据源、独特的行为建模或跨市场套利机会。而目前这些模型的表现，尚不能证明其具备超越成熟量化机构的能力。

如果这类竞赛能进一步开放数据接口、引入更多非公开模型、甚至允许外部开发者提交策略，或许能更接近真实世界的复杂性，从而提供更有价值的洞察。但就目前而言，它更像是一场市场营销和实验原型展示，距离实际落地应用还有距离。

展开

#GPT-5 #Claude #Grok #Qwen 3 Max #Gemini 3 Pro #AI交易工具

纠错/举报

本平台现已全面集成Farcaster协议, 如果您已有Farcaster账户, 可以登录后发表评论