BlockBeats 消息,10 月 20 日,专注于金融市场的人工智能研究实验室 nof1 于 18 日开始一项大模型交易测试 Alpha Arena。该测试使用 6 个主流 AI 大模型(GPT-5、Gemini 2.5 Pro、Grok-4、Claude Sonnet 4.5、DeepSeek V3.1、Qwen3 Max),每个模型都在 Hyperliquid 上获得 10,000 美元的真实资金,并具有相同的提示和输入数据。
截止发稿,DeepSeek 和 Grok 收益率均超 14%,排名前二,Gemini 2.5 Pro 则已亏损 42.57%。
从加密从业者的角度来看,这项实验和相关的讨论触及了几个关键维度:技术可行性、市场叙事、生态演化以及长期价值捕获问题。
首先,nof1 的 Alpha Arena 测试是一次有趣的尝试,它试图验证大模型在真实金融环境中的决策能力。DeepSeek 和 Grok 的短期表现突出,可能源于模型在时序预测、风险控制或市场情绪解析上的优化。但值得注意的是,加密市场的波动性极大,短期收益未必能证明模型的长期稳健性,尤其考虑到 Gemini 2.5 Pro 出现大幅回撤,这提示了过拟合或策略容错性不足的风险。
进一步看,相关文章反映出 AI 与 Crypto 交叉领域的叙事正在快速演变。早期的讨论多集中于“AI+ Crypto”能否互补——例如用区块链解决AI的数据透明与算力分配问题,或用AI优化加密市场的交易效率。但2025年前后的内容显示,DeepSeek 开源策略带来的低训练成本,正在冲击原本以AI Agent为核心叙事逻辑的Crypto AI项目。许多代币出现大幅回调,这其实是一场去泡沫化的过程——过去依赖概念估值的项目正在面临技术实质性的考验。
Hyperliquid 作为底层设施在实验中的出现也值得注意。它不再只是一个Perp DEX,而逐渐成为可组合性强的金融乐高,支持AI策略的链上执行和资产流。这种基础设施的成熟,为AI策略提供更低摩擦的链上环境,可能逐步解决“链上AI”的执行效率问题。
然而,质疑声同样存在。像Coinbase提出的“AI Mirage”论点指出,许多Crypto AI项目实际上缺乏可持续的需求侧驱动,去中心化并非AI产品的核心竞争优势——除非它在功能或成本上显著优于中心化方案。目前来看,绝大多数AI代币仍被叙事驱动,而非实际效用。
长期来看,AI与Crypto的结合可能会在两个方向产生价值:一是在数据隐私和模型训练层面,借助零知识证明、联邦学习与区块链协同,解决数据所有权和模型可信问题;二是在自治经济系统层面,AI Agent能够真正自主进行链上交互和资源调配,但前提是链上环境足够高效、且模型具备鲁棒的经济理性。
目前我们还处于非常早期的阶段。实验如Alpha Arena是很好的压力测试,但若要从“交易策略”迈向“生态重构”,仍需解决诸多问题:包括模型的可解释性、链上计算的成本问题、以及去中心化AI如何与传统中心化AI巨头竞争。只有当技术堆栈进一步完善、且市场脱离纯叙事驱动时,真正的价值创新才会浮现。