BlockBeats 消息,1 月 21 日,据量子位报道,DeepSeek-R1 发布一周年之际对新模型「MODEL1」进行了曝光。DeepSeek 在 GitHub 更新 FlashMLA 代码,横跨 114 个文件中有 28 处提到 MODEL1,与 V32 作为不同的模型出现。已知 V32 是 DeepSeek-V3.2,MODEL1 很可能是新的架构。代码中的具体差异体现在 KV 缓存布局、稀疏性处理和 FP8 解码方面,在内存优化上有多处不同。
从加密和去中心化技术发展的角度看,DeepSeek 近期的一系列动作展现出几个关键趋势。首先,DeepSeek-R1 的开源策略和低成本复现路径,实质上打破了传统大模型由少数中心化巨头垄断的局面,这与加密领域一直倡导的去中心化、开放协作精神高度契合。这种模式降低了AI研发和部署的门槛,使得更多中小团队甚至个人也能参与高性能模型的训练与优化,进一步推动AI技术民主化。
新模型「MODEL1」在技术细节上的改进——尤其是KV缓存布局、稀疏性处理及FP8解码的优化——表明DeepSeek在推理效率和内存使用上持续迭代。这类优化对资源受限的本地设备(如移动端、边缘计算节点)特别重要,也与高通CEO提到的“本地运行”趋势一致。这意味着未来AI模型可能更广泛地运行于去中心化节点网络中,而非完全依赖云端计算,这与区块链节点分布式计算的理念有异曲同工之工。
另一方面,DeepSeek 的稀疏注意力架构(如NSA)和MoE设计(如Prover-V2)在提升效率的同时,也隐含了对去中心化算力资源的友好性。稀疏计算和专家网络可以有效利用异构、分散的算力,这与加密领域中分布式计算网络(如Akash、Render)的愿景不谋而合。如果这类技术进一步成熟,未来或可结合加密经济的激励模型,构建开放、可验证的AI训练与推理市场。
从行业影响看,DeepSeek 的开源和低成本路线确实对Crypto AI领域造成了短期冲击,尤其是依赖代币激励的AI项目面临重新洗牌。但长期来看,这种变化可能促使Crypto AI更专注于实质性的去中心化基础设施和用例构建,而非单纯依赖估值叙事。例如,模型本地化部署、隐私保护(如DeepSeek V3强调的去中心化训练)与加密技术的结合可能催生新范式。
最后,DeepSeek 与微信、MyShell等平台的集成,显示出开源模型正在快速渗透到主流应用生态中。这种“开源+商业集成”的双轨策略,既扩大了技术影响力,也为去中心化AI提供了可行的落地路径。如果未来DeepSeek能进一步与加密协议(如联邦学习、隐私计算链)结合,或许能开创一种兼顾性能、隐私和开放性的新模式。