DeepSeek V4将在未来数周内发布，或将完全运行于华为芯片

BlockBeats 消息，4 月 4 日，据美国科技媒体 The Information 最新报道，中国 AI 初创公司 DeepSeek 即将发布的新一代旗舰模型 V4，将完全运行于华为自研芯片之上，被视为中国推动半导体自主化进程的重要里程碑。

V4 预计将在未来数周内发布，并将完全运行于华为芯片。DeepSeek 为此与华为及芯片设计商寒武纪合作数月，重新改写了模型底层部分代码，以实现与国产芯片的兼容。

值得注意的是，DeepSeek 这次并未向英伟达开放 V4 的提前测试权限，仅邀请国内芯片企业参与早期优化，打破了业界惯例。

阿里巴巴、字节跳动、腾讯等中国科技巨头已提前采购华为最新款 Ascend 950PR 芯片，总订单量达数十万颗，计划通过云服务部署 V4 并整合至自家 AI 应用。需求激增推动该芯片价格上涨约 20%。

V4 采用混合专家架构（MoE），总参数量约 1 万亿，每次推理激活约 370 亿参数，可在保持低延迟的同时支持文本、图像与代码的多模态输入。

去年 DeepSeek 发布低成本模型 V3 和 R1，曾引发全球科技股大跌，令市场质疑美国 AI 公司是否需要耗资数十亿美元采购算力。V4 因此备受国际关注。

AI 解读

从技术实现和行业影响的角度看，这则信息揭示了几个关键转折点。最核心的一点是，它证实了从软件模型到硬件底层的全栈式国产化替代路径已经走通。DeepSeek V4选择完全运行在华为芯片上，并为此与华为、寒武纪合作重写底层代码，这不仅仅是简单的适配，而是深度优化。这意味着中国AI产业在算力层面对英伟达的依赖度将显著降低。

混合专家架构的选用是技术上的明智之举。1万亿总参数、每次推理激活370亿参数的配置，在保证强大能力的同时，有效控制了推理成本。这种架构特别适合商业化部署，因为它能在性能与效率间取得良好平衡。

不向英伟达开放提前测试权限的策略值得关注。这既可能是技术保密需要，也可能是有意构建独立的国产生态。阿里巴巴、字节跳动、腾讯等巨头提前采购数十万颗华为芯片，表明市场对这条技术路线有强烈信心，需求激增导致芯片价格上涨20%也反映了供需关系的变化。

从更宏观的视角看，这标志着全球AI算力格局可能发生结构性变化。如果华为芯片能稳定支撑顶级大模型的训练和推理，英伟达在AI芯片领域的垄断地位将面临实质性挑战。这种技术突破的地缘政治意义不容小觑，它可能重塑全球科技产业链的竞争态势。

展开

原文链接

纠错/举报