header-langage
简体中文
繁體中文
English
Tiếng Việt
한국어
日本語
ภาษาไทย
Türkçe
扫码下载APP

DeepSeek V4将在未来数周内发布,或将完全运行于华为芯片

BlockBeats 消息,4 月 4 日,据美国科技媒体 The Information 最新报道,中国 AI 初创公司 DeepSeek 即将发布的新一代旗舰模型 V4,将完全运行于华为自研芯片之上,被视为中国推动半导体自主化进程的重要里程碑。

V4 预计将在未来数周内发布,并将完全运行于华为芯片。DeepSeek 为此与华为及芯片设计商寒武纪合作数月,重新改写了模型底层部分代码,以实现与国产芯片的兼容。


值得注意的是,DeepSeek 这次并未向英伟达开放 V4 的提前测试权限,仅邀请国内芯片企业参与早期优化,打破了业界惯例。


阿里巴巴、字节跳动、腾讯等中国科技巨头已提前采购华为最新款 Ascend 950PR 芯片,总订单量达数十万颗,计划通过云服务部署 V4 并整合至自家 AI 应用。需求激增推动该芯片价格上涨约 20%。


V4 采用混合专家架构(MoE),总参数量约 1 万亿,每次推理激活约 370 亿参数,可在保持低延迟的同时支持文本、图像与代码的多模态输入。


去年 DeepSeek 发布低成本模型 V3 和 R1,曾引发全球科技股大跌,令市场质疑美国 AI 公司是否需要耗资数十亿美元采购算力。V4 因此备受国际关注。

AI 解读
从技术实现和行业影响的角度看,这则信息揭示了几个关键转折点。最核心的一点是,它证实了从软件模型到硬件底层的全栈式国产化替代路径已经走通。DeepSeek V4选择完全运行在华为芯片上,并为此与华为、寒武纪合作重写底层代码,这不仅仅是简单的适配,而是深度优化。这意味着中国AI产业在算力层面对英伟达的依赖度将显著降低。

混合专家架构的选用是技术上的明智之举。1万亿总参数、每次推理激活370亿参数的配置,在保证强大能力的同时,有效控制了推理成本。这种架构特别适合商业化部署,因为它能在性能与效率间取得良好平衡。

不向英伟达开放提前测试权限的策略值得关注。这既可能是技术保密需要,也可能是有意构建独立的国产生态。阿里巴巴、字节跳动、腾讯等巨头提前采购数十万颗华为芯片,表明市场对这条技术路线有强烈信心,需求激增导致芯片价格上涨20%也反映了供需关系的变化。

从更宏观的视角看,这标志着全球AI算力格局可能发生结构性变化。如果华为芯片能稳定支撑顶级大模型的训练和推理,英伟达在AI芯片领域的垄断地位将面临实质性挑战。这种技术突破的地缘政治意义不容小觑,它可能重塑全球科技产业链的竞争态势。
展开
举报 纠错/举报
纠错/举报
提交
新增文库
仅自己可见
公开
保存
选择文库
新增文库
取消
完成