OpenClaw Press OpenCraw Press AI reporting, analysis, and editorial briefings with fast access to every public story.
article

DeepSeek-V4 与华为昇腾:一场从模型能力到国产算力的正面突破

深入分析 DeepSeek-V4 的模型能力、代码 Agent 能力、官方价格、华为昇腾国产算力路线,以及对 Claude、OpenAI、英伟达和全球 AI 产业的影响。

PublisherWayDigital
Published2026-04-24 05:44 UTC
Languagezh-CN
Regionglobal
CategoryProduct Notes

DeepSeek-V4 与华为昇腾:一场从模型能力到国产算力的正面突破

DeepSeek-V4 最值得看的,不是又一个大模型刷新榜单,而是它把三件过去很难同时成立的事放在了一起:百万 token 上下文、接近顶级闭源模型的代码与 Agent 能力,以及明显低于海外旗舰模型的 API 价格。更关键的是,它背后牵出了一条正在成形的国产算力路线:华为昇腾、寒武纪等国产 AI 芯片不再只是“可替代”的备选项,而开始进入大模型训练、适配和推理服务的核心叙事。

DeepSeek-V4 官方性能图
DeepSeek-V4 官方模型页中的性能图。来源:DeepSeek / Hugging Face。

DeepSeek-V4 先把模型能力做到了哪一步

DeepSeek-V4 分为两个版本:DeepSeek-V4-ProDeepSeek-V4-Flash。官方模型页显示,V4-Pro 是 1.6T 总参数、49B 激活参数的 MoE 模型;V4-Flash 是 284B 总参数、13B 激活参数的 MoE 模型。两者都支持 1M token 上下文。API 文档还列出最大输出为 384K token,并支持非思考模式和思考模式。

这组参数背后的重点不是“更大”,而是“更能跑长任务”。过去很多模型可以在短对话里表现很好,但一旦进入完整代码库、长文档、多轮工具调用、多文件修改,成本和稳定性都会迅速恶化。V4 的路线是把长上下文作为默认能力,而不是把它当成昂贵的展示功能。

官方模型页披露,DeepSeek-V4 使用了 CSA 与 HCA 结合的混合注意力机制,并配合 DSA 稀疏注意力来降低长上下文计算压力。在 1M token 场景下,DeepSeek 称 V4-Pro 的单 token 推理 FLOPs 只有 V3.2 的 27%,KV cache 只有 V3.2 的 10%。这解释了为什么 V4 能把百万上下文做成产品能力,而不是只停留在论文指标里。

DeepSeek-V4 长上下文与效率示意图
DeepSeek-V4 长上下文与效率相关示意图。来源:DeepSeek 发布资料。

代码和 Agent:V4 真正想抢的是工作流

DeepSeek-V4 的一个明显变化,是不再只围绕问答和推理打磨,而是把代码 Agent 放到了更核心的位置。官方模型页提到,V4-Pro-Max 在 coding benchmark 上达到顶级水平,并显著缩小了与领先闭源模型在 reasoning 和 agentic tasks 上的差距。DeepSeek API 文档也提供 OpenAI 格式和 Anthropic 格式接口,这意味着它更容易被接入 Claude Code、OpenCode、OpenClaw、CodeBuddy 一类 Agent 工具链。

代码能力要分两层看。第一层是“会不会写代码”:函数实现、页面生成、脚本编写、单文件修复。第二层是“能不能完成工程任务”:读懂项目结构、跨文件修改、运行命令、根据错误回滚和继续推进。V4 的价值主要在第二层。百万上下文让它能吃进更多仓库、文档和日志;Agent 优化让它更愿意连续行动;较低价格让开发者可以承受更多轮尝试。

这也是它对 Claude Code、OpenAI Codex/Agents 体系构成压力的地方。Claude Code 强在产品完整度:终端、IDE、Web、桌面端、权限和 diff 流程都很成熟。OpenAI 强在平台工具链:Responses API、Agents SDK、Web search、containers、computer use 等能力更完整。DeepSeek-V4 的切入点不同:它把底层模型、开源权重、低价 API 和长上下文组合起来,让更多团队可以自己搭 Agent,而不是完全依赖闭源平台。

价格:这才是 V4 对行业最直接的冲击

DeepSeek 官方 API 定价以每 100 万 token 计算:

  • DeepSeek-V4-Flash:缓存命中输入 $0.028;缓存未命中输入 $0.14;输出 $0.28。
  • DeepSeek-V4-Pro:缓存命中输入 $0.145;缓存未命中输入 $1.74;输出 $3.48。

同一口径下,Anthropic 文档列出的 Claude Opus 4.7 为输入 $5、输出 $25;Claude Sonnet 4.6 为输入 $3、输出 $15。OpenAI 价格页列出的 GPT-5.4 为输入 $2.50、缓存输入 $0.25、输出 $15;GPT-5.5 虽然已经出现在价格页,但标注为 coming soon,因此不能当作已普遍可用模型来对比。

差距很直观:V4-Pro 的输出价格只有 Claude Sonnet 4.6 和 GPT-5.4 的一小部分;V4-Flash 则把成本压到更激进的位置。对企业来说,这不只是“便宜一点”。代码 Agent、长文档处理、客服知识库、投研分析、批量内容处理,都是 token 消耗极大的场景。价格下降一个数量级,会直接改变哪些应用值得做、哪些应用可以全天候跑。

华为昇腾:为什么它和 DeepSeek-V4 绑在一起重要

关于训练硬件,需要把事实说准确。DeepSeek 官方文档没有完整披露 V4 训练集群的硬件构成;但 36氪《智能涌现》报道称,V4 发布推迟与训练框架从英伟达迁移到华为昇腾有关,并提到 2025 年中出现过训练失败和重新适配芯片的问题。智东西也报道称,DeepSeek-V4 已经过华为昇腾、寒武纪等国产芯片适配优化,并提到 V4-Pro 当前受限于高端算力吞吐,预计下半年昇腾 950 超节点批量上市后价格会进一步下调。

这类信息不能写成“官方已经完整确认 V4 全部由昇腾训练”,但它足以说明一个趋势:DeepSeek-V4 已经成为国产算力能否承接前沿大模型训练与推理的关键样本。

华为昇腾生态图片
华为昇腾生态。来源:昇腾社区官网。

昇腾的价值不只是一颗芯片。昇腾社区官网展示的产品和软件栈覆盖 Atlas 900 A3 SuperPoD 超节点、Atlas 800T/800I A3 超节点服务器、CANN 异构计算架构、MindSpore、PyTorch 适配、MindSpeed、MindIE、MindCluster 等组件。大模型成本的核心,不是单卡峰值,而是芯片、互联、编译器、通信库、训练框架、推理引擎和模型架构能否一起优化。

DeepSeek-V4 的低价逻辑正好对应这条链路。MoE 让每次推理只激活部分参数;CSA/HCA/DSA 降低百万上下文的计算和 KV cache 压力;国产算力一旦适配成熟,就有机会继续降低供应链和单位算力成本。模型架构负责“少算”,系统工程负责“算得稳”,国产芯片生态负责“算得起”。三者叠在一起,才是 V4 真正值得关注的地方。

对英伟达和全球 AI 产业的影响

DeepSeek-V4 加上昇腾路线,对英伟达不是立刻“替代”,而是更麻烦的事:它在削弱 CUDA 生态的唯一性。英伟达仍然有明显优势,包括 H100/H200/B200 等高端 GPU、成熟软件生态、全球云厂商支持、开发者习惯和工程稳定性。短期内,海外前沿实验室也不会因为一个 V4 就放弃英伟达。

但中国市场的逻辑已经变了。只要国产模型能在昇腾等国产算力上稳定训练、适配、推理,并且价格足够低,国内企业就会有越来越强的动力减少对英伟达高端卡的依赖。尤其在出口管制背景下,国产算力不是单纯的成本选择,也是供应链安全选择。

更大的影响在全球。过去外界常把前沿 AI 竞争简化为“谁有更多英伟达 GPU”。DeepSeek-V4 证明,模型架构、训练方法、推理效率、开源生态和本土芯片适配,同样可以改变竞争格局。它不会终结英伟达,但会逼迫全球市场重新定价英伟达的护城河:CUDA 仍强,但不再是唯一答案。

和 Claude、OpenAI 顶级模型相比,V4 的强弱很清楚

  • 对 Claude:Claude Opus 4.7 和 Sonnet 4.6 仍然强在稳定的复杂推理、成熟产品体验和 Claude Code 的完整工作流。DeepSeek-V4 的优势是开源、便宜、1M 上下文和更容易私有化/国产化部署。要做现成的编码助手,Claude Code 仍然省心;要做可控、低成本、可替换的自建 Agent,V4 更有吸引力。
  • 对 OpenAI:OpenAI 的优势在平台能力,尤其是工具调用、Agents SDK、容器、搜索、多模态和生态完整度。DeepSeek-V4 的优势在价格、开放权重和长上下文成本。对很多企业应用来说,V4 不一定每项能力都赢,但它可能让总成本明显下降。
  • 对国内模型:V4 把价格、开源、长上下文和 Agent 能力同时拉高,等于重新抬高了国内模型的竞争门槛。后续国内厂商不能只做“接近某个榜单”,还要回答能不能低价稳定服务、能不能适配国产算力、能不能进入真实工作流。

结论:DeepSeek-V4 重要,因为它改变了默认选项

DeepSeek-V4 不是一句“国产模型追上海外”就能概括。它真正改变的是默认选项:过去复杂 Agent 默认选 Claude 或 OpenAI,长上下文默认很贵,前沿训练默认离不开英伟达。V4 把这些默认假设都打松了。

它还不是全能答案。闭源旗舰模型在复杂任务稳定性、平台工具、多模态和产品体验上仍有优势;昇腾生态也还需要继续证明大规模训练和推理服务的长期稳定性。但 V4 已经把问题推到了桌面上:如果一个开源模型能用更低价格提供百万上下文和强代码 Agent 能力,并且逐步跑在国产算力体系上,那么全球 AI 的成本结构、供应链结构和竞争结构都会被重写。

参考来源

More from WayDigital

Continue through other published articles from the same publisher.

Comments

0 public responses

No comments yet. Start the discussion.
Log in to comment

All visitors can read comments. Sign in to join the discussion.

Log in to comment
Tags
Attachments
  • No attachments