article

DeepSeek-V4 与华为昇腾：一场从模型能力到国产算力的正面突破

深入分析 DeepSeek-V4 的模型能力、代码 Agent 能力、官方价格、华为昇腾国产算力路线，以及对 Claude、OpenAI、英伟达和全球 AI 产业的影响。

Published2026-04-24 05:44 UTC

Languagezh-CN

Regionglobal

DeepSeek-V4 与华为昇腾：一场从模型能力到国产算力的正面突破

DeepSeek-V4 最值得看的，不是又一个大模型刷新榜单，而是它把三件过去很难同时成立的事放在了一起：百万 token 上下文、接近顶级闭源模型的代码与 Agent 能力，以及明显低于海外旗舰模型的 API 价格。更关键的是，它背后牵出了一条正在成形的国产算力路线：华为昇腾、寒武纪等国产 AI 芯片不再只是“可替代”的备选项，而开始进入大模型训练、适配和推理服务的核心叙事。

DeepSeek-V4 官方性能图 — DeepSeek-V4 官方模型页中的性能图。来源：DeepSeek / Hugging Face。

DeepSeek-V4 先把模型能力做到了哪一步

DeepSeek-V4 分为两个版本：DeepSeek-V4-Pro 和 DeepSeek-V4-Flash。官方模型页显示，V4-Pro 是 1.6T 总参数、49B 激活参数的 MoE 模型；V4-Flash 是 284B 总参数、13B 激活参数的 MoE 模型。两者都支持 1M token 上下文。API 文档还列出最大输出为 384K token，并支持非思考模式和思考模式。

这组参数背后的重点不是“更大”，而是“更能跑长任务”。过去很多模型可以在短对话里表现很好，但一旦进入完整代码库、长文档、多轮工具调用、多文件修改，成本和稳定性都会迅速恶化。V4 的路线是把长上下文作为默认能力，而不是把它当成昂贵的展示功能。

官方模型页披露，DeepSeek-V4 使用了 CSA 与 HCA 结合的混合注意力机制，并配合 DSA 稀疏注意力来降低长上下文计算压力。在 1M token 场景下，DeepSeek 称 V4-Pro 的单 token 推理 FLOPs 只有 V3.2 的 27%，KV cache 只有 V3.2 的 10%。这解释了为什么 V4 能把百万上下文做成产品能力，而不是只停留在论文指标里。

DeepSeek-V4 长上下文与效率示意图 — DeepSeek-V4 长上下文与效率相关示意图。来源：DeepSeek 发布资料。

代码和 Agent：V4 真正想抢的是工作流

DeepSeek-V4 的一个明显变化，是不再只围绕问答和推理打磨，而是把代码 Agent 放到了更核心的位置。官方模型页提到，V4-Pro-Max 在 coding benchmark 上达到顶级水平，并显著缩小了与领先闭源模型在 reasoning 和 agentic tasks 上的差距。DeepSeek API 文档也提供 OpenAI 格式和 Anthropic 格式接口，这意味着它更容易被接入 Claude Code、OpenCode、OpenClaw、CodeBuddy 一类 Agent 工具链。

代码能力要分两层看。第一层是“会不会写代码”：函数实现、页面生成、脚本编写、单文件修复。第二层是“能不能完成工程任务”：读懂项目结构、跨文件修改、运行命令、根据错误回滚和继续推进。V4 的价值主要在第二层。百万上下文让它能吃进更多仓库、文档和日志；Agent 优化让它更愿意连续行动；较低价格让开发者可以承受更多轮尝试。

这也是它对 Claude Code、OpenAI Codex/Agents 体系构成压力的地方。Claude Code 强在产品完整度：终端、IDE、Web、桌面端、权限和 diff 流程都很成熟。OpenAI 强在平台工具链：Responses API、Agents SDK、Web search、containers、computer use 等能力更完整。DeepSeek-V4 的切入点不同：它把底层模型、开源权重、低价 API 和长上下文组合起来，让更多团队可以自己搭 Agent，而不是完全依赖闭源平台。

价格：这才是 V4 对行业最直接的冲击

DeepSeek 官方 API 定价以每 100 万 token 计算：

DeepSeek-V4-Flash：缓存命中输入 $0.028；缓存未命中输入 $0.14；输出 $0.28。
DeepSeek-V4-Pro：缓存命中输入 $0.145；缓存未命中输入 $1.74；输出 $3.48。

同一口径下，Anthropic 文档列出的 Claude Opus 4.7 为输入 $5、输出 $25；Claude Sonnet 4.6 为输入 $3、输出 $15。OpenAI 价格页列出的 GPT-5.4 为输入 $2.50、缓存输入 $0.25、输出 $15；GPT-5.5 虽然已经出现在价格页，但标注为 coming soon，因此不能当作已普遍可用模型来对比。

差距很直观：V4-Pro 的输出价格只有 Claude Sonnet 4.6 和 GPT-5.4 的一小部分；V4-Flash 则把成本压到更激进的位置。对企业来说，这不只是“便宜一点”。代码 Agent、长文档处理、客服知识库、投研分析、批量内容处理，都是 token 消耗极大的场景。价格下降一个数量级，会直接改变哪些应用值得做、哪些应用可以全天候跑。

华为昇腾：为什么它和 DeepSeek-V4 绑在一起重要

关于训练硬件，需要把事实说准确。DeepSeek 官方文档没有完整披露 V4 训练集群的硬件构成；但 36氪《智能涌现》报道称，V4 发布推迟与训练框架从英伟达迁移到华为昇腾有关，并提到 2025 年中出现过训练失败和重新适配芯片的问题。智东西也报道称，DeepSeek-V4 已经过华为昇腾、寒武纪等国产芯片适配优化，并提到 V4-Pro 当前受限于高端算力吞吐，预计下半年昇腾 950 超节点批量上市后价格会进一步下调。

这类信息不能写成“官方已经完整确认 V4 全部由昇腾训练”，但它足以说明一个趋势：DeepSeek-V4 已经成为国产算力能否承接前沿大模型训练与推理的关键样本。

昇腾的价值不只是一颗芯片。昇腾社区官网展示的产品和软件栈覆盖 Atlas 900 A3 SuperPoD 超节点、Atlas 800T/800I A3 超节点服务器、CANN 异构计算架构、MindSpore、PyTorch 适配、MindSpeed、MindIE、MindCluster 等组件。大模型成本的核心，不是单卡峰值，而是芯片、互联、编译器、通信库、训练框架、推理引擎和模型架构能否一起优化。

DeepSeek-V4 的低价逻辑正好对应这条链路。MoE 让每次推理只激活部分参数；CSA/HCA/DSA 降低百万上下文的计算和 KV cache 压力；国产算力一旦适配成熟，就有机会继续降低供应链和单位算力成本。模型架构负责“少算”，系统工程负责“算得稳”，国产芯片生态负责“算得起”。三者叠在一起，才是 V4 真正值得关注的地方。

对英伟达和全球 AI 产业的影响

DeepSeek-V4 加上昇腾路线，对英伟达不是立刻“替代”，而是更麻烦的事：它在削弱 CUDA 生态的唯一性。英伟达仍然有明显优势，包括 H100/H200/B200 等高端 GPU、成熟软件生态、全球云厂商支持、开发者习惯和工程稳定性。短期内，海外前沿实验室也不会因为一个 V4 就放弃英伟达。

但中国市场的逻辑已经变了。只要国产模型能在昇腾等国产算力上稳定训练、适配、推理，并且价格足够低，国内企业就会有越来越强的动力减少对英伟达高端卡的依赖。尤其在出口管制背景下，国产算力不是单纯的成本选择，也是供应链安全选择。

更大的影响在全球。过去外界常把前沿 AI 竞争简化为“谁有更多英伟达 GPU”。DeepSeek-V4 证明，模型架构、训练方法、推理效率、开源生态和本土芯片适配，同样可以改变竞争格局。它不会终结英伟达，但会逼迫全球市场重新定价英伟达的护城河：CUDA 仍强，但不再是唯一答案。

和 Claude、OpenAI 顶级模型相比，V4 的强弱很清楚

对 Claude：Claude Opus 4.7 和 Sonnet 4.6 仍然强在稳定的复杂推理、成熟产品体验和 Claude Code 的完整工作流。DeepSeek-V4 的优势是开源、便宜、1M 上下文和更容易私有化/国产化部署。要做现成的编码助手，Claude Code 仍然省心；要做可控、低成本、可替换的自建 Agent，V4 更有吸引力。
对 OpenAI：OpenAI 的优势在平台能力，尤其是工具调用、Agents SDK、容器、搜索、多模态和生态完整度。DeepSeek-V4 的优势在价格、开放权重和长上下文成本。对很多企业应用来说，V4 不一定每项能力都赢，但它可能让总成本明显下降。
对国内模型：V4 把价格、开源、长上下文和 Agent 能力同时拉高，等于重新抬高了国内模型的竞争门槛。后续国内厂商不能只做“接近某个榜单”，还要回答能不能低价稳定服务、能不能适配国产算力、能不能进入真实工作流。

结论：DeepSeek-V4 重要，因为它改变了默认选项

DeepSeek-V4 不是一句“国产模型追上海外”就能概括。它真正改变的是默认选项：过去复杂 Agent 默认选 Claude 或 OpenAI，长上下文默认很贵，前沿训练默认离不开英伟达。V4 把这些默认假设都打松了。

它还不是全能答案。闭源旗舰模型在复杂任务稳定性、平台工具、多模态和产品体验上仍有优势；昇腾生态也还需要继续证明大规模训练和推理服务的长期稳定性。但 V4 已经把问题推到了桌面上：如果一个开源模型能用更低价格提供百万上下文和强代码 Agent 能力，并且逐步跑在国产算力体系上，那么全球 AI 的成本结构、供应链结构和竞争结构都会被重写。

DeepSeek-V4 与华为昇腾：一场从模型能力到国产算力的正面突破

DeepSeek-V4 与华为昇腾：一场从模型能力到国产算力的正面突破

DeepSeek-V4 先把模型能力做到了哪一步

代码和 Agent：V4 真正想抢的是工作流

价格：这才是 V4 对行业最直接的冲击

华为昇腾：为什么它和 DeepSeek-V4 绑在一起重要

对英伟达和全球 AI 产业的影响

和 Claude、OpenAI 顶级模型相比，V4 的强弱很清楚

结论：DeepSeek-V4 重要，因为它改变了默认选项

参考来源

Comments