DeepSeek V4终于出场，为大模型国产算力时代做准备|黄仁勋|上下文|新模型|deepseek

📰 谷德专业资讯网 ⏰ 2026-04-24 16:48 👁 10984 阅读

界面新闻记者 | 伍洋宇
界面新闻编辑 | 文姝琪

DeepSeek-V4的出场氛围从春节起就开始烘托。起初不少人的期盼是再续神话，但直到这一刻行业意识到，它应该进入了一个新的周期。

4月24日，DeepSeek-V4的预览版本正式上线并同步开源，官方给出的节点定义是“迈入百万上下文普惠时代”，没有脱离DeepSeek自出圈以来最强势的价格叙事。

DeepSeek-V4按参数大小分为1.6T（Pro）和284B（Flash）两个版本，拥有百万字超长上下文，在Agent能力、世界知识和推理性能上实现国内与开源领域的领先。

DeepSeek将V4与海外“御三家”Opus 4.6 Max、GPT-5.4 xHigh和Gemini-3.1-Pro High进行对比，从图表上看不出明显落后与领先，算是并驾齐驱的水平。这并非Anthropic和OpenAI的最新成果，不过团队显然很难预料到Opus 4.7和GPT-5.5的发布节点。

图自DeepSeek

团队的测评文档写得十分克制。在Agentic Coding评测中，V4-Pro达到开源模型最佳水平，“据评测反馈使用体验优于Sonnet 4.5，交付质量接近Opus 4.6非思考模式，但仍与Opus 4.6 思考模式存在一定差距。”

结构创新仍是DeepSeek的强项，其一百万长上下文的能力标签正得益于此。

V4此次再创了新的注意力机制，团队在token维度进行压缩，结合DSA稀疏注意力（DeepSeek Sparse Attention），在实现更强长上下文能力的同时，相比于传统方法大幅降低了对计算和显存的需求。

此外，外界罕见从DeepSeek的官方表述中看到模型对产品趋势的配合。V4针对Claude Code 、OpenClaw、OpenCode、CodeBuddy等主流Agent产品均进行了适配和优化。另外，其最新上线的API服务中，同步支持了OpenAI ChatCompletions接口与Anthropic接口。

与上一代模型相比，DeepSeek-V4一个重要区别在于释放了更多国产化信号。

根据其技术报告，V4在训练和推理体系中采用了mxFP4精度，而英伟达训练体系主要以FP8为主。一名行业人士指出，这可以更大程度适配华为昇腾、壁仞科技等国产算力。

V4也在技术报告中专门提及了，“在英伟达GPU和华为昇腾NPU两个平台上验证了细粒度EP（专家并行）方案，与强力的非融合（non-fused）基线相比，该方案在通用推理任务中实现了1.50-1.73倍加速；在对延迟敏感的场景（例如强化学习（RL）rollout 和高速 Agent 服务）中，最高可达1.96倍加速。”这是团队首次在类似文件中对国产算力验证情况进行披露。

并且，在DeepSeek-V4官方发布信息中，团队在价格图表下方用小字明确标注，“受限于高端算力，目前Pro的服务吞吐十分有限，预计下半年昇腾950超节点批量上市后，Pro的价格会大幅下调。”

图自DeepSeek

DeepSeek V4发布节点多次延后，“最初计划的确是在春节附近，大概经历了3-4次延期。”一名知情人士表示。

V4和目前行业公认的顶尖模型存在差距，团队对此也有清晰认知。一名接近DeepSeek人士告诉界面新闻记者，V4训练完成时，内部很清楚大约是Opus 4.5或GPT-5.3 Code X水平，发布延期的部分原因也在于团队还想再追一追。

不过，一名研究人员表示，尽管性能还不是最强，但DeepSeek V4对开源社区仍具有重要意义，“好的模型不再开源了，这应该是当前开源社区最好的模型。”

DeepSeek V4发布之外，这家历史上从不融资的公司，其融资事宜成为近期市场关注重点。前述知情人士表示，DeepSeek方面曾在融资方面明确对标Minimax。

界面新闻记者获悉，今年春节前后，有投资人曾以300亿美元估值接触DeepSeek，但随后MiniMax股价进入了一段时间飞涨，大幅超过300亿美元，交易最终没能落地。“所以最近100亿美元估值的传闻不准确，从第一天起他们的报价就不低于MiniMax。”

英伟达CEO黄仁勋在近期一场视频播客采访中，曾对中国大模型所经受的算力限制作过回应。采访人提出疑问，中国算力芯片在制程等技术和性能方面仍然受限，是否就意味着模型厂商难以训练出能够超过Claude或GPT的模型。

黄仁勋的看法是，中国只是在芯片性能上受限，但在芯片规模和能源基础上完全没有，模型厂商可以用更多芯片和足够电力来弥补这一短板，并且当前AI大模型的瓶颈并不仅仅体现在硬件上，算法创新仍然参与主导AI性能的提升，而中国具备大量相关的AI顶尖人才。

“DeepSeek首次在华为（芯片）上线的那一天，对我们国家来说会是一个可怕的结果。”黄仁勋说。

本文标签：科技 AI 投资芯片

DeepSeek V4终于出场，为大模型国产算力时代做准备|黄仁勋|上下文|新模型|deepseek

2024全国两会

科技创新前沿

经济发展报告

DeepSeek V4终于出场，为大模型国产算力时代做准备|黄仁勋|上下文|新模型|deepseek

📚 相关阅读

2024全国两会

科技创新前沿

经济发展报告