首页 国内 国际 社会 军事 科技 财经 体育 娱乐
首页 采集科技文章 返回首页

DeepSeek V4终于出场,为大模型国产算力时代做准备|黄仁勋|上下文|新模型|deepseek

界面新闻记者 | 伍洋宇
界面新闻编辑 | 文姝琪

DeepSeek-V4的出场氛围从春节起就开始烘托。起初不少人的期盼是再续神话,但直到这一刻行业意识到,它应该进入了一个新的周期。

4月24日,DeepSeek-V4的预览版本正式上线并同步开源,官方给出的节点定义是“迈入百万上下文普惠时代”,没有脱离DeepSeek自出圈以来最强势的价格叙事。

DeepSeek-V4按参数大小分为1.6T(Pro)和284B(Flash)两个版本,拥有百万字超长上下文,在Agent能力、世界知识和推理性能上实现国内与开源领域的领先。

DeepSeek将V4与海外“御三家”Opus 4.6 Max、GPT-5.4 xHigh和Gemini-3.1-Pro High进行对比,从图表上看不出明显落后与领先,算是并驾齐驱的水平。这并非Anthropic和OpenAI的最新成果,不过团队显然很难预料到Opus 4.7和GPT-5.5的发布节点。


图自DeepSeek

团队的测评文档写得十分克制。在Agentic Coding评测中,V4-Pro达到开源模型最佳水平,“据评测反馈使用体验优于Sonnet 4.5,交付质量接近Opus 4.6非思考模式,但仍与Opus 4.6 思考模式存在一定差距。”

结构创新仍是DeepSeek的强项,其一百万长上下文的能力标签正得益于此。

V4此次再创了新的注意力机制,团队在token维度进行压缩,结合DSA稀疏注意力(DeepSeek Sparse Attention),在实现更强长上下文能力的同时,相比于传统方法大幅降低了对计算和显存的需求。

此外,外界罕见从DeepSeek的官方表述中看到模型对产品趋势的配合。V4针对Claude Code 、OpenClaw、OpenCode、CodeBuddy等主流Agent产品均进行了适配和优化。另外,其最新上线的API服务中,同步支持了OpenAI ChatCompletions接口与Anthropic接口。

与上一代模型相比,DeepSeek-V4一个重要区别在于释放了更多国产化信号。

根据其技术报告,V4在训练和推理体系中采用了mxFP4精度,而英伟达训练体系主要以FP8为主。一名行业人士指出,这可以更大程度适配华为昇腾、壁仞科技等国产算力。

V4也在技术报告中专门提及了,“在英伟达GPU和华为昇腾NPU两个平台上验证了细粒度EP(专家并行)方案,与强力的非融合(non-fused)基线相比,该方案在通用推理任务中实现了1.50-1.73倍加速;在对延迟敏感的场景(例如强化学习(RL)rollout 和高速 Agent 服务)中,最高可达1.96倍加速。”这是团队首次在类似文件中对国产算力验证情况进行披露。

并且,在DeepSeek-V4官方发布信息中,团队在价格图表下方用小字明确标注,“受限于高端算力,目前Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调。”


图自DeepSeek

DeepSeek V4发布节点多次延后,“最初计划的确是在春节附近,大概经历了3-4次延期。”一名知情人士表示。

V4和目前行业公认的顶尖模型存在差距,团队对此也有清晰认知。一名接近DeepSeek人士告诉界面新闻记者,V4训练完成时,内部很清楚大约是Opus 4.5或GPT-5.3 Code X水平,发布延期的部分原因也在于团队还想再追一追。

不过,一名研究人员表示,尽管性能还不是最强,但DeepSeek V4对开源社区仍具有重要意义,“好的模型不再开源了,这应该是当前开源社区最好的模型。”

DeepSeek V4发布之外,这家历史上从不融资的公司,其融资事宜成为近期市场关注重点。前述知情人士表示,DeepSeek方面曾在融资方面明确对标Minimax。

界面新闻记者获悉,今年春节前后,有投资人曾以300亿美元估值接触DeepSeek,但随后MiniMax股价进入了一段时间飞涨,大幅超过300亿美元,交易最终没能落地。“所以最近100亿美元估值的传闻不准确,从第一天起他们的报价就不低于MiniMax。”

英伟达CEO黄仁勋在近期一场视频播客采访中,曾对中国大模型所经受的算力限制作过回应。采访人提出疑问,中国算力芯片在制程等技术和性能方面仍然受限,是否就意味着模型厂商难以训练出能够超过Claude或GPT的模型。

黄仁勋的看法是,中国只是在芯片性能上受限,但在芯片规模和能源基础上完全没有,模型厂商可以用更多芯片和足够电力来弥补这一短板,并且当前AI大模型的瓶颈并不仅仅体现在硬件上,算法创新仍然参与主导AI性能的提升,而中国具备大量相关的AI顶尖人才。

“DeepSeek首次在华为(芯片)上线的那一天,对我们国家来说会是一个可怕的结果。”黄仁勋说。

📚 相关阅读

• 魔法原子与无锡市公安局达成战略合作|人形|机器人|机器狗
• 2026年有望迎来盈亏平衡拐点 汇博机器人详解技术底座、商业战略与产品蓝图|全栈|人工智能|视障人士
• 充电涨价与“用油发电”关系不大 我国不存在大规模用油发电情况|风电|光伏|新型电力系统
• 雷克萨斯将在华生产全新纯电车型,并销往日本?官方:不予置评|新车|广汽丰田|豪华品牌
• 特斯拉目前没有在上海超级工厂量产人形机器人计划|上海市|知名企业|核心零部件|弗里蒙特工厂|特斯拉(公司)
• 觅蜂发布一站式物理AI数据服务平台|运营|平台型