首页 国内 国际 社会 军事 科技 财经 体育 娱乐
首页 采集科技文章 返回首页

姚顺雨首秀交卷 腾讯能否凭混元3.0能否后来居上?|腾讯云|知名企业|preview

《科创板日报》4月23日讯(记者 李佳怡)姚顺雨腾讯首秀亮相,AI新一轮竞赛开打。

4月23日,腾讯正式发布并开源新一代大模型混元3.0(Hy3 preview)。据了解,这是一个快慢思考融合的混合专家模型,总参数295B,激活参数21B,最大支持256K上下文长度。

腾讯方面表示,这是混元重建后训练的第一个模型,也是混元迄今最智能的模型。“在复杂推理、指令遵循、上下文学习、代码、智能体等能力及推理性能上实现了大幅的提升。”

在混元3.0发布前后不到一周时间里,阿里推出Qwen3.6-Max-Preview预览版,DeepSeek V4的最新动态也引发市场高度关注,国产AI竞赛战事正在升温。

▎姚顺雨亲自操刀,混元大模型踏出重建第一步

此前,在国内互联网巨头中,腾讯在大模型上的步伐相对迟缓。而自前OpenAI研究员姚顺雨正式出任腾讯首席AI科学家后,腾讯的AI节奏显著提速。

此次发布并开源的混元3.0,也正是姚顺雨加入后,腾讯在大语言模型领域交出的首份完整答卷。

《科创板日报》记者了解到,今年2月,腾讯混元在姚顺雨的带领下,重建了预训练和强化学习的基础设施,确立了并模型追求实用性的三个原则,包括能力体系化、评测真实性以及性价比追求。

腾讯方面向《科创板日报》记者强调:“混元Hy3 preview是混元重建后训练的第一个模型,也是混元迄今最智能的模型。

资料显示,腾讯混元Hy3 preview采用快慢思考融合的混合专家架构,总参数295B,激活参数21B,最大支持256K上下文长度。相比前代,模型在上下文学习、指令遵循以及复杂推理等能力上有所提升。其中,代码生成与智能体任务是此次新模型改进最明显的方向,也是腾讯今年以来重点投入的领域。

在产品落地层面,混元3.0实现了腾讯全系产品的快速接入。目前已在元宝、CodeBuddy、WorkBuddy、QQ、QQ浏览器、腾讯文档、腾讯乐享等首发上线,微信公众号、和平精英、腾讯新闻等十余个核心产品也在陆续接入中。

此外,模型也同步支持接入OpenClaw、OpenCode、KiloCode等主流开源智能体产品,并上架腾讯云大模型服务平台TokenHub。

值得一提的是,面对近期持续波动的Token市场价格,腾讯在成本方面也打出了一张颇具吸引力的牌。


在腾讯云大模型服务平台 TokenHub 上,Hy3 preview 输入价格最低1.2元/百万tokens,输入命中缓存价格0.4元/百万tokens,输出价格最低4元/百万tokens。同时,腾讯云联合混元推出定制的Hy3 preview Token Plan套餐,个人版定价最低28元/月。

腾讯方面对此解释道:“得益于模型和推理框架上的深度协同,以及在推理框架、算子性能、量化算法等全方面优化,整体推理效率提升40%,Hy3 preview的成本相比上一代模型大幅下降。”

姚顺雨也发声为混元3.0站台,其表示,Hy3 preview是混元大模型重建的第一步。

姚顺雨称,希望通过这次开源和发布,获得来自开源社区和用户的真实反馈,帮助我们提升 Hy3正式版的实用性。与此同时,也在继续扩大预训练和强化学习的规模,提升模型的智能上限,并通过与腾讯众多产品的深度Co-Design,持续提升模型在真实场景中的综合表现,并开始探索特色模型能力。

▎前有阿里、后有DeepSeek:新一轮国产AI竞赛开打

有趣的是,混元3.0的发布时间,恰好落在国内大模型竞争的一个密集节点。

就在4月20日,阿里率先发布新一代千问旗舰模型的早期预览版Qwen3.6-Max-Preview。据悉,Artificial Analysis最新榜单显示,该模型超越了GLM5.1、MiniMax-M2.7等产品,一举登顶“最佳国产模型”。

两天后的4月22日晚,阿里又迅速同步开源了270亿参数体量的Qwen3.6-27B。目前,该模型已在魔搭社区和Hugging Face开源,用户可在Qwen Studio体验新模型,或是通过阿里云百炼调用模型API服务。

另一侧,备受瞩目的DeepSeek V4的发布窗口一再推迟,原定2026年农历新年后上线的计划已后延至4月下旬仍未见具体落地。

据媒体报道,DeepSeek V4为预计参数规模达万亿级、支持百万token上下文的多模态开源模型,正全力适配华为昇腾芯片,并通过CANN框架完成核心代码重写。

有分析认为,DeepSeek工程团队从CUDA向华为昇腾的迁移,不仅关乎一家模型的发布节奏,更是中国AI技术体系“自主可控”的一次压力测试。

目前来看,国产AI战场已呈现出较为清晰的竞争格局,阿里以Qwen3.6-Max-Preview的标杆性能和Qwen3.6-27B的开源生态抢占阵地,腾讯借混元3.0的性价比优势切入市场,而DeepSeek则以全栈国产化的姿态,为中国AI探索一条脱离CUDA依赖的技术路径。

与此同时,2026年的国产大模型竞赛已从单纯的参数比拼转向真实场景的落地效率。智能体编程、成本控制、自主算力路径等,也正在成为衡量模型核心竞争力的新标尺。

而腾讯混元3.0此番高调亮相,既是姚顺雨加盟后的首次成果检验,也是腾讯试图扭转“AI动作慢”市场印象的关键一役。

从参数指标和定价策略看,混元3.0较前一代确有明显进步,但其能否经受住真实场景的考验、在激烈竞争中站稳脚跟,仍有待更大范围的用户反馈来验证。

对腾讯而言,追赶才刚刚开始。

📚 相关阅读

• 长安天枢智能机器人公司完成工商登记|长安汽车|知名企业
• 美“天鹅座”货运飞船抵达国际空间站|太空|航天局|宇航员
• 俄科学家研制出呼吸疾病检测仪|糖尿病|心力衰竭
• 芯原股份:正受益于ASIC定制化浪潮 已形成多种策略应对产能供应挑战|直击业绩会|晶圆厂|asic|先进制程
• 碰撞后散架?小鹏汽车 法务部回应|汽车法务部
• 广东:大力推动人工智能高质量发展和全域全时全行业应用|广东省|先进制造业