首页 国内 国际 社会 军事 科技 财经 体育 娱乐
首页 采集科技文章 返回首页

万亿参数!美团新一代大模型与DeepSeek V4同日上线,全程依托国产算力集群|王兴|知名企业|deepseek

4月24日,《每日经济新闻》记者获悉,美团新一代基础大模型LongCat-2.0-Preview已经开放测试,该模型总参数规模突破万亿。据知情人士透露,DeepSeek同日发布的新一代V4大模型,其总参数量和激活参数量,与美团LongCat-2.0-Preview基本一致。

总参数量决定了大模型的知识容量上限及存储成本。据悉,LongCat-2.0-Preview和DeepSeek V4,均支持1M上下文窗口,可在单次推理中处理数百万字的输入,其处理量级等同于新发布的GPT-5.5。

记者了解到,美团新的LongCat模型还面向Agent(智能体)应用场景进行了深度优化,可有效适配代码生成、复杂任务规划、企业自动化等生产场景。

除参数规模外,美团新一代基础大模型的更大突破在于,其训练推理全程依托国产算力集群完成。

据上述人士透露,美团本次训练阶段动用的算力卡数量在5万至6万之间,这也是迄今为止,在国产算力上完成的规模最大的大模型训练任务。“不仅是对国产算力生态成熟度的一次有效验证,也标志着国产自主算力上迈出了关键一步。”该人士表示。

一年多前,美团CEO(首席执行官)王兴曾表示:“在AI人工智能)领域,美团唯一的策略是进攻。”在今年3月财报电话会上,美团CEO王兴对外透露,自2023年初以来,美团在资本支出和AI人才上进行了大规模投入,除云厂商外,可能是中国AI领域投入最大的公司之一,且投入已持续超过三年。他也表示,要“争取把美团App率先升级成为AI-Powered App”。

“美团正继续投入自研基座大模型LongCat,也在和当前行业顶尖的第三方大模型合作,致力于最精准地理解真实物理世界。同时率先推动主应用升级为AI驱动,以应对本地服务行业高度复杂的场景、海量碎片化信息及大量实时商家数据。”王兴表示。

值得一提的是,除自研外,美团还先后投资了摩尔线程、沐曦股份、紫光展锐、爱芯元智等多家算力及半导体公司,以及智谱AI、月之暗面等领先的大模型企业。

4月24日下午,美团已开放新模型测试,用户可通过其官网申请领取免费测试名额。官网介绍显示,测试期间,LongCat-2.0-Preview每天会给用户提供1000万免费Token(词元)额度。

📚 相关阅读

• 三星中国被曝大调整:黑白电、显示器淡出市场 保留手机和存储业务|市场份额
• 算力紧缺程度较高 机构称算力租赁厂商议价权有望提升|英伟达|数据中心
• 零跑D19正式上市,售价21.98万起|零跑汽车|零跑d19
• 续航达1500公里,宁德时代发布麒麟凝聚态电池|电池包|刀片电池
• AI早报 | Meta超级智能实验室首个AI模型亮相,转向闭源;OpenAI预计今年将实现25亿美元广告收入|机器人|人工智能|meta|agent|openai
• 智元酷拓董事、COO邱恒:四足机器人市场规模有望达千亿元级别,暂不考虑进入C端市场|智能化|智能机器人