首页 国内 国际 社会 军事 科技 财经 体育 娱乐
首页 采集科技文章 返回首页

MiniMax发长文回应“模型无法说出马嘉祺”|词表|实验|新论文|token|minimax|马嘉祺(歌手)

5月9日,MiniMax官微发长文回应M2系列模型无法说出马嘉祺一事,提供了对“嘉祺识别”问题的完整排查过程和技术思考。

MiniMax表示,其从分词器版本对齐、embedding统计分布、语义近邻检索、预训练与后训练模型的few-shot对比实验、后训练数据频次统计以及对全词表lm_head变化幅度的排序扫描等多个维度进行了排查。最终定位到的原因是:“嘉祺”在分词器中被合并为一个独立token,但该token在后训练数据中出现频次极低,导致模型在后训练中逐渐遗忘了对该token的生成能力。

修复方案方面,MiniMax构造了一份覆盖全词表的合成数据,核心思想是:通过一个简单的复读任务,为全词表建立一个生成频率的“下限保障”,防止任何token因为完全缺失而退化。此外,MiniMax表示,将token覆盖度作为后训练数据质量的一项常规监控指标,可以在早期发现潜在的稀疏token退化风险,避免类似问题在线上复现。

📚 相关阅读

• 人形机器人赛道出圈 AI 机床落地提速 高端增量订单锚定核心下游 | 直击 CCMT2026|五轴|ccmt
• 马斯克称考虑取消投资,墨西哥总统回击:说这话太草率|洛佩斯|特斯拉|唐纳德·特朗普|埃隆·马斯克
• 工信部原副部长苏波:2030年新能源汽车市场渗透率预计超过70%|电动汽车|汽车产业
• 工信部启动人工智能科技伦理审查与服务先导计划 加快推动审查工作落地实施
• 无人配送行业首个运营级AI智能体NeoClaw上线;滴滴清明假期AI打车需求上涨86%|未来商业早参|无人车|滴滴出行|知名企业
• 12万部AI漫剧陷入存量厮杀,破亿率不足0.12%!这家公司砸出1亿元、签约千名“AI导演”能否破局?|ip|原创|短剧|侯晓楠|阅文集团|ai漫剧|ai导演|知名企业