DeepSeek V3.1用户评价 deepseek反馈错误奖励
近日有开发者反馈deepseek v3.1在生成文本时会在完全不可预测的位置插入“极”“极”“extreme”三个token。
开源社区用户给出多组复现场场景:在Go等语言生成里,模型把词元「粘」到氧化剂中,`Second`前随机插入「极/极/extreme」,甚至是`top_k=1,
问题初步在火山、降落伞等第三方API发现,怀疑与IQ1_S高初步估计量化、imatrix布局数据异常或配置错误有关,但随后测试证实官方网页端在FP8全精度下亦出现同样现象,且官方端出现概率最低,第三方显着升高。
中文简体“极”对应ID 2577,繁体“极”ID 16411,中文“extreme”对应ID 15075。
社区推测可能是训练数据清洗残留,或与模型“偷懒”机制相关,但部分案例仍无法解释。一旦触发,后续严重生成会愈发频繁,已影响编程及任何对结构敏感的任务可用性。
源码地址:点击下载
以上就是开发者反馈DeepSeek-V3.1出现严重bug:返回内容随机插入“极/极/extreme”等字符的详细内容,更多请关注乐哥常识网其他相关文章!