IDC知识库
IDC领域专业知识百科平台

DeepSeek新发布的V3.1惊现神秘“极”字bug

上周三,DeepSeek开源了新的基础模型,但不是万众期待的V4,而是V3.1-Base,而更早时候,DeepSeek-V3.1就已经上线了其网页、App端和小程序。

不过,经过这差不多一周时间的真实用户测试,DeepSeek-V3.1却上演了bug大秀,让全网热议纷纷。

DeepSeek 最新版 V3.1 被多名开发者实测发现,会在完全不该出现的地方插入「极 / 極 / extreme」等 token。

`time.Second` 变成 `time.Se 极`,版本号 `V1` 变 `V 极`。更糟的是,这个问题不仅出现在第三方量化部署,连官方全精度也会复现,影响真实编码流程。

开源社区用户给出多组复现场景:在 Go 等语言生成里,模型会把词元「粘」到标识符中,`Second` 前随机插入「极/極/extreme」,即便是 `top_k=1, temperature=1` 的保守解码也躲不过。

有人起初怀疑是极低比特量化或校准数据集边缘效应所致,但随后在其它网站的 FP8 全精度 版本也复现了相同问题,说明并非单纯部署层事故。

若是开发者们没有细看,直接用了生成的代码,就会导致编译不通过等情况,可以说是对需要高精度、结构化输出的场景是致命一击。

截至目前,大家已经统一将问题的矛头指向了 DeepSeek V3.1 模型本身,CodeBuddy询问后回复称,已经和DeepSeek团队取得联系,将在最近的一个版本中进行修复。

赞(0)
分享到: 更多 (0)

中国专业的网站域名及网站空间提供商

买域名买空间