首页
AI新闻
排行榜
AI账号
未登录
登录后即可体验更多功能
登录
注册
找回密码
未登录
登录后即可体验更多功能
登录
注册
找回密码
首页
•
DeepSeek-V3.2被找出bug了:疯狂消耗token,答案还可能出错,研究人员:GRPO老问题没解决
DeepSeek-V3.2被找出bug了:疯狂消耗token,答案还可能出错,研究人员:GRPO老问题没解决
1个月前更新
jovi
30
0
0
DeepSeek-V3.2在复杂任务中表现出色,但存在token浪费问题。研究指出其GRPO算法存在长度偏见和难度偏见,导致模型生成冗长且不准确的回答。尽管DeepSeek已修正了难度偏见,长度偏见仍待解决。考虑到成本效益,DeepSeek-V3.2的价格优势显著,但128K上下文限制影响了进一步优化。
来源:
36氪
©
版权声明
文章版权归作者所有,未经允许请勿转载。
上一篇
没有更多了...
下一篇
没有更多了...
相关文章
没有相关内容!
搜索:
网址
网址
文章
软件
书籍