首页
AI新闻
排行榜
AI账号
未登录
登录后即可体验更多功能
登录
注册
找回密码
未登录
登录后即可体验更多功能
登录
注册
找回密码
首页
•
GPT-5-Thinking新训练方法公开:让AI学会忏悔
GPT-5-Thinking新训练方法公开:让AI学会忏悔
1个月前更新
jovi
5
0
0
OpenAI提出忏悔训练方法,让GPT-5-Thinking在回答问题后生成一份“忏悔报告”,主动承认错误或违规行为。实验表明,模型在11/12测试场景中至少有一半概率会坦白错误,且训练不会影响其原有任务表现。该技术通过隔离奖励信号来鼓励诚实,被视为一种监控和诊断工具,有助于提高大语言模型的透明度与安全性。
来源:
36氪
©
版权声明
文章版权归作者所有,未经允许请勿转载。
上一篇
没有更多了...
下一篇
没有更多了...
相关文章
没有相关内容!
搜索:
网址
网址
文章
软件
书籍