刚刚,腾讯姚顺雨团队首个成果发布,揭示大模型真正瓶颈

4周前发布 jovi
8 0 0

刚刚,腾讯姚顺雨团队首个成果发布,揭示大模型真正瓶颈

腾讯混元团队发布CL-bench,专门评测大语言模型从上下文中学习新知识的能力。研究显示当前SOTA模型在这方面表现不佳,平均任务解决率仅为17.2%。CL-bench通过500个复杂上下文任务,要求模型在解决每个任务时必须从上下文中学习并应用新知识。这标志着大模型需要从静态记忆向动态学习转变。

🔗 [项目主页]:www.clbench.com

来源:36氪

© 版权声明
广告也精彩

相关文章

没有相关内容!