刚刚，腾讯姚顺雨团队首个成果发布，揭示大模型真正瓶颈

4周前发布 jovi

腾讯混元团队发布CL-bench，专门评测大语言模型从上下文中学习新知识的能力。研究显示当前SOTA模型在这方面表现不佳，平均任务解决率仅为17.2%。CL-bench通过500个复杂上下文任务，要求模型在解决每个任务时必须从上下文中学习并应用新知识。这标志着大模型需要从静态记忆向动态学习转变。

🔗 [项目主页]：www.clbench.com

来源：36氪

文章版权归作者所有，未经允许请勿转载。

没有相关内容!