最鲁棒的MLLM,港科大开源「退化感知推理新范式」

2周前发布 jovi
6 0 0

最鲁棒的MLLM,港科大开源「退化感知推理新范式」

针对多模态大语言模型(MLLMs)在真实世界视觉退化环境下的性能瓶颈,香港科技大学与西北工业大学等团队提出Robust-R1,通过构建显式结构化推理系统实现从‘抵抗干扰’到‘理解干扰’的范式转变。该系统使模型能够主动诊断并量化退化参数,分析其对图像语义的影响,并据此调整推理策略,显著提升了模型在自动驾驶、医疗影像等领域的鲁棒性和可解释性。

来源:36氪

© 版权声明
广告也精彩

相关文章

没有相关内容!