最鲁棒的MLLM，港科大开源「退化感知推理新范式」

2个月前发布 jovi

针对多模态大语言模型（MLLMs）在真实世界视觉退化环境下的性能瓶颈，香港科技大学与西北工业大学等团队提出Robust-R1，通过构建显式结构化推理系统实现从‘抵抗干扰’到‘理解干扰’的范式转变。该系统使模型能够主动诊断并量化退化参数，分析其对图像语义的影响，并据此调整推理策略，显著提升了模型在自动驾驶、医疗影像等领域的鲁棒性和可解释性。

来源：36氪

文章版权归作者所有，未经允许请勿转载。

没有相关内容!

最鲁棒的MLLM，港科大开源「退化感知推理新范式」

没有更多了...

没有更多了...

相关文章