13:26
小米打通智驾和具身大模型,然后开源了

小米陈龙团队开源了全球首个打通自动驾驶与具身智能的跨领域基座模型MiMo-Embodied,基于MiMo-VL架构,通过高质量数据集和四阶段训练策略,实现了在29个Benchmark上的SOTA性能。该模型采用ViT编码视觉输入、MLP作为投影器及LLM进行文本理解与推理,有效解决了室内操作与户外驾驶之间的知识迁移难题,并展示了在复杂机器人和自动驾驶场景中的卓越部署能力。










