21:36
Ilya刚预言完,世界首个原生多模态架构NEO就来了:视觉和语言彻底被焊死

NEO,全球首个开源原生多模态架构,由商汤科技与南洋理工大学等联合研发。它通过三大创新技术——原生图块嵌入、三维旋转位置编码及多头注意力机制,实现了视觉与语言的深度融合,仅用十分之一训练数据即在多项评测中追平甚至超越GPT-4V等顶级模型。NEO展示了下一代AI竞争力的关键在于架构创新而非单纯规模扩大,并且其高效性能和较低成本使得强大的多模态能力可普及至边缘设备,如手机、机器人等。














