AI新闻

已选标签:
多模态AI
数学突破
12月 11日
20 条新闻
20:00

高通万卫星:混合AI与分布式协同是未来 | MEET2026

高通万卫星:混合AI与分布式协同是未来 | MEET2026

高通公司AI产品技术中国区负责人万卫星在MEET2026智能未来大会上指出,产业正从生成式AI向智能体AI演进。终端侧AI正在从单一模态向全模态交互发展,并面临内存限制、带宽瓶颈与功耗控制等挑战。高通通过量化压缩、并行解码技术和异构计算架构等手段应对这些挑战。未来,混合AI与分布式协同将成为趋势,实现跨设备的个性化服务。

来源:量子位

19:55

昔日开源霸主承认蒸馏阿里千问,世界进入中国AI时间

昔日开源霸主承认蒸馏阿里千问,世界进入中国AI时间

阿里巴巴千问Qwen开源模型在性能和生态指标上全面超越Meta的Llama系列,成为全球最强开源AI模型。Qwen支持多模态处理及119种语言,广泛应用于硅谷核心领域及全球开发者社区,显示出中国开源技术在全球化市场中的认可度。阿里的全栈AI布局推动了其商业化成功,并引领全球AI开源生态的结构性重塑。

来源:36氪

19:55

Meta新AI大模型“牛油果”有望明年一季度发布,使用阿里Qwen模型蒸馏学习

Meta 正在开发代号为“牛油果”的新AI模型,采用阿里巴巴Qwen等第三方模型进行蒸馏优化,计划以闭源形式发布。该项目由新任首席AI官Alexandr Wang领导,旨在提升复杂推理和跨模态生成能力。面对高昂的研发成本及市场压力,扎克伯格正推动公司战略转向可变现的人工智能模型研发。

来源:36氪

19:55

何恺明NeurIPS 2025演讲盘点:视觉目标检测三十年

何恺明NeurIPS 2025演讲盘点:视觉目标检测三十年

NeurIPS 2025 颁发「时间检验奖」给《Faster R-CNN》,表彰其在计算机视觉领域,特别是目标检测方面的里程碑式贡献。该论文自2015年发表以来,奠定了现代目标检测框架的核心范式,推动了视觉智能的发展。何恺明的演讲回顾了从手工特征到深度学习模型(如AlexNet、R-CNN系列)再到Transformer架构的演变历程,强调了技术革新如何解决复杂场景下的挑战,并展望了未来计算机视觉领域的探索方向。

来源:36氪

19:54

倒反天罡,Meta抄阿里千问作业,没拿授权

倒反天罡,Meta抄阿里千问作业,没拿授权

Meta在研发新大模型“牛油果”时,采用阿里云通义千问开源模型进行微调优化,标志着中国AI技术在全球范围内影响力增强。面对Llama 4表现不佳及与竞争对手差距拉大的挑战,Meta转向闭源专有路线,计划于2026年发布性能对标GPT-5的‘牛油果’。此转变反映了AI领域内从开源到闭源策略的调整趋势,以及中国AI企业崛起对全球格局的影响。

来源:36氪

18:51

2025年,那些跨界机器人的造车势力

2025年,那些跨界机器人的造车势力

多家车企在广州国际汽车展上展示人形机器人产品,预示着汽车行业正加速布局具身智能领域。背后驱动因素包括市值增长需求、生产力提升渴望及技术复用可能性。AI大模型的应用使得机器人在智能决策与高精度操作方面展现潜力。然而,资金压力、技术门槛以及数据积累仍是挑战。随着标准化进程推进,车企有望通过内部使用和合作方式逐步降低研发成本,推动机器人向消费级场景渗透。

来源:36氪

18:51

Meta大转向:下一代模型“牛油果”推迟,开源时代或将终结

Meta大转向:下一代模型“牛油果”推迟,开源时代或将终结

Meta调整AI战略,推迟至2026年一季度发布下一代模型Avocado,并转向闭源模式。此举标志着Meta从开源生态向更具防御性和商业导向策略的转变。为支持闭源模型,Meta增加资本支出至700-720亿美元,重点投向训练集群与数据中心扩建。组织层面,FAIR与GenAI影响力减弱,新成立的MSL强调产品落地与闭环速度。硬件方面,Meta削减元宇宙预算,资源重心转向AI相关设备。整体上,Meta正构建一个更封闭、集中且以商业结果为导向的AI体系。

来源:36氪

18:51

张亚勤院士:基础大模型最终不超过10个,十年后机器人比人多

张亚勤院士:基础大模型最终不超过10个,十年后机器人比人多

张亚勤在MEET2026智能未来大会上提出,新一轮人工智能是信息、物理和生物智能的融合。ChatGPT与DeepSeek代表了从鉴别式AI向生成式及推理式AI的转变,预示着高效率、低成本和开源生态下的快速落地。未来5-10年将步入“智能体互联网”时代,基础大模型类似操作系统,全球主要玩家不超过十家,智能体将成为企业和个人交互的新形态,并推动AGI发展。

来源:36氪

18:50

马斯克警告:AI将让我们集体“退休”,在火星上生活要比想象中更残酷

马斯克警告:AI将让我们集体“退休”,在火星上生活要比想象中更残酷

埃隆·马斯克在访谈中预测,随着AI与机器人技术的发展,未来人类或将进入无需为工作担忧的时代。他强调了AI和机器人将承担所有生产和服务任务的可能性,并表达了对AI快速发展可能带来的风险的担忧。此外,马斯克还讨论了关于火星殖民、信息筛选的重要性以及个人安全考量等议题,勾勒出一幅充满挑战与机遇并存的未来图景。

来源:36氪

18:50

Meta闭源转向:巨头的求生与AI行业的范式重构

Meta闭源转向:巨头的求生与AI行业的范式重构

Meta宣布以143亿美元收购团队并重组实验室,押注闭源模型Avocado,计划融合谷歌Gemma、OpenAI gpt-oss与阿里通义千问的技术亮点。此举标志着Meta从开源转向闭源,旨在解决盈利难题及满足核心行业对数据安全的需求。尽管面临兼容性和知识产权等挑战,但这一转型预示着AI行业进入‘开源铺路、闭源掘金’的新阶段,强调了商业变现的重要性。

来源:36氪

18:50

商汤方舟SenseFoundry平台全面升级,要打造下一代城市智能底座|最前线

商汤科技发布升级版视觉AI平台“商汤方舟”,通过“通专融合”与“智训闭环”体系,革新算法生产模式,实现高效部署和低成本维护。新平台支持多模态大模型调度,推动城市治理智能化转型,并已在交通、文旅等多个领域规模化应用。其技术突破不仅提升了视觉理解能力,还能进行智能决策,加速产业智能化进程。

来源:36氪

18:50

GPT在模仿人类?Nature发现:大脑才是最早的Transformer

GPT在模仿人类?Nature发现:大脑才是最早的Transformer

最新Nature研究揭示GPT的层级结构与人脑处理语言的时间序列惊人一致,表明理解语言可能基于预测而非解析。实验通过对比GPT-2和Llama-2模型与大脑电活动,发现模型深层结构与大脑高阶语义区高度对应,挑战了传统语言学规则。这不仅改变了我们对语言本质的理解,还强调了AI模型在模拟人类认知过程中的潜力。

来源:36氪

17:48

当AI手机开始“越权”:豆包的颠覆体验,动了谁的奶酪?

当AI手机开始“越权”:豆包的颠覆体验,动了谁的奶酪?

豆包AI手机通过将智能体嵌入操作系统底层,实现了跨应用操作和一键托管功能,显著提升了用户体验。其端侧记忆功能使手机具备了长期记忆能力,能够处理复杂模糊的指令并规划一系列操作。然而,该技术面临来自互联网企业的封禁挑战,主要源于对用户意图与平台逻辑之间的冲突。尽管存在障碍,AI驱动体验重构的趋势不可阻挡,预计2025年全球AI手机渗透率将达到32%。

来源:36氪

16:47

MiniMax 闫俊杰和罗永浩四小时访谈:走出中国AI的第三条路,大山并非不可翻越

MiniMax 闫俊杰和罗永浩四小时访谈:走出中国AI的第三条路,大山并非不可翻越

MiniMax 创始人闫俊杰强调,AI 模型本身才是产品核心,而非传统意义上的功能堆砌。在资源受限情况下,MiniMax 通过创新算法和机制优化,如 MoE 架构、线性注意力机制及交错思维等,实现了多模态模型的全球领先地位。面对中美技术差距,MiniMax 采用非共识路径,坚持技术驱动与开源策略,为 AGI 探索开辟新路。

来源:36氪

16:46

蹭豆包手机热度?智谱AutoGLM开源,AI手机终于起风了

蹭豆包手机热度?智谱AutoGLM开源,AI手机终于起风了

智谱开源其核心AI Agent模型AutoGLM,推动AI手机行业进步。AutoGLM作为GUI-Agent,能直接理解屏幕内容并自主规划操作路径,解决了传统方案依赖无障碍标签的问题。尽管面临权限争议,但AutoGLM的开源促进了AI技术在手机上的应用,预示着未来手机生态将从’品牌+系统’转变为’品牌+系统+AI’的新格局,标志着AI手机时代的到来。

来源:36氪

16:46

卡内基跨学科团队利用随机森林模型,基于406份样本成功捕捉33亿年前生命遗迹

卡内基跨学科团队利用随机森林模型,基于406份样本成功捕捉33亿年前生命遗迹

美国卡内基科学研究所联合全球多所院校,利用热解气相色谱-质谱与监督机器学习技术融合,成功在复杂分子碎片中识别古老生命遗迹。该方法通过分析406份样本,涵盖现代至38亿年前的生物与非生物来源,实现了对太古代岩石中生物成因分子组合的精准分类,为早期地球生态系统研究提供了新工具。实验表明,此模型在区分现代有机物与陨石/化石有机物方面达到100%准确率,且在未知样本测试中亦表现出色。

来源:36氪

15:44

MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这

MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这

MEET2026智能未来大会聚焦AI最新进展,探讨从基础大模型到多模态融合、从生成式AI到具身智能的发展趋势。专家们认为,未来5-10年,基础大模型将收敛至不超过10个,智能体将成为主流交互形态。百度展示了GenFlow和OREATE AI等超级智能体应用,而智源研究院则强调了多模态学习的重要性。此外,高通分享了混合AI技术在终端侧的应用潜力,亚马逊云科技提出Agent构建框架,推动AI向更广泛领域渗透。

来源:36氪

15:16

MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这

MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这

MEET2026智能未来大会汇聚了近1500名线下观众和350万+线上观众,聚焦AI的最新进展与趋势。专家们讨论了生成式AI向智能体演化的趋势、多模态模型的重要性以及AI在终端侧的应用挑战。百度、高通等企业展示了其在超级智能体、端侧大模型部署等方面的创新成果。同时,大会还探讨了AI在企业级应用中的规模化、成本效率和精度要求,强调了开源开放对于推动AI技术进步的关键作用。

来源:量子位

15:03

IDC MarketScape: 容联云位居“中国AI赋能的联络中心”领导者类别

IDC MarketScape: 容联云位居“中国AI赋能的联络中心”领导者类别

IDC报告确认容联云为中国AI赋能联络中心领导者,其‘容犀AICC大模型客户体验联络中心’融合大模型与小模型能力,提供全渠道接入、全信创智能服务。容联云具备自主研发的AI和大模型技术(如金融行业的赤兔大模型),支持深度集成第三方系统,强调产品稳定性和灵活性。通过将通讯、数据与智能相结合,容联云为多行业提供智能化解决方案。

来源:量子位