AI新闻

已选标签:
多模态AI
AI对话
12月 24日
8 条新闻
16:37

最鲁棒的MLLM,港科大开源「退化感知推理新范式」

最鲁棒的MLLM,港科大开源「退化感知推理新范式」

针对多模态大语言模型(MLLMs)在真实世界视觉退化环境下的性能瓶颈,香港科技大学与西北工业大学等团队提出Robust-R1,通过构建显式结构化推理系统实现从‘抵抗干扰’到‘理解干扰’的范式转变。该系统使模型能够主动诊断并量化退化参数,分析其对图像语义的影响,并据此调整推理策略,显著提升了模型在自动驾驶、医疗影像等领域的鲁棒性和可解释性。

来源:36氪

16:36

生成不遗忘,「超长时序」世界模型,北大EgoLCD长短时记忆加持

生成不遗忘,「超长时序」世界模型,北大EgoLCD长短时记忆加持

北大、中大等机构联合发布EgoLCD模型,借鉴人类长短时记忆机制,首创稀疏KV缓存+LoRA动态适应架构,有效解决长视频生成中的内容漂移问题。在EgoVid-5M基准测试中,EgoLCD在时间一致性和生成质量上全面超越现有主流模型,为构建具身智能世界模型迈出关键一步。

来源:36氪

16:36

“商汤系”跑出一堆独角兽,可闫俊杰无法复制

“商汤系”跑出一堆独角兽,可闫俊杰无法复制

商汤系AI创业公司MiniMax与Vivix AI凭借深厚的技术积累及产品落地经验,成为资本新宠。MiniMax通过模型和ToC产品并行布局,实现快速商业化,2025年前9个月收入达5343.7万美元。Vivix AI仅用10个月估值飙升至13.2亿美元。两家公司在多模态交互、大语言模型等领域展现强劲发展潜力,推动AI技术在智能助手、内容生成等应用领域的突破。

来源:36氪

15:34

AI战场缺一个腾讯系

AI战场缺一个腾讯系

腾讯正加速在大模型市场的布局,通过调整组织结构和引进关键人才如姚顺雨,以期在AI基础技术和应用层面取得突破。面对阿里与字节在AI应用层快速推进的压力,腾讯需加强其AI应用场景的拓展,特别是在电商、本地生活等领域,以元宝为纽带,整合微信生态内外资源,形成更强大的AI生态系统。

来源:36氪

14:32

中国下半年新上线AI应用共205个,流量规模上通用和垂类AI分庭抗礼

Quest Mobile发布的《2025下半年AI应用交互革新与生态落地报告》显示,中国下半年新上线AI应用共205个,其中,应用插件(In-App AI)占比达81.5%,PC端网页应用占比10.7%,原生App占比7.8%。AI图像处理与AI专业顾问是下半年热门赛道;AI搜索与AI综合助手虽已形成近7亿规模用户池,仍吸引新玩家突破性入局争夺流量入口。

最新统计周期内(12月8日至12月14日),周活跃用户规模Top10的AI APP中,有6个通用AI,4个垂类场景的专业AI,形成了通用和垂类AI分庭抗礼的格局。豆包的周活跃规模达到了1.55亿,DeepSeek、元宝分别为8156万、2084万。蚂蚁阿福App、灵光App周(12.08-12.14)活跃用户规模分别达1025.4万和295.2万,位列下半年新上线原生App第一、第二。(广角观察)

来源:钛媒体

12:28

YC 2025年度AI报告:Gemini崛起、Vibe Coding成熟,你需要更新的15个认知

YC 2025年度AI报告:Gemini崛起、Vibe Coding成熟,你需要更新的15个认知

Y Combinator最新一期播客总结了2025年AI行业趋势,Anthropic和Gemini在模型竞争中崛起,分别凭借优秀的代码编写能力和推理能力超越OpenAI。同时,AI基础设施泡沫预示着计算资源将更加廉价且充沛,为初创公司提供了更多机会。此外,Vibe Coding成为一种成熟的开发方式,垂直领域的小模型击败通用大模型,显示出专有数据的重要性。

来源:36氪

12:28

原地平线智能驾驶总裁创业机器人一年:9988元,养一只家里的“小狗哥”

原地平线智能驾驶总裁创业机器人一年:9988元,养一只家里的“小狗哥”

维他动力推出消费级四足机器狗“Vbot超能机器狗”,定位为家庭伙伴,具备全地形通过能力、自主跟随及多场景应用功能。该产品采用混合架构,云端大模型处理复杂语言理解与推理,端侧自研模型保障任务响应效率和弱网环境下的表现。其核心竞争力在于打造具有探索好奇心、生存欲及安全意识的自主智能体,旨在推动AI机器人在C端市场的普及。

来源:36氪

12月 18日
2 条新闻
10:52

谷歌推出最新人工智能模型双子座3 Flash

谷歌公司17日宣布推出最新人工智能模型双子座3 Flash。谷歌称,双子座3 Flash是其最新推出的兼具前沿智能与高速性能的模型,保留了双子座3在高级推理、视觉理解和交互式代码生成等方面的核心能力,同时显著提升了响应速度和成本效率,在多个标准评测中表现优异。据谷歌介绍,该模型性能超越了双子座2.5 Pro,速度提升约3倍,且运行成本远低于前代。在用于评估代理编码能力的专业基准测试中,其得分甚至超过了双子座3 Pro。(新华社)

来源:钛媒体

12月 15日
10 条新闻
12:25

OpenAI前CTO再创业,新产品Tinker宣布接入Kimi K2 Thinking

前OpenAI首席技术官Mira Murat离职后,率一批OpenAI旧将创办Thinking Machines Lab,据多家媒体报道,最新估值将达 500 亿美元。Mira Murat日前发文介绍,首款产品Tinker已正式全面开放,并新增万亿参数级推理模型Kimi K2 Thinking,Mira Murat表示,Kimi K2 Thinking是专为长时长推理和工具调用设计的“怪物级”模型,也是Tinker目前产品线中最大的模型。(广角观察)

来源:钛媒体

12:24

人人拥有AI科学家,一文读懂Deep Research的今生与未来

人人拥有AI科学家,一文读懂Deep Research的今生与未来

Deep Research 推动 LLM 从文本生成向知识发现转变,实现复杂开放式任务。该技术已被应用于科研、软件工程等领域,支持学术综述、实验执行等任务。研究将其划分为自主搜索、整合研究和全栈AI科学家三个阶段,涵盖查询规划、知识检索、记忆管理和答案生成四大核心组件。未来面临检索时机、记忆进化、训练算法及评估体系等挑战,需发展统一推理范式、标准化记忆系统及模块化框架以提升通用性和可靠性。

来源:36氪

12:24

OpenAI突然开源新模型,99.9%的权重是0,新稀疏性方法代替MoE

OpenAI突然开源新模型,99.9%的权重是0,新稀疏性方法代替MoE

OpenAI开源了一种名为Circuit Sparsity的新模型,该模型通过极大稀疏化(99.9%权重为零)实现了内部计算过程的高度可解释性,直接针对传统稠密Transformer模型的黑箱问题。与MoE模型相比,Circuit Sparsity追求的是原生稀疏性和任务功能解耦,尽管当前面临算力成本高的挑战,但其在提升AI可解释性方面展现出巨大潜力。

来源:36氪

12:24

AI御三家年终“火拼”

2025年人工智能领域竞争激烈,OpenAI发布GPT-5.2,强调专业知识处理能力与超长上下文记忆;Anthropic推出Claude 4.5,提升自主编程及工具操作稳定性;谷歌DeepMind发布Gemini 3,实现原生多模态融合。三者在推理、编程及智能体任务上均有显著进步,推动AI向更高效、多功能方向发展。

来源:36氪

12:16

苏州大学首篇数学四大刊!解决了40年未决的丢番图逼近问题

苏州大学首篇数学四大刊!解决了40年未决的丢番图逼近问题

苏州大学副教授张涵与国际合作者将数论中的辛钦定理推广至自相似测度,解决了40年未决的丢番图逼近问题。该成果不仅促进了数学领域的交叉研究,还为AI在处理复杂数据分布、优化算法及提升模型训练效率等方面提供了新思路,特别是在多模态融合和边缘计算等未来趋势中展现出巨大潜力。

来源:量子位

11:23

哈佛最新调查:59%感到被AI威胁,超半数离不开

哈佛最新调查:59%感到被AI威胁,超半数离不开

哈佛最新民调显示,59%的18-29岁受访者认为AI正威胁其职业前景。尽管35%的年轻人定期使用如ChatGPT等大模型,并有52%信任AI完成任务,但同时存在对职业价值感下降和不可替代性减弱的担忧。随着AI在创意、编程、金融分析等领域渗透加深,年轻一代面临机遇与挑战并存的局面,促使他们重新思考个人价值与未来定位。

来源:36氪

11:22

AI巨头暴跌背后的真相

AI巨头暴跌背后的真相

近期AI板块大跌反映了市场对AI产业链进行深度的’理性重新定价’。尽管博通和甲骨文财报显示AI需求依然强劲,但市场开始从追逐增长规模转向审视盈利质量与订单兑现确定性。资金并未完全撤离,而是从拥挤的AI中游配套板块流向稳健资产。未来,AI行业将分化,真正具备核心技术、稳定盈利能力及多元客户结构的企业将在市场筛选中胜出。

来源:36氪

11:22

「美国贴吧」被 AI 水军攻陷:为了证明是人类,2400 万用户被迫像傻瓜一样说话

「美国贴吧」被 AI 水军攻陷:为了证明是人类,2400 万用户被迫像傻瓜一样说话

新闻指出,AI生成内容正迅速泛滥于Reddit、小红书等社交平台,高达50%的内容被AI污染。这些内容不仅包括理性分享如旅游攻略,还涉及情感故事等感性领域。AI通过模仿人类口癖和情绪,甚至学会挑起对立以骗取点击率。这导致了互联网环境的信任危机,使得真实用户不得不调整自己的写作风格来避免被误认为是AI生成。此外,AI检测技术面临挑战,许多标准书面语被错误标记为AI特征。这一现象反映了当前AI技术在自然语言处理领域的快速发展及其对社会文化的影响。

来源:36氪