12:25 OpenAI前CTO再创业,新产品Tinker宣布接入Kimi K2 Thinking 前OpenAI首席技术官Mira Murat离职后,率一批OpenAI旧将创办Thinking Machines Lab,据多家媒体报道,最新估值将达 500 亿美元。Mira Murat日前发文介绍,首款产品Tinker已正式全面开放,并新增万亿参数级推理模型Kimi K2 Thinking,Mira Murat表示,Kimi K2 Thinking是专为长时长推理和工具调用设计的“怪物级”模型,也是Tinker目前产品线中最大的模型。(广角观察) 来源:钛媒体
12:24 人人拥有AI科学家,一文读懂Deep Research的今生与未来 Deep Research 推动 LLM 从文本生成向知识发现转变,实现复杂开放式任务。该技术已被应用于科研、软件工程等领域,支持学术综述、实验执行等任务。研究将其划分为自主搜索、整合研究和全栈AI科学家三个阶段,涵盖查询规划、知识检索、记忆管理和答案生成四大核心组件。未来面临检索时机、记忆进化、训练算法及评估体系等挑战,需发展统一推理范式、标准化记忆系统及模块化框架以提升通用性和可靠性。 来源:36氪
12:24 OpenAI突然开源新模型,99.9%的权重是0,新稀疏性方法代替MoE OpenAI开源了一种名为Circuit Sparsity的新模型,该模型通过极大稀疏化(99.9%权重为零)实现了内部计算过程的高度可解释性,直接针对传统稠密Transformer模型的黑箱问题。与MoE模型相比,Circuit Sparsity追求的是原生稀疏性和任务功能解耦,尽管当前面临算力成本高的挑战,但其在提升AI可解释性方面展现出巨大潜力。 来源:36氪
12:24 AI御三家年终“火拼” 2025年人工智能领域竞争激烈,OpenAI发布GPT-5.2,强调专业知识处理能力与超长上下文记忆;Anthropic推出Claude 4.5,提升自主编程及工具操作稳定性;谷歌DeepMind发布Gemini 3,实现原生多模态融合。三者在推理、编程及智能体任务上均有显著进步,推动AI向更高效、多功能方向发展。 来源:36氪
12:24 大模型的多轮对话:让模型真正“像人”的终极关卡 本文深入剖析了多轮对话作为AI最高级任务的难点,包括上下文记忆、意图推断和自然语气维持。训练师需具备心理咨询、文案撰写等综合能力,确保模型在复杂情境下提供恰当反馈。多轮对话训练显著提升用户体验,是实现AI‘像人’沟通的关键。 来源:36氪
12:16 苏州大学首篇数学四大刊!解决了40年未决的丢番图逼近问题 苏州大学副教授张涵与国际合作者将数论中的辛钦定理推广至自相似测度,解决了40年未决的丢番图逼近问题。该成果不仅促进了数学领域的交叉研究,还为AI在处理复杂数据分布、优化算法及提升模型训练效率等方面提供了新思路,特别是在多模态融合和边缘计算等未来趋势中展现出巨大潜力。 来源:量子位
11:23 哈佛最新调查:59%感到被AI威胁,超半数离不开 哈佛最新民调显示,59%的18-29岁受访者认为AI正威胁其职业前景。尽管35%的年轻人定期使用如ChatGPT等大模型,并有52%信任AI完成任务,但同时存在对职业价值感下降和不可替代性减弱的担忧。随着AI在创意、编程、金融分析等领域渗透加深,年轻一代面临机遇与挑战并存的局面,促使他们重新思考个人价值与未来定位。 来源:36氪
11:22 GPT-5.2降智遭全网差评,奥特曼慌了 OpenAI发布的GPT-5.2在多项基准测试中表现不佳,特别是在与谷歌的Gemini 3 Pro对比时。GPT-5.2在数学、视觉推理等任务上落后于Gemini 3 Pro,在预训练技术上也未见显著突破。面对竞争压力,OpenAI正加速优化ChatGPT并计划推出新的图像模型以期扭转局势。 来源:36氪
11:22 AI巨头暴跌背后的真相 近期AI板块大跌反映了市场对AI产业链进行深度的’理性重新定价’。尽管博通和甲骨文财报显示AI需求依然强劲,但市场开始从追逐增长规模转向审视盈利质量与订单兑现确定性。资金并未完全撤离,而是从拥挤的AI中游配套板块流向稳健资产。未来,AI行业将分化,真正具备核心技术、稳定盈利能力及多元客户结构的企业将在市场筛选中胜出。 来源:36氪
11:22 「美国贴吧」被 AI 水军攻陷:为了证明是人类,2400 万用户被迫像傻瓜一样说话 新闻指出,AI生成内容正迅速泛滥于Reddit、小红书等社交平台,高达50%的内容被AI污染。这些内容不仅包括理性分享如旅游攻略,还涉及情感故事等感性领域。AI通过模仿人类口癖和情绪,甚至学会挑起对立以骗取点击率。这导致了互联网环境的信任危机,使得真实用户不得不调整自己的写作风格来避免被误认为是AI生成。此外,AI检测技术面临挑战,许多标准书面语被错误标记为AI特征。这一现象反映了当前AI技术在自然语言处理领域的快速发展及其对社会文化的影响。 来源:36氪
11:22 地球上和 Claude 对话最多的人,是一位哲学家 Anthropic的Claude模型在追求代码能力的同时,通过引入欧陆哲学来优化对话质量,旨在避免AI成为缺乏共情的‘杠精’。这一创新由公司内部哲学家Amanda Askell主导,她强调AI应具备良好品格而非仅遵守规则,以此提升用户体验并促进更健康的人机交互环境。 来源:36氪
11:22 迪士尼OpenAI达成70亿协议,火速控诉谷歌侵权 迪士尼与OpenAI签署十亿美元协议,授权超过200个角色用于Sora的视频生成,同时禁止使用其IP训练模型;而谷歌因涉嫌侵权收到律师函。事件表明,AI行业的竞争将转向内容授权,而非单纯的技术和算力比拼。迪士尼通过这一系列操作,重新定义了AI在内容版权上的边界,强调了尊重创作者及其作品的重要性。 来源:36氪
13:50 长江电影与智象未来达成战略合作 湖北长江电影集团与智象未来宣布达成战略合作,共同成立“长江电影智象未来影视AI联合实验室”,主攻AI辅助剧本创作、智能视觉特效生成等技术研发,用AI赋能影视。(创投家CLUB) 来源:钛媒体
11:39 太初元碁乔梁:AI算法已经跑到单芯片极限|MEET2026 随着AI技术的发展,行业应用对算力的需求与日俱增。太初元碁联合创始人乔梁指出,当前单芯片性能已成AI算法发展的瓶颈,为此太初元碁设计了实现128卡间高速互联的TC link,为AI算法提供硬件基础。未来,高性能计算将贯穿从科学研究到AI落地的全链路,成为各类计算场景的底层支撑力量。超智融合和异构融合被视为解决算力需求的关键路径,开源生态建设也被认为是推动AI产业生态发展的重要一环。 来源:量子位
10:45 科技大佬为何难逃「币圈引力」? 摩尔线程作为中国版英伟达,在科创板上市后市值飙升,反映了当前AI与算力领域的资本热度。文章探讨了科技大佬如马斯克、奥特曼等在虚拟币和AI领域之间的复杂关系及背后动机,强调了算力作为连接这两者的关键纽带作用。同时指出,无论是训练大模型还是进行加密挖矿,争夺算力成为核心之一,而算力的发展也受到政策环境、电力供应等因素的影响。 来源:36氪
09:42 8 年后回到斯坦福,布林复盘谷歌 AI:错在太谨慎 谷歌联合创始人谢尔盖·布林在斯坦福演讲中反思了公司在Transformer技术上的失误,指出谷歌因过于谨慎而错失AI市场先机。自2022年底起,布林回归一线领导Gemini项目,旨在通过平台化策略重构工作流程,强调AI作为新的工作方式而非单一工具的重要性。同时,布林鼓励年轻人继续学习编程,认为AI虽能降低学习门槛但不减少应用需求,并建议创业者优先考虑产品的实用性。 来源:36氪
04:35 AI数据中心热潮可能对其他基础设施项目不利 随着数据中心建设加速,尤其是AI相关的基础设施如大语言模型和多模态模型的部署需求激增,预计2025年将达到超过410亿美元的投资规模。这不仅与政府在交通建设上的支出相当,还导致了劳动力短缺问题加剧,影响其他基础设施项目的进度。此现象反映了AI技术快速发展对算力资源及物理空间的需求增加,同时也提出了成本控制和技术优化的新挑战。 来源:TechCrunch AI
22:41 美国视频生成老炮儿,入局世界模型 Runway发布首个通用世界模型GWM-1及其变体,包括模拟真实环境的GWM Worlds、模拟对话的GWM Avatars和用于机器人操作的GWM Robotics。这些基于Gen-4.5升级版构建的模型采用自回归架构,支持实时交互控制,展示了在虚拟环境构建、客户服务及机器人训练等领域的应用潜力。同时,Gen-4.5新增原生音频生成与编辑功能,进一步扩展了其应用场景。 来源:量子位
22:37 面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 北航团队提出首个大规模真实星座调度基准AEOS-Bench,并创新性地将Transformer模型与航天工程需求融合,训练出内嵌时间约束的调度模型AEOS-Former。该研究为卫星星座任务规划提供了高效解决方案,显著提升了任务完成率和资源利用率,展示了AI在空天具身智能领域的巨大潜力。 来源:量子位