AI新闻

12月 24日
2 条新闻
12:28

YC 2025年度AI报告:Gemini崛起、Vibe Coding成熟,你需要更新的15个认知

YC 2025年度AI报告:Gemini崛起、Vibe Coding成熟,你需要更新的15个认知

Y Combinator最新一期播客总结了2025年AI行业趋势,Anthropic和Gemini在模型竞争中崛起,分别凭借优秀的代码编写能力和推理能力超越OpenAI。同时,AI基础设施泡沫预示着计算资源将更加廉价且充沛,为初创公司提供了更多机会。此外,Vibe Coding成为一种成熟的开发方式,垂直领域的小模型击败通用大模型,显示出专有数据的重要性。

来源:36氪

12:28

原地平线智能驾驶总裁创业机器人一年:9988元,养一只家里的“小狗哥”

原地平线智能驾驶总裁创业机器人一年:9988元,养一只家里的“小狗哥”

维他动力推出消费级四足机器狗“Vbot超能机器狗”,定位为家庭伙伴,具备全地形通过能力、自主跟随及多场景应用功能。该产品采用混合架构,云端大模型处理复杂语言理解与推理,端侧自研模型保障任务响应效率和弱网环境下的表现。其核心竞争力在于打造具有探索好奇心、生存欲及安全意识的自主智能体,旨在推动AI机器人在C端市场的普及。

来源:36氪

12月 18日
5 条新闻
10:52

谷歌推出最新人工智能模型双子座3 Flash

谷歌公司17日宣布推出最新人工智能模型双子座3 Flash。谷歌称,双子座3 Flash是其最新推出的兼具前沿智能与高速性能的模型,保留了双子座3在高级推理、视觉理解和交互式代码生成等方面的核心能力,同时显著提升了响应速度和成本效率,在多个标准评测中表现优异。据谷歌介绍,该模型性能超越了双子座2.5 Pro,速度提升约3倍,且运行成本远低于前代。在用于评估代理编码能力的专业基准测试中,其得分甚至超过了双子座3 Pro。(新华社)

来源:钛媒体

10:52

英伟达CEO黄仁勋:尚未向OpenAI付款

英伟达首席执行官黄仁勋当地时间12月17日透露,作为向OpenAI投资千亿美元计划的一部分,英伟达目前尚未向OpenAI支付“一分钱”。今年9月,英伟达和OpenAI签署合作意向,英伟达计划向OpenAI投资1000亿美元,双方共建大规模数据中心。(广角观察)

来源:钛媒体

12月 15日
13 条新闻
12:25

OpenAI前CTO再创业,新产品Tinker宣布接入Kimi K2 Thinking

前OpenAI首席技术官Mira Murat离职后,率一批OpenAI旧将创办Thinking Machines Lab,据多家媒体报道,最新估值将达 500 亿美元。Mira Murat日前发文介绍,首款产品Tinker已正式全面开放,并新增万亿参数级推理模型Kimi K2 Thinking,Mira Murat表示,Kimi K2 Thinking是专为长时长推理和工具调用设计的“怪物级”模型,也是Tinker目前产品线中最大的模型。(广角观察)

来源:钛媒体

12:24

人人拥有AI科学家,一文读懂Deep Research的今生与未来

人人拥有AI科学家,一文读懂Deep Research的今生与未来

Deep Research 推动 LLM 从文本生成向知识发现转变,实现复杂开放式任务。该技术已被应用于科研、软件工程等领域,支持学术综述、实验执行等任务。研究将其划分为自主搜索、整合研究和全栈AI科学家三个阶段,涵盖查询规划、知识检索、记忆管理和答案生成四大核心组件。未来面临检索时机、记忆进化、训练算法及评估体系等挑战,需发展统一推理范式、标准化记忆系统及模块化框架以提升通用性和可靠性。

来源:36氪

12:24

OpenAI突然开源新模型,99.9%的权重是0,新稀疏性方法代替MoE

OpenAI突然开源新模型,99.9%的权重是0,新稀疏性方法代替MoE

OpenAI开源了一种名为Circuit Sparsity的新模型,该模型通过极大稀疏化(99.9%权重为零)实现了内部计算过程的高度可解释性,直接针对传统稠密Transformer模型的黑箱问题。与MoE模型相比,Circuit Sparsity追求的是原生稀疏性和任务功能解耦,尽管当前面临算力成本高的挑战,但其在提升AI可解释性方面展现出巨大潜力。

来源:36氪

12:24

AI御三家年终“火拼”

2025年人工智能领域竞争激烈,OpenAI发布GPT-5.2,强调专业知识处理能力与超长上下文记忆;Anthropic推出Claude 4.5,提升自主编程及工具操作稳定性;谷歌DeepMind发布Gemini 3,实现原生多模态融合。三者在推理、编程及智能体任务上均有显著进步,推动AI向更高效、多功能方向发展。

来源:36氪

12:24

60岁俄罗斯大叔靠给AI盖房赚翻了,斩获微软1400亿大单

60岁俄罗斯大叔靠给AI盖房赚翻了,斩获微软1400亿大单

荷兰AI基础设施公司Nebius凭借其强大的工程团队、与英伟达的紧密合作以及独特的资本运作策略,在短时间内赢得微软和Meta的大额算力订单,实现了业绩的飞速增长。Nebius不仅继承了Yandex的技术积累和人才资源,还具备自设计数据中心等关键设施的能力,使其在AI基建领域脱颖而出。通过实施覆盖硬件、IaaS及AI平台的全栈服务战略,Nebius正快速扩张其在全球范围内的算力建设规模,预计到2026年将建成总规模达2.5GW的算力集群。

来源:36氪

12:16

苏州大学首篇数学四大刊!解决了40年未决的丢番图逼近问题

苏州大学首篇数学四大刊!解决了40年未决的丢番图逼近问题

苏州大学副教授张涵与国际合作者将数论中的辛钦定理推广至自相似测度,解决了40年未决的丢番图逼近问题。该成果不仅促进了数学领域的交叉研究,还为AI在处理复杂数据分布、优化算法及提升模型训练效率等方面提供了新思路,特别是在多模态融合和边缘计算等未来趋势中展现出巨大潜力。

来源:量子位

11:23

陶哲轩震撼,数学家1975年埋下的「坑」,被AI和全球网友用48小时填平了

陶哲轩震撼,数学家1975年埋下的「坑」,被AI和全球网友用48小时填平了

AI工具Aristotle与全球数学家合作,在48小时内解决了困扰数学界50年的Erdos#1026问题。该案例展示了AI在生成新数学洞见方面的能力,而非仅仅检索现有文献,显著提升了研究效率。此事件标志着人机协作在数学研究中的新范式,预示着未来AI将在更多领域促进知识创新和技术突破。

来源:36氪

11:23

哈佛最新调查:59%感到被AI威胁,超半数离不开

哈佛最新调查:59%感到被AI威胁,超半数离不开

哈佛最新民调显示,59%的18-29岁受访者认为AI正威胁其职业前景。尽管35%的年轻人定期使用如ChatGPT等大模型,并有52%信任AI完成任务,但同时存在对职业价值感下降和不可替代性减弱的担忧。随着AI在创意、编程、金融分析等领域渗透加深,年轻一代面临机遇与挑战并存的局面,促使他们重新思考个人价值与未来定位。

来源:36氪

11:22

AI巨头暴跌背后的真相

AI巨头暴跌背后的真相

近期AI板块大跌反映了市场对AI产业链进行深度的’理性重新定价’。尽管博通和甲骨文财报显示AI需求依然强劲,但市场开始从追逐增长规模转向审视盈利质量与订单兑现确定性。资金并未完全撤离,而是从拥挤的AI中游配套板块流向稳健资产。未来,AI行业将分化,真正具备核心技术、稳定盈利能力及多元客户结构的企业将在市场筛选中胜出。

来源:36氪

11:22

6位前DeepMind老将打造「AI指挥官」,一半成本刷新SOTA

6位前DeepMind老将打造「AI指挥官」,一半成本刷新SOTA

Poetiq团队由6名前DeepMind成员创立,开发了一种元系统,该系统可自动生成解决特定任务的策略和模型组合,显著降低了推理成本。其Gemini 3 Pro优化技术在ARC-AGI-2上以54%的成绩领先,每任务计算成本仅31美元,比之前最优方法便宜一半。这一创新不仅提升了大模型解决复杂问题的能力,还推动了低成本推理的边界。

来源:36氪

11:22

半年融资超200亿,但70%机器人还在“演戏”

半年融资超200亿,但70%机器人还在“演戏”

本文探讨了具身智能机器人在2025年的应用与发展,通过全球开发者先锋大会上的展示,展示了其在娱乐、工业制造、社会服务等领域的潜力。面对技术热但协同冷、资本热但落地冷以及需求热但信任冷的现状,专家呼吁建立统一标准,推动数据共享与技术创新。同时,行业共识认为高质量数据是关键竞争力,产业链各环节存在大量机会,中国有望借助供应链与场景优势实现差异化发展。

来源:36氪