AI新闻

已选标签:
模型突破
12月 24日
8 条新闻
16:37

硅谷青睐的中国模型更新了,一觉醒来,直接套壳

硅谷青睐的中国模型更新了,一觉醒来,直接套壳

智谱发布并开源了最新一代大模型GLM-4.7,该模型在编程能力上显著提升,对标全球顶尖编程模型Claude Sonnet 4.5。GLM-4.7在多个权威榜单如Vals Index和Design Arena中表现优异,尤其在代码生成与多任务处理方面展现出强大实力,成为开源模型中的佼佼者。此外,其低成本优势也使其成为众多AI平台的首选,进一步推动了AI编程工具的发展。

来源:36氪

16:36

生成不遗忘,「超长时序」世界模型,北大EgoLCD长短时记忆加持

生成不遗忘,「超长时序」世界模型,北大EgoLCD长短时记忆加持

北大、中大等机构联合发布EgoLCD模型,借鉴人类长短时记忆机制,首创稀疏KV缓存+LoRA动态适应架构,有效解决长视频生成中的内容漂移问题。在EgoVid-5M基准测试中,EgoLCD在时间一致性和生成质量上全面超越现有主流模型,为构建具身智能世界模型迈出关键一步。

来源:36氪

16:36

“商汤系”跑出一堆独角兽,可闫俊杰无法复制

“商汤系”跑出一堆独角兽,可闫俊杰无法复制

商汤系AI创业公司MiniMax与Vivix AI凭借深厚的技术积累及产品落地经验,成为资本新宠。MiniMax通过模型和ToC产品并行布局,实现快速商业化,2025年前9个月收入达5343.7万美元。Vivix AI仅用10个月估值飙升至13.2亿美元。两家公司在多模态交互、大语言模型等领域展现强劲发展潜力,推动AI技术在智能助手、内容生成等应用领域的突破。

来源:36氪

15:34

AI战场缺一个腾讯系

AI战场缺一个腾讯系

腾讯正加速在大模型市场的布局,通过调整组织结构和引进关键人才如姚顺雨,以期在AI基础技术和应用层面取得突破。面对阿里与字节在AI应用层快速推进的压力,腾讯需加强其AI应用场景的拓展,特别是在电商、本地生活等领域,以元宝为纽带,整合微信生态内外资源,形成更强大的AI生态系统。

来源:36氪

14:59

国产AI4S创业头雁再获8亿投资!深势科技完成C轮,产品已服务300万科学家

国产AI4S创业头雁再获8亿投资!深势科技完成C轮,产品已服务300万科学家

深势科技完成超8亿人民币C轮融资,将用于进化其“科学发现智能引擎”,加速AI在基础科研、生命科学等领域的应用。公司构建了从数据到实验的全链条智能化科研产品矩阵,服务全球300多万名科学家,显著提升科研效率。AI for Science成为全球共识,深势科技致力于打造能够自主进行科学发现的智能系统,推动科学研究范式变革。

来源:量子位

12:28

字节推出形式化数学推理专用模型Seed Prover 1.5

字节跳动Seed团队宣布推出形式化数学推理专用模型Seed Prover 1.5。据介绍,相比上一代模型,Seed Prover 1.5在16.5小时内,针对IMO 2025的前5道题目生成了完整可编译验证的Lean证明代码,换算成绩为35/42,达到此前IMO评分标准的金牌分数线。Seed Prover 1.5的技术报告已对外公开,后续将开放API,邀请感兴趣的数学和AI研究者体验该模型。(广角观察)

来源:钛媒体

12:28

YC 2025年度AI报告:Gemini崛起、Vibe Coding成熟,你需要更新的15个认知

YC 2025年度AI报告:Gemini崛起、Vibe Coding成熟,你需要更新的15个认知

Y Combinator最新一期播客总结了2025年AI行业趋势,Anthropic和Gemini在模型竞争中崛起,分别凭借优秀的代码编写能力和推理能力超越OpenAI。同时,AI基础设施泡沫预示着计算资源将更加廉价且充沛,为初创公司提供了更多机会。此外,Vibe Coding成为一种成熟的开发方式,垂直领域的小模型击败通用大模型,显示出专有数据的重要性。

来源:36氪

12:28

原地平线智能驾驶总裁创业机器人一年:9988元,养一只家里的“小狗哥”

原地平线智能驾驶总裁创业机器人一年:9988元,养一只家里的“小狗哥”

维他动力推出消费级四足机器狗“Vbot超能机器狗”,定位为家庭伙伴,具备全地形通过能力、自主跟随及多场景应用功能。该产品采用混合架构,云端大模型处理复杂语言理解与推理,端侧自研模型保障任务响应效率和弱网环境下的表现。其核心竞争力在于打造具有探索好奇心、生存欲及安全意识的自主智能体,旨在推动AI机器人在C端市场的普及。

来源:36氪

12月 18日
4 条新闻
10:52

英伟达CEO黄仁勋:尚未向OpenAI付款

英伟达首席执行官黄仁勋当地时间12月17日透露,作为向OpenAI投资千亿美元计划的一部分,英伟达目前尚未向OpenAI支付“一分钱”。今年9月,英伟达和OpenAI签署合作意向,英伟达计划向OpenAI投资1000亿美元,双方共建大规模数据中心。(广角观察)

来源:钛媒体

10:52

谷歌推出最新人工智能模型双子座3 Flash

谷歌公司17日宣布推出最新人工智能模型双子座3 Flash。谷歌称,双子座3 Flash是其最新推出的兼具前沿智能与高速性能的模型,保留了双子座3在高级推理、视觉理解和交互式代码生成等方面的核心能力,同时显著提升了响应速度和成本效率,在多个标准评测中表现优异。据谷歌介绍,该模型性能超越了双子座2.5 Pro,速度提升约3倍,且运行成本远低于前代。在用于评估代理编码能力的专业基准测试中,其得分甚至超过了双子座3 Pro。(新华社)

来源:钛媒体

12月 15日
8 条新闻
12:25

OpenAI前CTO再创业,新产品Tinker宣布接入Kimi K2 Thinking

前OpenAI首席技术官Mira Murat离职后,率一批OpenAI旧将创办Thinking Machines Lab,据多家媒体报道,最新估值将达 500 亿美元。Mira Murat日前发文介绍,首款产品Tinker已正式全面开放,并新增万亿参数级推理模型Kimi K2 Thinking,Mira Murat表示,Kimi K2 Thinking是专为长时长推理和工具调用设计的“怪物级”模型,也是Tinker目前产品线中最大的模型。(广角观察)

来源:钛媒体

12:24

人人拥有AI科学家,一文读懂Deep Research的今生与未来

人人拥有AI科学家,一文读懂Deep Research的今生与未来

Deep Research 推动 LLM 从文本生成向知识发现转变,实现复杂开放式任务。该技术已被应用于科研、软件工程等领域,支持学术综述、实验执行等任务。研究将其划分为自主搜索、整合研究和全栈AI科学家三个阶段,涵盖查询规划、知识检索、记忆管理和答案生成四大核心组件。未来面临检索时机、记忆进化、训练算法及评估体系等挑战,需发展统一推理范式、标准化记忆系统及模块化框架以提升通用性和可靠性。

来源:36氪

12:24

OpenAI突然开源新模型,99.9%的权重是0,新稀疏性方法代替MoE

OpenAI突然开源新模型,99.9%的权重是0,新稀疏性方法代替MoE

OpenAI开源了一种名为Circuit Sparsity的新模型,该模型通过极大稀疏化(99.9%权重为零)实现了内部计算过程的高度可解释性,直接针对传统稠密Transformer模型的黑箱问题。与MoE模型相比,Circuit Sparsity追求的是原生稀疏性和任务功能解耦,尽管当前面临算力成本高的挑战,但其在提升AI可解释性方面展现出巨大潜力。

来源:36氪

12:24

AI御三家年终“火拼”

2025年人工智能领域竞争激烈,OpenAI发布GPT-5.2,强调专业知识处理能力与超长上下文记忆;Anthropic推出Claude 4.5,提升自主编程及工具操作稳定性;谷歌DeepMind发布Gemini 3,实现原生多模态融合。三者在推理、编程及智能体任务上均有显著进步,推动AI向更高效、多功能方向发展。

来源:36氪

12:24

60岁俄罗斯大叔靠给AI盖房赚翻了,斩获微软1400亿大单

60岁俄罗斯大叔靠给AI盖房赚翻了,斩获微软1400亿大单

荷兰AI基础设施公司Nebius凭借其强大的工程团队、与英伟达的紧密合作以及独特的资本运作策略,在短时间内赢得微软和Meta的大额算力订单,实现了业绩的飞速增长。Nebius不仅继承了Yandex的技术积累和人才资源,还具备自设计数据中心等关键设施的能力,使其在AI基建领域脱颖而出。通过实施覆盖硬件、IaaS及AI平台的全栈服务战略,Nebius正快速扩张其在全球范围内的算力建设规模,预计到2026年将建成总规模达2.5GW的算力集群。

来源:36氪

11:23

陶哲轩震撼,数学家1975年埋下的「坑」,被AI和全球网友用48小时填平了

陶哲轩震撼,数学家1975年埋下的「坑」,被AI和全球网友用48小时填平了

AI工具Aristotle与全球数学家合作,在48小时内解决了困扰数学界50年的Erdos#1026问题。该案例展示了AI在生成新数学洞见方面的能力,而非仅仅检索现有文献,显著提升了研究效率。此事件标志着人机协作在数学研究中的新范式,预示着未来AI将在更多领域促进知识创新和技术突破。

来源:36氪

11:23

哈佛最新调查:59%感到被AI威胁,超半数离不开

哈佛最新调查:59%感到被AI威胁,超半数离不开

哈佛最新民调显示,59%的18-29岁受访者认为AI正威胁其职业前景。尽管35%的年轻人定期使用如ChatGPT等大模型,并有52%信任AI完成任务,但同时存在对职业价值感下降和不可替代性减弱的担忧。随着AI在创意、编程、金融分析等领域渗透加深,年轻一代面临机遇与挑战并存的局面,促使他们重新思考个人价值与未来定位。

来源:36氪