AI新闻

已选标签:
生成模型
AI训练
12月 12日
20 条新闻
17:33

OpenAI用GPT-5.2“反击”谷歌,刀子够快吗?

OpenAI用GPT-5.2“反击”谷歌,刀子够快吗?

OpenAI发布GPT-5.2,强调其在专业任务如编码、法律、金融等领域的卓越表现。尽管在多项基准测试中领先,但与竞争对手如谷歌Gemini 3 Pro的差距并不明显。AI竞赛已进入多方混战阶段。面对商业化压力和技术挑战,OpenAI正积极寻求在垂直领域建立优势,并探索广告和交易分成等新商业模式。

来源:36氪

16:32

里程碑时刻,首个100B扩散语言模型来了,技术报告揭秘背后细节

里程碑时刻,首个100B扩散语言模型来了,技术报告揭秘背后细节

扩散语言模型(dLLM)在短时间内实现了从16B到100B参数规模的飞跃,展现出超越传统自回归模型的潜力。蚂蚁集团联合多所高校推出的LLaDA2.0系列模型采用MoE架构,在多个复杂任务上表现优异。通过持续预训练策略和系统化后训练流程,成功将AR模型平滑转化为dLLM,并解决了长文本生成效率低下的问题。

来源:36氪

15:30

GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

GPT-5.2发布,据官方基准测试,在完成经济价值任务如电子表格制作、PPT设计、代码编写与审查等方面表现出色,甚至在某些基准测试中超越专业人士。尽管有用户反映初期存在功能不稳定现象,但多位专家和用户实测反馈其在复杂推理、数学计算及编程方面实现显著进步,尤其是构建3D图形引擎等高难度任务上的表现令人印象深刻。

来源:36氪

15:30

港中文联手美团开源“视觉推理通才”,图像视频10类任务一网打尽

港中文联手美团开源“视觉推理通才”,图像视频10类任务一网打尽

香港中文大学MMLab与美团研究团队开源OneThinker,一个基于RL的多模态视觉推理通才模型,覆盖图像与视频十类核心任务,在31项主流视觉任务测试中表现优异。通过构建统一数据体系和优化多任务训练方法(如EMA-GRPO算法),OneThinker解决了传统RL模型在单一模态或任务上的局限性,展现了跨模态、多任务的通用理解和零样本能力,为实现通用视觉智能提供了新路径。

来源:36氪

15:30

跳过“逐字生成”,蚂蚁集团赵俊博:扩散模型让我们能直接修改Token

跳过“逐字生成”,蚂蚁集团赵俊博:扩散模型让我们能直接修改Token

赵俊博在量子位MEET2026智能未来大会上介绍了扩散架构语言模型LLaDA 2.0,该模型采用完形填空式预测机制,相比自回归模型,在相同计算量下参数规模更小、生成速度更快且成本更低。团队已开源LLaDA 2.0,并验证其可扩展至千亿规模。尽管扩散语言模型的训练与推理仍处于早期阶段,但其独特优势吸引了谷歌、字节等巨头及初创公司的积极布局。

来源:36氪

15:30

Meta版「甄嬛传」,28岁天才上位,掌管6千亿命脉,AI教父愤然出走

Meta版「甄嬛传」,28岁天才上位,掌管6千亿命脉,AI教父愤然出走

Meta内部因AI战略分歧产生冲突,图灵奖得主Yann LeCun离职。扎克伯格曾强调开源策略,但Llama 4失败后态度转变,暗示可能调整策略。新模型Avocado或将不再开源。28岁的Alexandr Wang被寄予厚望,领导TBD Lab团队专注于打造超级人工智能ASI,与公司其他高管在广告业务和AGI方向上存在分歧。Meta正重新分配资源支持AI项目,包括削减虚拟现实预算。

来源:36氪

14:36

ToC智能体火得快,但更大的价值在企业丨中关村科金@MEET2026

ToC智能体火得快,但更大的价值在企业丨中关村科金@MEET2026

中关村科金总裁喻友平在MEET2026智能未来大会上提出,AI时代的核心在于更强的连接。企业智能化需通过场景选择、数据与知识治理、模型构建三方面持续迭代。构建大模型平台、AI能力平台和AI数据平台是实现智能体规模化落地的关键。这些平台共同支持数百个数字员工协同工作的“智能体集市”,助力企业在营销、运营、生产等环节形成新的组织单元。

来源:量子位

13:26

迪士尼同意向OpenAI投资10亿美元并达成授权协议

华特迪士尼公司与OpenAI达成协议,迪士尼将成为OpenAI短视频生成式AI平台Sora的首个主要内容授权合作伙伴。根据这项为期三年的新授权协议,Sora将能够生成由用户提示的短视频内容,供粉丝观看和分享。这些视频将取材于迪士尼、漫威、皮克斯和星球大战旗下超过200个动画角色、面具角色和生物角色,涵盖服装、道具、载具及标志性场景。生成的视频和图像预计将于2026年初开始提供,但不包含任何演员的肖像和声音。

根据协议条款,迪士尼将向OpenAI进行10亿美元的股权投资,并获得认股权证,同时作为主要客户使用OpenAI的API和ChatGPT来构建新产品和供员工使用。(广角观察)

来源:钛媒体

13:26

中国自研“AI孔明”制药平台在京发布

非盈利机构全球健康药物研发中心(GHDDI)正式发布了由中国自主研发的AI药物研发平台“AI孔明”,实现了从“靶点结构分析→AI分子生成→药物设计→活性评估→成药性优化”的全流程无缝覆盖,打通了早期药物发现的关键技术链条。作为开放式AI制药平台,“AI孔明”平台依托全球顶级科研机构联盟的知识体系与GHDDI多年积累的真实研发数据,将分散于不同环节的生物学、化学与药理学知识进行系统化数字重构,转化为可推理、可创造、可进化的AI生产力。(广角观察)

来源:钛媒体

12:38

跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026

跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026

赵俊博在MEET2026智能未来大会上介绍了蚂蚁集团押注扩散语言模型(dLLM)的最新进展。相比自回归模型,扩散架构允许直接修改token,理论上可实现更快生成速度与更低计算成本。团队已开源千亿参数规模的LLaDA 2.0,标志着扩散语言模型的重要里程碑。尽管该领域仍处于早期阶段,但其发展潜力巨大,正吸引包括谷歌、字节跳动等巨头及初创公司的积极布局。

来源:量子位

12:24

AI集体下场做电商,颠覆淘宝的可能是豆包手机?

AI集体下场做电商,颠覆淘宝的可能是豆包手机?

新闻介绍了AI在电商领域的应用,从豆包的AI手机助手到OpenAI与沃尔玛合作的ChatGPT购物功能,展示了AI如何通过理解用户需求、跨平台比价和自动下单来优化网购体验。同时,电商平台如京东也在积极开发自己的AI助手,以应对来自外部AI技术的竞争压力。未来,AI将不仅限于辅助购物决策,还将进一步重塑电商环境,提升用户体验的同时也对数据隐私保护提出了新的挑战。

来源:36氪

12:24

迪士尼为什么要投资OpenAI 10亿美元?

迪士尼为什么要投资OpenAI 10亿美元?

迪士尼向OpenAI投资10亿美元并达成三年授权协议,利用OpenAI的多模态模型Sora和ChatGPT Images生成社交短视频及图像,涵盖迪士尼、漫威等角色。迪士尼将借助OpenAI的API构建新产品,包括Disney+平台的应用,并在内部部署ChatGPT。此次合作旨在通过负责任地使用生成式AI技术提升内容创作效率与体验,同时应对行业变革挑战。

来源:36氪

12:24

Meta「内战」升级:做「神一般的AI」,还是守住「社交帝国」?

Meta「内战」升级:做「神一般的AI」,还是守住「社交帝国」?

Meta全面转向AI,内部面临资源分配、发展目标及文化融合等挑战。新组建的顶尖AI团队TBD Lab与原有核心业务部门在优先事项上产生分歧,前者追求开发‘神一般的AI超级智能’,后者则聚焦于优化社交媒体信息流和广告业务。为支持AI野心,Meta正削减元宇宙部门预算,计划将资金转移给AI团队。尽管存在内部冲突,Meta仍致力于通过构建核心技术平台掌握未来。

来源:36氪

10:21

李泽湘看好的电动智能摩托艇公司,再获HKX基金、清水湾基金投资|硬氪首发

李泽湘看好的电动智能摩托艇公司,再获HKX基金、清水湾基金投资|硬氪首发

安澜动力科技完成千万元天使+轮融资,专注于休闲船艇电动化与智能化研发。公司通过融合乘用车级智能技术,为用户提供安全辅助驾驶和便捷交互体验。其首款产品ANAVI CARBON具备避碰提醒、应急避碰等功能,并支持手机远程联动。公司在软硬件深度融合、场景化算法优化等方面面临挑战,计划明年启动生产验证测试。

来源:36氪

10:20

别让米其林主厨削土豆,英伟达用“小脑指挥大脑”,重构AGI生产力

别让米其林主厨削土豆,英伟达用“小脑指挥大脑”,重构AGI生产力

英伟达推出8B参数的Orchestrator模型,通过组合工具实现降本增效,在HLE等基准测试中超越GPT-5,成本仅为后者30%。该模型采用强化学习训练,能精准调度不同功能的小模型和工具,显著提升效率与成本效益,代表了从单一强大模型向复合AI系统转变的新趋势。

来源:36氪

10:20

GPT-5.2性能爆表,但红色警报没有解除

GPT-5.2性能爆表,但红色警报没有解除

ChatGPT-5.2在数学推理、专业工作及长文档理解方面取得显著进步,尤其在AIME 2025竞赛中获满分,并在软件工程与视觉理解任务上表现出色。尽管其性能提升巨大且成本效率提高约390倍,但在特定语言理解测试中落后于竞争对手。OpenAI通过高价策略试图将其定位为高端产品,但面临市场对性价比的更高要求。

来源:36氪

10:20

世航连续完成多轮数亿元融资,巩固海洋具身机器人全球领先身位

海洋具身机器人领军企业世航智能完成多轮数亿元融资,加速推进产品及技术迭代。其虎鲸海洋具身机器人在动力、控制、传感等六大核心系统全面自研,性能指标突破行业极限,获多项国家级奖项认可。基于AI驱动的水下清洗检测机器人已在船舶养护、港口巡检等多个场景实现规模化商业闭环,助力海洋强国建设。

来源:36氪

09:18

豆包手机“封禁”背后,藏着所有品牌都该懂的未来生存法则

豆包手机助手事件揭示了AI助手可能颠覆传统营销方式的趋势。AI助手作为用户与商业世界的中介,将改变品牌触达用户的方式,使购物平台管道化,并影响品牌的数据获取和创新。面对这一挑战,品牌需从满足功能需求转向提供情感和社交价值,构建深层次的用户关系,以在AI时代保持竞争力。

来源:36氪

09:18

谷歌深夜重磅开源,深度研究Agent拿下SOTA,比GPT-5 pro便宜90%

谷歌深夜重磅开源,深度研究Agent拿下SOTA,比GPT-5 pro便宜90%

谷歌发布三项AI Agent更新:Deep Research Agent功能升级并开源,通过多步强化学习提高信息搜索与报告生成效率;推出新基准DeepSearchQA,评估Agent复杂任务处理能力;发布交互API简化Gemini模型和Agent的开发流程。这些更新旨在提升数据安全、成本效益及应用灵活性,在金融、生物技术等领域展现潜力。

来源:36氪