AI新闻

已选标签:
AI编程
模型突破
12月 12日
20 条新闻
15:30

港中文联手美团开源“视觉推理通才”,图像视频10类任务一网打尽

港中文联手美团开源“视觉推理通才”,图像视频10类任务一网打尽

香港中文大学MMLab与美团研究团队开源OneThinker,一个基于RL的多模态视觉推理通才模型,覆盖图像与视频十类核心任务,在31项主流视觉任务测试中表现优异。通过构建统一数据体系和优化多任务训练方法(如EMA-GRPO算法),OneThinker解决了传统RL模型在单一模态或任务上的局限性,展现了跨模态、多任务的通用理解和零样本能力,为实现通用视觉智能提供了新路径。

来源:36氪

15:30

跳过“逐字生成”,蚂蚁集团赵俊博:扩散模型让我们能直接修改Token

跳过“逐字生成”,蚂蚁集团赵俊博:扩散模型让我们能直接修改Token

赵俊博在量子位MEET2026智能未来大会上介绍了扩散架构语言模型LLaDA 2.0,该模型采用完形填空式预测机制,相比自回归模型,在相同计算量下参数规模更小、生成速度更快且成本更低。团队已开源LLaDA 2.0,并验证其可扩展至千亿规模。尽管扩散语言模型的训练与推理仍处于早期阶段,但其独特优势吸引了谷歌、字节等巨头及初创公司的积极布局。

来源:36氪

15:30

Meta版「甄嬛传」,28岁天才上位,掌管6千亿命脉,AI教父愤然出走

Meta版「甄嬛传」,28岁天才上位,掌管6千亿命脉,AI教父愤然出走

Meta内部因AI战略分歧产生冲突,图灵奖得主Yann LeCun离职。扎克伯格曾强调开源策略,但Llama 4失败后态度转变,暗示可能调整策略。新模型Avocado或将不再开源。28岁的Alexandr Wang被寄予厚望,领导TBD Lab团队专注于打造超级人工智能ASI,与公司其他高管在广告业务和AGI方向上存在分歧。Meta正重新分配资源支持AI项目,包括削减虚拟现实预算。

来源:36氪

15:30

OpenAI十周年「血色浪漫」:11位联创出走8位,奥特曼深夜发文

OpenAI十周年「血色浪漫」:11位联创出走8位,奥特曼深夜发文

OpenAI成立十年,从一个默默无闻的初创公司成长为全球领先的AI巨头。回顾其发展历程,关键转折点包括2017年发现语言模型中的‘情感神经元’及后续对齐人类价值的研究。GPT系列的成功展示了深度学习与大规模算力结合的巨大潜力。如今,OpenAI正朝着实现通用人工智能(AGI)的目标迈进,同时强调安全与伦理的重要性。

来源:36氪

15:28

中国机器人比赛应急救援,美国网友Reddit破防:我们还在给机器狗化妆拍段子

中国机器人比赛应急救援,美国网友Reddit破防:我们还在给机器狗化妆拍段子

中国在具身智能领域取得显著进展,通过GDPS 2025大赛展示了机器人在应急救援等实际应用场景中的能力。美国网友对此表现出焦虑与关注,认为中国已超越理论阶段进入实地部署。得益于上海强大的产业链支持及政策推动,中国企业在量产和多场景应用方面领先,这标志着中国具身智能技术从展示走向日常。

来源:量子位

14:39

GPT-5.2果然反超谷歌Gemini 3 Pro!北大数院校友核心贡献

GPT-5.2果然反超谷歌Gemini 3 Pro!北大数院校友核心贡献

GPT-5.2在多个实用领域超越谷歌Gemini 3 Pro,特别是在人力资源、代码编写、长文档处理及视觉理解方面。其在GDPval测试中展现出高经济价值任务的卓越能力,如投行分析师电子表格建模任务上得分提升9.3%。此外,GPT-5.2在SWE-bench Verified上的代码能力达到80%,并首次在MRCRv2评测中实现接近100%准确率。北大数院校友等新加入OpenAI的人才为核心贡献者。

来源:量子位

14:36

ToC智能体火得快,但更大的价值在企业丨中关村科金@MEET2026

ToC智能体火得快,但更大的价值在企业丨中关村科金@MEET2026

中关村科金总裁喻友平在MEET2026智能未来大会上提出,AI时代的核心在于更强的连接。企业智能化需通过场景选择、数据与知识治理、模型构建三方面持续迭代。构建大模型平台、AI能力平台和AI数据平台是实现智能体规模化落地的关键。这些平台共同支持数百个数字员工协同工作的“智能体集市”,助力企业在营销、运营、生产等环节形成新的组织单元。

来源:量子位

13:56

10亿美元OpenAI股权兑换迪士尼版权!米老鼠救Sora来了

10亿美元OpenAI股权兑换迪士尼版权!米老鼠救Sora来了

OpenAI与迪士尼达成合作,通过向迪士尼出售价值10亿美元的股权获得其旗下200多个热门IP角色授权,包括米老鼠、钢铁侠等。这些角色将被用于OpenAI的视频生成工具Sora和ChatGPT Images中,增强内容创作能力。此次合作不仅解决了版权问题,还为Sora APP提供了新的增长点,改善了用户留存率低的问题。同时,迪士尼计划利用OpenAI的技术开发新产品和服务,进一步推动人工智能技术在娱乐行业的应用。

来源:量子位

13:26

中国自研“AI孔明”制药平台在京发布

非盈利机构全球健康药物研发中心(GHDDI)正式发布了由中国自主研发的AI药物研发平台“AI孔明”,实现了从“靶点结构分析→AI分子生成→药物设计→活性评估→成药性优化”的全流程无缝覆盖,打通了早期药物发现的关键技术链条。作为开放式AI制药平台,“AI孔明”平台依托全球顶级科研机构联盟的知识体系与GHDDI多年积累的真实研发数据,将分散于不同环节的生物学、化学与药理学知识进行系统化数字重构,转化为可推理、可创造、可进化的AI生产力。(广角观察)

来源:钛媒体

12:38

跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026

跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026

赵俊博在MEET2026智能未来大会上介绍了蚂蚁集团押注扩散语言模型(dLLM)的最新进展。相比自回归模型,扩散架构允许直接修改token,理论上可实现更快生成速度与更低计算成本。团队已开源千亿参数规模的LLaDA 2.0,标志着扩散语言模型的重要里程碑。尽管该领域仍处于早期阶段,但其发展潜力巨大,正吸引包括谷歌、字节跳动等巨头及初创公司的积极布局。

来源:量子位

12:24

AI集体下场做电商,颠覆淘宝的可能是豆包手机?

AI集体下场做电商,颠覆淘宝的可能是豆包手机?

新闻介绍了AI在电商领域的应用,从豆包的AI手机助手到OpenAI与沃尔玛合作的ChatGPT购物功能,展示了AI如何通过理解用户需求、跨平台比价和自动下单来优化网购体验。同时,电商平台如京东也在积极开发自己的AI助手,以应对来自外部AI技术的竞争压力。未来,AI将不仅限于辅助购物决策,还将进一步重塑电商环境,提升用户体验的同时也对数据隐私保护提出了新的挑战。

来源:36氪

12:24

苹果 AI 眼镜深度爆料汇总:重量低至 40g,2026 发布

苹果 AI 眼镜深度爆料汇总:重量低至 40g,2026 发布

苹果正在研发的新一代智能眼镜Apple AI Glasses,预计在2026-2027年推出。这款设备将采用无屏幕设计,专注于AI、Siri与摄像头的结合,以实现更自然的视觉交互和情境感知。通过与iPhone联动提供算力支持,确保轻便性与全天候续航。面对Meta和Google的竞争,苹果凭借其隐私保护优势及生态整合能力,有望重新定义智能眼镜市场。

来源:36氪

12:24

Meta「内战」升级:做「神一般的AI」,还是守住「社交帝国」?

Meta「内战」升级:做「神一般的AI」,还是守住「社交帝国」?

Meta全面转向AI,内部面临资源分配、发展目标及文化融合等挑战。新组建的顶尖AI团队TBD Lab与原有核心业务部门在优先事项上产生分歧,前者追求开发‘神一般的AI超级智能’,后者则聚焦于优化社交媒体信息流和广告业务。为支持AI野心,Meta正削减元宇宙部门预算,计划将资金转移给AI团队。尽管存在内部冲突,Meta仍致力于通过构建核心技术平台掌握未来。

来源:36氪

12:24

谷歌最新版「深度研究」反击GPT-5.2

谷歌最新版「深度研究」反击GPT-5.2

谷歌与OpenAI在AI领域展开激烈竞争,双方相继发布GPT-5.2和Gemini 3 Pro。新版Gemini Deep Research Agent通过多步强化学习训练,在准确性、减少幻觉及处理复杂信息环境方面取得显著进展。此外,谷歌推出开源基准DeepSearchQA和交互API,后者支持有状态的智能体交互模式,简化开发者构建AI应用的过程。

来源:36氪

12:24

脑子是个便宜货

GPT-5.2 发布,其在交互、语气及多任务处理上表现突出,但整体智能水平仍逊于 Gemini 3 Pro。a16z 报告指出,未来 SaaS 公司仅靠存储数据难以维持竞争力,AI 将通过跨平台整合非结构化数据提供行动建议;产品设计应转向为 AI 代理服务而非人类用户;制造业和能源行业将是 AI 落地的重要场景;消费者 AI 正从工具型向情感陪伴型转变。

来源:36氪

11:22

英伟达H100太空“狂飙”,马斯克1.5万亿美金IPO终极引爆,王坚断言”这才是AI终极战场”

英伟达H100芯片首次在太空成功运行AI模型,标志着‘天算时代’的开启。SpaceX计划通过史上最大规模IPO募集资金用于开发基于太空的数据中心,推动商业航天与AI深度融合。Starcloud等初创公司正积极部署太空数据中心以应对地面算力瓶颈,利用太阳能和低温环境提升计算效率。尽管面临技术挑战,太空算力被视为解决AI时代能源限制的关键途径。

来源:36氪

10:21

李泽湘看好的电动智能摩托艇公司,再获HKX基金、清水湾基金投资|硬氪首发

李泽湘看好的电动智能摩托艇公司,再获HKX基金、清水湾基金投资|硬氪首发

安澜动力科技完成千万元天使+轮融资,专注于休闲船艇电动化与智能化研发。公司通过融合乘用车级智能技术,为用户提供安全辅助驾驶和便捷交互体验。其首款产品ANAVI CARBON具备避碰提醒、应急避碰等功能,并支持手机远程联动。公司在软硬件深度融合、场景化算法优化等方面面临挑战,计划明年启动生产验证测试。

来源:36氪

10:20

别让米其林主厨削土豆,英伟达用“小脑指挥大脑”,重构AGI生产力

别让米其林主厨削土豆,英伟达用“小脑指挥大脑”,重构AGI生产力

英伟达推出8B参数的Orchestrator模型,通过组合工具实现降本增效,在HLE等基准测试中超越GPT-5,成本仅为后者30%。该模型采用强化学习训练,能精准调度不同功能的小模型和工具,显著提升效率与成本效益,代表了从单一强大模型向复合AI系统转变的新趋势。

来源:36氪

10:20

GPT-5.2性能爆表,但红色警报没有解除

GPT-5.2性能爆表,但红色警报没有解除

ChatGPT-5.2在数学推理、专业工作及长文档理解方面取得显著进步,尤其在AIME 2025竞赛中获满分,并在软件工程与视觉理解任务上表现出色。尽管其性能提升巨大且成本效率提高约390倍,但在特定语言理解测试中落后于竞争对手。OpenAI通过高价策略试图将其定位为高端产品,但面临市场对性价比的更高要求。

来源:36氪

10:20

GPT-5.2 上线,迪士尼投出 10 亿美元:AI 不止提效,还要讲故事

GPT-5.2 上线,迪士尼投出 10 亿美元:AI 不止提效,还要讲故事

OpenAI 发布 GPT-5.2,显著提升专业任务执行能力与业务场景适配度,特别是在职业任务和工具调用方面展现卓越性能。与此同时,迪士尼宣布与 OpenAI 达成三年期授权协议,并投资 10 亿美元,允许 Sora 使用超过 200 个知名角色生成内容,标志着 AI 正式成为内容创作伙伴而非单纯提效工具。双方合作旨在构建一个完整的创作者操作系统,涵盖从语言理解到视觉生成的全链路内容生态,预示着 AI 在内容创作领域的应用将进入新阶段。

来源:36氪