AI新闻

已选标签:
生成模型
AI对话
12月 12日
20 条新闻
13:26

迪士尼同意向OpenAI投资10亿美元并达成授权协议

华特迪士尼公司与OpenAI达成协议,迪士尼将成为OpenAI短视频生成式AI平台Sora的首个主要内容授权合作伙伴。根据这项为期三年的新授权协议,Sora将能够生成由用户提示的短视频内容,供粉丝观看和分享。这些视频将取材于迪士尼、漫威、皮克斯和星球大战旗下超过200个动画角色、面具角色和生物角色,涵盖服装、道具、载具及标志性场景。生成的视频和图像预计将于2026年初开始提供,但不包含任何演员的肖像和声音。

根据协议条款,迪士尼将向OpenAI进行10亿美元的股权投资,并获得认股权证,同时作为主要客户使用OpenAI的API和ChatGPT来构建新产品和供员工使用。(广角观察)

来源:钛媒体

13:26

中国自研“AI孔明”制药平台在京发布

非盈利机构全球健康药物研发中心(GHDDI)正式发布了由中国自主研发的AI药物研发平台“AI孔明”,实现了从“靶点结构分析→AI分子生成→药物设计→活性评估→成药性优化”的全流程无缝覆盖,打通了早期药物发现的关键技术链条。作为开放式AI制药平台,“AI孔明”平台依托全球顶级科研机构联盟的知识体系与GHDDI多年积累的真实研发数据,将分散于不同环节的生物学、化学与药理学知识进行系统化数字重构,转化为可推理、可创造、可进化的AI生产力。(广角观察)

来源:钛媒体

12:38

跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026

跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026

赵俊博在MEET2026智能未来大会上介绍了蚂蚁集团押注扩散语言模型(dLLM)的最新进展。相比自回归模型,扩散架构允许直接修改token,理论上可实现更快生成速度与更低计算成本。团队已开源千亿参数规模的LLaDA 2.0,标志着扩散语言模型的重要里程碑。尽管该领域仍处于早期阶段,但其发展潜力巨大,正吸引包括谷歌、字节跳动等巨头及初创公司的积极布局。

来源:量子位

12:24

AI集体下场做电商,颠覆淘宝的可能是豆包手机?

AI集体下场做电商,颠覆淘宝的可能是豆包手机?

新闻介绍了AI在电商领域的应用,从豆包的AI手机助手到OpenAI与沃尔玛合作的ChatGPT购物功能,展示了AI如何通过理解用户需求、跨平台比价和自动下单来优化网购体验。同时,电商平台如京东也在积极开发自己的AI助手,以应对来自外部AI技术的竞争压力。未来,AI将不仅限于辅助购物决策,还将进一步重塑电商环境,提升用户体验的同时也对数据隐私保护提出了新的挑战。

来源:36氪

12:24

迪士尼为什么要投资OpenAI 10亿美元?

迪士尼为什么要投资OpenAI 10亿美元?

迪士尼向OpenAI投资10亿美元并达成三年授权协议,利用OpenAI的多模态模型Sora和ChatGPT Images生成社交短视频及图像,涵盖迪士尼、漫威等角色。迪士尼将借助OpenAI的API构建新产品,包括Disney+平台的应用,并在内部部署ChatGPT。此次合作旨在通过负责任地使用生成式AI技术提升内容创作效率与体验,同时应对行业变革挑战。

来源:36氪

12:24

Meta「内战」升级:做「神一般的AI」,还是守住「社交帝国」?

Meta「内战」升级:做「神一般的AI」,还是守住「社交帝国」?

Meta全面转向AI,内部面临资源分配、发展目标及文化融合等挑战。新组建的顶尖AI团队TBD Lab与原有核心业务部门在优先事项上产生分歧,前者追求开发‘神一般的AI超级智能’,后者则聚焦于优化社交媒体信息流和广告业务。为支持AI野心,Meta正削减元宇宙部门预算,计划将资金转移给AI团队。尽管存在内部冲突,Meta仍致力于通过构建核心技术平台掌握未来。

来源:36氪

10:21

李泽湘看好的电动智能摩托艇公司,再获HKX基金、清水湾基金投资|硬氪首发

李泽湘看好的电动智能摩托艇公司,再获HKX基金、清水湾基金投资|硬氪首发

安澜动力科技完成千万元天使+轮融资,专注于休闲船艇电动化与智能化研发。公司通过融合乘用车级智能技术,为用户提供安全辅助驾驶和便捷交互体验。其首款产品ANAVI CARBON具备避碰提醒、应急避碰等功能,并支持手机远程联动。公司在软硬件深度融合、场景化算法优化等方面面临挑战,计划明年启动生产验证测试。

来源:36氪

10:20

别让米其林主厨削土豆,英伟达用“小脑指挥大脑”,重构AGI生产力

别让米其林主厨削土豆,英伟达用“小脑指挥大脑”,重构AGI生产力

英伟达推出8B参数的Orchestrator模型,通过组合工具实现降本增效,在HLE等基准测试中超越GPT-5,成本仅为后者30%。该模型采用强化学习训练,能精准调度不同功能的小模型和工具,显著提升效率与成本效益,代表了从单一强大模型向复合AI系统转变的新趋势。

来源:36氪

10:20

GPT-5.2性能爆表,但红色警报没有解除

GPT-5.2性能爆表,但红色警报没有解除

ChatGPT-5.2在数学推理、专业工作及长文档理解方面取得显著进步,尤其在AIME 2025竞赛中获满分,并在软件工程与视觉理解任务上表现出色。尽管其性能提升巨大且成本效率提高约390倍,但在特定语言理解测试中落后于竞争对手。OpenAI通过高价策略试图将其定位为高端产品,但面临市场对性价比的更高要求。

来源:36氪

10:20

我的男友是虚拟的,但他很快就会变成现实|深氪

我的男友是虚拟的,但他很快就会变成现实|深氪

文章探讨了AI技术在乙女游戏中的应用,特别是通过大语言模型和计算机视觉技术增强游戏角色的真实感与互动性。如《恋与深空》利用Unity2019平台及自定义渲染管线实现高质量3D效果,并结合ChatGPT等AI工具提供个性化对话体验,满足玩家情感需求。这不仅推动了游戏行业的创新发展,也反映了AI技术在改善人类孤独感方面的潜力。

来源:36氪

10:20

GPT-5.2 上线,迪士尼投出 10 亿美元:AI 不止提效,还要讲故事

GPT-5.2 上线,迪士尼投出 10 亿美元:AI 不止提效,还要讲故事

OpenAI 发布 GPT-5.2,显著提升专业任务执行能力与业务场景适配度,特别是在职业任务和工具调用方面展现卓越性能。与此同时,迪士尼宣布与 OpenAI 达成三年期授权协议,并投资 10 亿美元,允许 Sora 使用超过 200 个知名角色生成内容,标志着 AI 正式成为内容创作伙伴而非单纯提效工具。双方合作旨在构建一个完整的创作者操作系统,涵盖从语言理解到视觉生成的全链路内容生态,预示着 AI 在内容创作领域的应用将进入新阶段。

来源:36氪

10:20

世航连续完成多轮数亿元融资,巩固海洋具身机器人全球领先身位

海洋具身机器人领军企业世航智能完成多轮数亿元融资,加速推进产品及技术迭代。其虎鲸海洋具身机器人在动力、控制、传感等六大核心系统全面自研,性能指标突破行业极限,获多项国家级奖项认可。基于AI驱动的水下清洗检测机器人已在船舶养护、港口巡检等多个场景实现规模化商业闭环,助力海洋强国建设。

来源:36氪

09:18

豆包手机“封禁”背后,藏着所有品牌都该懂的未来生存法则

豆包手机助手事件揭示了AI助手可能颠覆传统营销方式的趋势。AI助手作为用户与商业世界的中介,将改变品牌触达用户的方式,使购物平台管道化,并影响品牌的数据获取和创新。面对这一挑战,品牌需从满足功能需求转向提供情感和社交价值,构建深层次的用户关系,以在AI时代保持竞争力。

来源:36氪

09:18

谷歌深夜重磅开源,深度研究Agent拿下SOTA,比GPT-5 pro便宜90%

谷歌深夜重磅开源,深度研究Agent拿下SOTA,比GPT-5 pro便宜90%

谷歌发布三项AI Agent更新:Deep Research Agent功能升级并开源,通过多步强化学习提高信息搜索与报告生成效率;推出新基准DeepSearchQA,评估Agent复杂任务处理能力;发布交互API简化Gemini模型和Agent的开发流程。这些更新旨在提升数据安全、成本效益及应用灵活性,在金融、生物技术等领域展现潜力。

来源:36氪

08:16

AI专业爆火,CS被美国00后抛弃了

AI专业爆火,CS被美国00后抛弃了

随着AI技术的快速发展,美国高校中AI相关专业的热度急剧上升,成为吸引学生申请的新趋势。MIT的AI专业成立仅三年便成为该校第二大热门专业,同时全美超过300所院校提供AI学位。这种转变背后的原因是AI领域就业机会的增加以及对CS专业就业前景的担忧。AI不仅在计算机科学领域内取代了部分地位,在金融、法律、工程、医学等传统专业也产生了深远影响。

来源:36氪

08:16

GPT-5.2来了,首个“专家级”AI复仇成功,牛马打工人终于得救了

GPT-5.2来了,首个“专家级”AI复仇成功,牛马打工人终于得救了

OpenAI发布GPT-5.2系列模型,涵盖即时版、思考版和专业版,专为解决高难度知识型工作设计。在多项基准测试中表现优异,尤其在通用智能、超长文本理解、Agent工具调用及视觉能力方面实现全面进化。GPT-5.2拥有更长的上下文窗口(40万Token)和更新的知识库(至2025年8月31日),并支持复杂逻辑推理。尽管价格较前代上涨40%,但其在编程、项目管理等领域的出色表现预示着更强的专业辅助能力。

来源:36氪

07:15

OpenAI发布更先进模型GPT-5.2

在谷歌发布广受好评的Gemini 3几周后,OpenAI宣布将推出一款新的人工智能模型,旨在提升 ChatGPT在编程、科学以及各种工作任务上的表现。该公司周四表示,新模型GPT-5.2速度更快,在查找信息、写作和翻译方面更为擅长。该模型共分三档,旨在更好地模拟人类的推理过程,以处理诸如数学、编程等领域中更复杂、更耗时的任务。GPT-5.2将于周四开始向付费用户推出。本月早些时候,OpenAI首席执行官Sam Altman在一份公司备忘录中宣布拉响“红色警报”,并表示应重新分配内部资源,加快对ChatGPT的改进。Altman表示:“Gemini 3对我们的影响没有担心的那么大。”Altman 还说,他预计OpenAI明年1月退出“红色警报”状态,以非常强劲的姿态重回常态。(广角观察)

来源:钛媒体

02:09

谷歌的AI试衣功能现在只需一张自拍即可使用

谷歌的AI试衣功能现在只需一张自拍即可使用

Google升级了AI试穿功能,用户仅需一张自拍照即可虚拟试穿衣物。该功能基于Gemini 2.5 Flash Image模型(Nano Banana),能够生成用户的全身数字形象,并支持多种体型选择。此外,Google还通过其Doppl应用提供了一个可购物的发现流,展示个性化推荐并允许用户虚拟试穿新商品。这项技术展示了计算机视觉在电商领域的最新应用及其提升用户体验的潜力。

来源:TechCrunch AI

02:02

OpenAI 在“红色警报”备忘录后以 GPT-5.2 回击谷歌

OpenAI 在“红色警报”备忘录后以 GPT-5.2 回击谷歌

OpenAI发布GPT-5.2,面向开发者与专业用户,提供Instant、Thinking和Pro三种模式,分别针对常规查询、复杂结构化工作及高精度需求。该模型在编码、数学、科学、视觉理解等方面表现卓越,旨在推动企业级应用开发。面对Google Gemini 3的竞争,GPT-5.2在多项基准测试中领先,强调了其在多模态处理和长文本推理上的优势。

来源:TechCrunch AI