标签筛选

日期筛选

日

一

二

三

四

五

六

29

30

31

01

02

03

04

05

06

07

08

09

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

01

02

03

04

05

06

07

08

09

1月

38 条

2月

1 条

3月

3 条

4月

0 条

5月

0 条

6月

0 条

7月

0 条

8月

0 条

9月

0 条

10月

0 条

11月

0 条

12月

0 条

AI新闻

已选标签:

多模态AI

12月 12日

4 条新闻

03:08

迪士尼向谷歌发出停止侵权通知，声称其存在“大规模”版权侵犯行为

迪士尼向谷歌发出停止侵权通知，声称其存在“大规模”版权侵犯行为

迪士尼指控谷歌大规模侵犯其版权，称谷歌利用AI模型和服务未经授权分发迪士尼的图像和视频。信中指出，谷歌的AI系统侵犯了包括《冰雪奇缘》、《狮子王》等作品中的角色版权，并且生成的内容带有谷歌Gemini标志，误导用户认为该行为得到迪士尼授权。同日，迪士尼与OpenAI签署10亿美元协议，将旗下角色引入Sora AI视频生成器。

来源：TechCrunch AI

02:09

谷歌的AI试衣功能现在只需一张自拍即可使用

谷歌的AI试衣功能现在只需一张自拍即可使用

Google升级了AI试穿功能，用户仅需一张自拍照即可虚拟试穿衣物。该功能基于Gemini 2.5 Flash Image模型（Nano Banana），能够生成用户的全身数字形象，并支持多种体型选择。此外，Google还通过其Doppl应用提供了一个可购物的发现流，展示个性化推荐并允许用户虚拟试穿新商品。这项技术展示了计算机视觉在电商领域的最新应用及其提升用户体验的潜力。

来源：TechCrunch AI

02:02

OpenAI 在“红色警报”备忘录后以 GPT-5.2 回击谷歌

OpenAI 在“红色警报”备忘录后以 GPT-5.2 回击谷歌

OpenAI发布GPT-5.2，面向开发者与专业用户，提供Instant、Thinking和Pro三种模式，分别针对常规查询、复杂结构化工作及高精度需求。该模型在编码、数学、科学、视觉理解等方面表现卓越，旨在推动企业级应用开发。面对Google Gemini 3的竞争，GPT-5.2在多项基准测试中领先，强调了其在多模态处理和长文本推理上的优势。

来源：TechCrunch AI

01:00

Runway发布首款全球模型，并在最新视频模型中加入原生音频功能

Runway发布首款全球模型，并在最新视频模型中加入原生音频功能

Runway 发布其首个世界模型 GWM-1，通过逐帧预测模拟物理世界的运行方式，适用于机器人、生命科学等领域的代理训练。同时，Runway 更新了其 Gen 4.5 视频模型，新增原生音频及多镜头长视频生成能力。GWM-1 包括 GWM-Worlds、GWM-Robotics 和 GWM-Avatars 三个版本，分别用于创建交互式项目、机器人仿真和人类行为模拟，标志着视频生成模型正从原型向生产级工具迈进。

来源：TechCrunch AI

12月 11日

16 条新闻

23:21

迪士尼与OpenAI达成协议，允许使用索拉生成包含其角色的人工智能视频

迪士尼与OpenAI达成协议，允许使用索拉生成包含其角色的人工智能视频

迪士尼与OpenAI达成三年合作，将旗下超过200个角色引入Sora AI视频生成器及ChatGPT Images功能中，允许用户通过文本提示创建包含这些角色的短片。迪士尼同时向OpenAI投资10亿美元，并计划利用其API开发新产品和服务。此次合作展示了人工智能在内容创作领域的潜力，强调了负责任地扩展故事叙述边界的重要性。

来源：TechCrunch AI

23:00

《时代》杂志将“人工智能的构建者”评为年度人物

《时代》杂志将“人工智能的构建者”评为年度人物

《时代》杂志将2025年度人物授予“AI建筑师”，包括Nvidia、Tesla、OpenAI等公司的CEO们，他们通过数十亿美元的投资推动了AI技术的发展与应用，重塑了政府政策、加剧了地缘政治竞争，并加速了AI在全球范围内的普及。文章指出，AI已成为自核武器以来最具影响力的工具，在信息环境、气候变化及生计等方面产生了深远影响。

来源：TechCrunch AI

21:00

对Spoor鸟类监测AI软件的兴趣正在飙升

对Spoor鸟类监测AI软件的兴趣正在飙升

挪威初创公司Spoor利用计算机视觉技术，开发出可识别并追踪鸟类的软件，帮助风电场减少对鸟类的影响。该软件能检测2.5公里范围内的鸟类活动，并与任何高分辨率相机兼容。通过不断优化AI模型，其鸟类识别准确率已达96%。除了风电行业，机场和水产养殖业也对该技术表现出兴趣。随着监管趋严，此类环保监测工具的需求将持续增长。

来源：TechCrunch AI

20:00

高通万卫星：混合AI与分布式协同是未来 | MEET2026

高通万卫星：混合AI与分布式协同是未来 | MEET2026

高通公司AI产品技术中国区负责人万卫星在MEET2026智能未来大会上指出，产业正从生成式AI向智能体AI演进。终端侧AI正在从单一模态向全模态交互发展，并面临内存限制、带宽瓶颈与功耗控制等挑战。高通通过量化压缩、并行解码技术和异构计算架构等手段应对这些挑战。未来，混合AI与分布式协同将成为趋势，实现跨设备的个性化服务。

来源：量子位

19:55

昔日开源霸主承认蒸馏阿里千问，世界进入中国AI时间

昔日开源霸主承认蒸馏阿里千问，世界进入中国AI时间

阿里巴巴千问Qwen开源模型在性能和生态指标上全面超越Meta的Llama系列，成为全球最强开源AI模型。Qwen支持多模态处理及119种语言，广泛应用于硅谷核心领域及全球开发者社区，显示出中国开源技术在全球化市场中的认可度。阿里的全栈AI布局推动了其商业化成功，并引领全球AI开源生态的结构性重塑。

来源：36氪

19:55

Meta新AI大模型“牛油果”有望明年一季度发布，使用阿里Qwen模型蒸馏学习

Meta 正在开发代号为“牛油果”的新AI模型，采用阿里巴巴Qwen等第三方模型进行蒸馏优化，计划以闭源形式发布。该项目由新任首席AI官Alexandr Wang领导，旨在提升复杂推理和跨模态生成能力。面对高昂的研发成本及市场压力，扎克伯格正推动公司战略转向可变现的人工智能模型研发。

来源：36氪

19:55

何恺明NeurIPS 2025演讲盘点：视觉目标检测三十年

何恺明NeurIPS 2025演讲盘点：视觉目标检测三十年

NeurIPS 2025 颁发「时间检验奖」给《Faster R-CNN》，表彰其在计算机视觉领域，特别是目标检测方面的里程碑式贡献。该论文自2015年发表以来，奠定了现代目标检测框架的核心范式，推动了视觉智能的发展。何恺明的演讲回顾了从手工特征到深度学习模型（如AlexNet、R-CNN系列）再到Transformer架构的演变历程，强调了技术革新如何解决复杂场景下的挑战，并展望了未来计算机视觉领域的探索方向。

来源：36氪

19:54

倒反天罡，Meta抄阿里千问作业，没拿授权

倒反天罡，Meta抄阿里千问作业，没拿授权

Meta在研发新大模型“牛油果”时，采用阿里云通义千问开源模型进行微调优化，标志着中国AI技术在全球范围内影响力增强。面对Llama 4表现不佳及与竞争对手差距拉大的挑战，Meta转向闭源专有路线，计划于2026年发布性能对标GPT-5的‘牛油果’。此转变反映了AI领域内从开源到闭源策略的调整趋势，以及中国AI企业崛起对全球格局的影响。

来源：36氪

18:51

2025年，那些跨界机器人的造车势力

2025年，那些跨界机器人的造车势力

多家车企在广州国际汽车展上展示人形机器人产品，预示着汽车行业正加速布局具身智能领域。背后驱动因素包括市值增长需求、生产力提升渴望及技术复用可能性。AI大模型的应用使得机器人在智能决策与高精度操作方面展现潜力。然而，资金压力、技术门槛以及数据积累仍是挑战。随着标准化进程推进，车企有望通过内部使用和合作方式逐步降低研发成本，推动机器人向消费级场景渗透。

来源：36氪

18:51

Meta大转向：下一代模型“牛油果”推迟，开源时代或将终结

Meta大转向：下一代模型“牛油果”推迟，开源时代或将终结

Meta调整AI战略，推迟至2026年一季度发布下一代模型Avocado，并转向闭源模式。此举标志着Meta从开源生态向更具防御性和商业导向策略的转变。为支持闭源模型，Meta增加资本支出至700-720亿美元，重点投向训练集群与数据中心扩建。组织层面，FAIR与GenAI影响力减弱，新成立的MSL强调产品落地与闭环速度。硬件方面，Meta削减元宇宙预算，资源重心转向AI相关设备。整体上，Meta正构建一个更封闭、集中且以商业结果为导向的AI体系。

来源：36氪

18:51

张亚勤院士：基础大模型最终不超过10个，十年后机器人比人多

张亚勤院士：基础大模型最终不超过10个，十年后机器人比人多

张亚勤在MEET2026智能未来大会上提出，新一轮人工智能是信息、物理和生物智能的融合。ChatGPT与DeepSeek代表了从鉴别式AI向生成式及推理式AI的转变，预示着高效率、低成本和开源生态下的快速落地。未来5-10年将步入“智能体互联网”时代，基础大模型类似操作系统，全球主要玩家不超过十家，智能体将成为企业和个人交互的新形态，并推动AGI发展。

来源：36氪

18:50

马斯克警告：AI将让我们集体“退休”，在火星上生活要比想象中更残酷

马斯克警告：AI将让我们集体“退休”，在火星上生活要比想象中更残酷

埃隆·马斯克在访谈中预测，随着AI与机器人技术的发展，未来人类或将进入无需为工作担忧的时代。他强调了AI和机器人将承担所有生产和服务任务的可能性，并表达了对AI快速发展可能带来的风险的担忧。此外，马斯克还讨论了关于火星殖民、信息筛选的重要性以及个人安全考量等议题，勾勒出一幅充满挑战与机遇并存的未来图景。

来源：36氪

18:50

Meta闭源转向：巨头的求生与AI行业的范式重构

Meta闭源转向：巨头的求生与AI行业的范式重构

Meta宣布以143亿美元收购团队并重组实验室，押注闭源模型Avocado，计划融合谷歌Gemma、OpenAI gpt-oss与阿里通义千问的技术亮点。此举标志着Meta从开源转向闭源，旨在解决盈利难题及满足核心行业对数据安全的需求。尽管面临兼容性和知识产权等挑战，但这一转型预示着AI行业进入‘开源铺路、闭源掘金’的新阶段，强调了商业变现的重要性。

来源：36氪

18:50

商汤方舟SenseFoundry平台全面升级，要打造下一代城市智能底座｜最前线

商汤科技发布升级版视觉AI平台“商汤方舟”，通过“通专融合”与“智训闭环”体系，革新算法生产模式，实现高效部署和低成本维护。新平台支持多模态大模型调度，推动城市治理智能化转型，并已在交通、文旅等多个领域规模化应用。其技术突破不仅提升了视觉理解能力，还能进行智能决策，加速产业智能化进程。

来源：36氪

18:50

GPT在模仿人类？Nature发现：大脑才是最早的Transformer

GPT在模仿人类？Nature发现：大脑才是最早的Transformer

最新Nature研究揭示GPT的层级结构与人脑处理语言的时间序列惊人一致，表明理解语言可能基于预测而非解析。实验通过对比GPT-2和Llama-2模型与大脑电活动，发现模型深层结构与大脑高阶语义区高度对应，挑战了传统语言学规则。这不仅改变了我们对语言本质的理解，还强调了AI模型在模拟人类认知过程中的潜力。

来源：36氪

17:48

当AI手机开始“越权”：豆包的颠覆体验，动了谁的奶酪？

当AI手机开始“越权”：豆包的颠覆体验，动了谁的奶酪？

豆包AI手机通过将智能体嵌入操作系统底层，实现了跨应用操作和一键托管功能，显著提升了用户体验。其端侧记忆功能使手机具备了长期记忆能力，能够处理复杂模糊的指令并规划一系列操作。然而，该技术面临来自互联网企业的封禁挑战，主要源于对用户意图与平台逻辑之间的冲突。尽管存在障碍，AI驱动体验重构的趋势不可阻挡，预计2025年全球AI手机渗透率将达到32%。

来源：36氪

« 上一页
1
…
4
5
6
7
8
…
19
下一页 »