标签筛选

日期筛选

日

一

二

三

四

五

六

29

30

31

01

02

03

04

05

06

07

08

09

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

01

02

03

04

05

06

07

08

09

1月

65 条

2月

6 条

3月

16 条

4月

0 条

5月

0 条

6月

0 条

7月

0 条

8月

0 条

9月

0 条

10月

0 条

11月

0 条

12月

0 条

AI新闻

已选标签:

AI对话

多模态AI

12月 12日

14 条新闻

10:20

别让米其林主厨削土豆，英伟达用“小脑指挥大脑”，重构AGI生产力

别让米其林主厨削土豆，英伟达用“小脑指挥大脑”，重构AGI生产力

英伟达推出8B参数的Orchestrator模型，通过组合工具实现降本增效，在HLE等基准测试中超越GPT-5，成本仅为后者30%。该模型采用强化学习训练，能精准调度不同功能的小模型和工具，显著提升效率与成本效益，代表了从单一强大模型向复合AI系统转变的新趋势。

来源：36氪

10:20

GPT-5.2性能爆表，但红色警报没有解除

GPT-5.2性能爆表，但红色警报没有解除

ChatGPT-5.2在数学推理、专业工作及长文档理解方面取得显著进步，尤其在AIME 2025竞赛中获满分，并在软件工程与视觉理解任务上表现出色。尽管其性能提升巨大且成本效率提高约390倍，但在特定语言理解测试中落后于竞争对手。OpenAI通过高价策略试图将其定位为高端产品，但面临市场对性价比的更高要求。

来源：36氪

10:20

我的男友是虚拟的，但他很快就会变成现实｜深氪

我的男友是虚拟的，但他很快就会变成现实｜深氪

文章探讨了AI技术在乙女游戏中的应用，特别是通过大语言模型和计算机视觉技术增强游戏角色的真实感与互动性。如《恋与深空》利用Unity2019平台及自定义渲染管线实现高质量3D效果，并结合ChatGPT等AI工具提供个性化对话体验，满足玩家情感需求。这不仅推动了游戏行业的创新发展，也反映了AI技术在改善人类孤独感方面的潜力。

来源：36氪

10:20

GPT-5.2 上线，迪士尼投出 10 亿美元：AI 不止提效，还要讲故事

GPT-5.2 上线，迪士尼投出 10 亿美元：AI 不止提效，还要讲故事

OpenAI 发布 GPT-5.2，显著提升专业任务执行能力与业务场景适配度，特别是在职业任务和工具调用方面展现卓越性能。与此同时，迪士尼宣布与 OpenAI 达成三年期授权协议，并投资 10 亿美元，允许 Sora 使用超过 200 个知名角色生成内容，标志着 AI 正式成为内容创作伙伴而非单纯提效工具。双方合作旨在构建一个完整的创作者操作系统，涵盖从语言理解到视觉生成的全链路内容生态，预示着 AI 在内容创作领域的应用将进入新阶段。

来源：36氪

09:18

豆包手机“封禁”背后，藏着所有品牌都该懂的未来生存法则

豆包手机助手事件揭示了AI助手可能颠覆传统营销方式的趋势。AI助手作为用户与商业世界的中介，将改变品牌触达用户的方式，使购物平台管道化，并影响品牌的数据获取和创新。面对这一挑战，品牌需从满足功能需求转向提供情感和社交价值，构建深层次的用户关系，以在AI时代保持竞争力。

来源：36氪

09:18

Meta版“甄嬛传”，28岁天才上位，掌管6千亿命脉，AI教父愤然出走

Meta版“甄嬛传”，28岁天才上位，掌管6千亿命脉，AI教父愤然出走

Meta内部因AI战略分歧引发权力斗争，开源策略受质疑。扎克伯格寄希望于28岁的Alexandr Wang带领TBD Lab团队突破困境，但面临新旧势力冲突、算力分配争议及产品开发流程适应性问题。最新模型Avocado或将不再开源，Meta正重新配置资源以应对挑战。

来源：36氪

09:18

一文读懂GPT-5.2 : 直指“经济价值”，硬刚Gemini3的剧情未出现

一文读懂GPT-5.2 : 直指“经济价值”，硬刚Gemini3的剧情未出现

OpenAI发布GPT-5.2，强调其在专业知识工作和企业级应用中的性能跃升，特别是在电子表格处理、演示文稿制作、代码编写等方面超越或持平人类专家。新模型分为Instant、Thinking、Pro三个版本，旨在满足从日常任务到复杂科研的不同需求。GPT-5.2在多工具编排任务、长文本理解和视觉理解方面表现出色，为企业提供了更高效稳定的智能解决方案。

来源：36氪

08:18

谷歌发布了迄今为止最强大的AI研究代理——就在同一天，OpenAI推出了GPT-5.2

谷歌发布了迄今为止最强大的AI研究代理——就在同一天，OpenAI推出了GPT-5.2

Google 发布了基于 Gemini 3 Pro 的新版研究代理 Gemini Deep Research，该代理不仅能够生成研究报告，还允许开发者通过新的 Interactions API 将其研究能力嵌入到自己的应用中。此工具适用于从尽职调查到药物毒性安全研究等多种任务，并将被整合进 Google Search、Google Finance 等服务中。此外，Google 引入了名为 DeepSearchQA 的新基准来测试代理在复杂多步骤信息检索任务中的表现，以证明其在减少 AI 幻觉方面的进步。

来源：TechCrunch AI

08:16

GPT-5.2来了，首个“专家级”AI复仇成功，牛马打工人终于得救了

GPT-5.2来了，首个“专家级”AI复仇成功，牛马打工人终于得救了

OpenAI发布GPT-5.2系列模型，涵盖即时版、思考版和专业版，专为解决高难度知识型工作设计。在多项基准测试中表现优异，尤其在通用智能、超长文本理解、Agent工具调用及视觉能力方面实现全面进化。GPT-5.2拥有更长的上下文窗口（40万Token）和更新的知识库（至2025年8月31日），并支持复杂逻辑推理。尽管价格较前代上涨40%，但其在编程、项目管理等领域的出色表现预示着更强的专业辅助能力。

来源：36氪

07:15

OpenAI发布更先进模型GPT-5.2

在谷歌发布广受好评的Gemini 3几周后，OpenAI宣布将推出一款新的人工智能模型，旨在提升 ChatGPT在编程、科学以及各种工作任务上的表现。该公司周四表示，新模型GPT-5.2速度更快，在查找信息、写作和翻译方面更为擅长。该模型共分三档，旨在更好地模拟人类的推理过程，以处理诸如数学、编程等领域中更复杂、更耗时的任务。GPT-5.2将于周四开始向付费用户推出。本月早些时候，OpenAI首席执行官Sam Altman在一份公司备忘录中宣布拉响“红色警报”，并表示应重新分配内部资源，加快对ChatGPT的改进。Altman表示：“Gemini 3对我们的影响没有担心的那么大。”Altman 还说，他预计OpenAI明年1月退出“红色警报”状态，以非常强劲的姿态重回常态。（广角观察）

来源：钛媒体

03:08

迪士尼向谷歌发出停止侵权通知，声称其存在“大规模”版权侵犯行为

迪士尼向谷歌发出停止侵权通知，声称其存在“大规模”版权侵犯行为

迪士尼指控谷歌大规模侵犯其版权，称谷歌利用AI模型和服务未经授权分发迪士尼的图像和视频。信中指出，谷歌的AI系统侵犯了包括《冰雪奇缘》、《狮子王》等作品中的角色版权，并且生成的内容带有谷歌Gemini标志，误导用户认为该行为得到迪士尼授权。同日，迪士尼与OpenAI签署10亿美元协议，将旗下角色引入Sora AI视频生成器。

来源：TechCrunch AI

02:09

谷歌的AI试衣功能现在只需一张自拍即可使用

谷歌的AI试衣功能现在只需一张自拍即可使用

Google升级了AI试穿功能，用户仅需一张自拍照即可虚拟试穿衣物。该功能基于Gemini 2.5 Flash Image模型（Nano Banana），能够生成用户的全身数字形象，并支持多种体型选择。此外，Google还通过其Doppl应用提供了一个可购物的发现流，展示个性化推荐并允许用户虚拟试穿新商品。这项技术展示了计算机视觉在电商领域的最新应用及其提升用户体验的潜力。

来源：TechCrunch AI

02:02

OpenAI 在“红色警报”备忘录后以 GPT-5.2 回击谷歌

OpenAI 在“红色警报”备忘录后以 GPT-5.2 回击谷歌

OpenAI发布GPT-5.2，面向开发者与专业用户，提供Instant、Thinking和Pro三种模式，分别针对常规查询、复杂结构化工作及高精度需求。该模型在编码、数学、科学、视觉理解等方面表现卓越，旨在推动企业级应用开发。面对Google Gemini 3的竞争，GPT-5.2在多项基准测试中领先，强调了其在多模态处理和长文本推理上的优势。

来源：TechCrunch AI

01:00

Runway发布首款全球模型，并在最新视频模型中加入原生音频功能

Runway发布首款全球模型，并在最新视频模型中加入原生音频功能

Runway 发布其首个世界模型 GWM-1，通过逐帧预测模拟物理世界的运行方式，适用于机器人、生命科学等领域的代理训练。同时，Runway 更新了其 Gen 4.5 视频模型，新增原生音频及多镜头长视频生成能力。GWM-1 包括 GWM-Worlds、GWM-Robotics 和 GWM-Avatars 三个版本，分别用于创建交互式项目、机器人仿真和人类行为模拟，标志着视频生成模型正从原型向生产级工具迈进。

来源：TechCrunch AI

12月 11日

6 条新闻

23:21

迪士尼与OpenAI达成协议，允许使用索拉生成包含其角色的人工智能视频

迪士尼与OpenAI达成协议，允许使用索拉生成包含其角色的人工智能视频

迪士尼与OpenAI达成三年合作，将旗下超过200个角色引入Sora AI视频生成器及ChatGPT Images功能中，允许用户通过文本提示创建包含这些角色的短片。迪士尼同时向OpenAI投资10亿美元，并计划利用其API开发新产品和服务。此次合作展示了人工智能在内容创作领域的潜力，强调了负责任地扩展故事叙述边界的重要性。

来源：TechCrunch AI

23:00

《时代》杂志将“人工智能的构建者”评为年度人物

《时代》杂志将“人工智能的构建者”评为年度人物

《时代》杂志将2025年度人物授予“AI建筑师”，包括Nvidia、Tesla、OpenAI等公司的CEO们，他们通过数十亿美元的投资推动了AI技术的发展与应用，重塑了政府政策、加剧了地缘政治竞争，并加速了AI在全球范围内的普及。文章指出，AI已成为自核武器以来最具影响力的工具，在信息环境、气候变化及生计等方面产生了深远影响。

来源：TechCrunch AI

21:00

对Spoor鸟类监测AI软件的兴趣正在飙升

对Spoor鸟类监测AI软件的兴趣正在飙升

挪威初创公司Spoor利用计算机视觉技术，开发出可识别并追踪鸟类的软件，帮助风电场减少对鸟类的影响。该软件能检测2.5公里范围内的鸟类活动，并与任何高分辨率相机兼容。通过不断优化AI模型，其鸟类识别准确率已达96%。除了风电行业，机场和水产养殖业也对该技术表现出兴趣。随着监管趋严，此类环保监测工具的需求将持续增长。

来源：TechCrunch AI

21:00

Opera希望您每月支付20美元使用其AI驱动的Neon浏览器

Opera希望您每月支付20美元使用其AI驱动的Neon浏览器

Opera 推出 AI 驱动的浏览器 Neon，集成聊天机器人以执行任务、创建应用和视频等。Neon 利用浏览历史提供上下文信息，并支持构建重复任务卡片及深度研究代理。订阅服务包括访问顶级模型如 Gemini 3 Pro 和 GPT-5.1 等。尽管 Opera 的其他产品也提供免费 AI 功能，但 Neon 更注重为早期技术爱好者提供最新 AI 技术体验。

来源：TechCrunch AI

20:00

高通万卫星：混合AI与分布式协同是未来 | MEET2026

高通万卫星：混合AI与分布式协同是未来 | MEET2026

高通公司AI产品技术中国区负责人万卫星在MEET2026智能未来大会上指出，产业正从生成式AI向智能体AI演进。终端侧AI正在从单一模态向全模态交互发展，并面临内存限制、带宽瓶颈与功耗控制等挑战。高通通过量化压缩、并行解码技术和异构计算架构等手段应对这些挑战。未来，混合AI与分布式协同将成为趋势，实现跨设备的个性化服务。

来源：量子位

19:55

昔日开源霸主承认蒸馏阿里千问，世界进入中国AI时间

昔日开源霸主承认蒸馏阿里千问，世界进入中国AI时间

阿里巴巴千问Qwen开源模型在性能和生态指标上全面超越Meta的Llama系列，成为全球最强开源AI模型。Qwen支持多模态处理及119种语言，广泛应用于硅谷核心领域及全球开发者社区，显示出中国开源技术在全球化市场中的认可度。阿里的全栈AI布局推动了其商业化成功，并引领全球AI开源生态的结构性重塑。

来源：36氪

« 上一页
1
…
7
8
9
10
11
…
27
下一页 »