标签筛选

日期筛选

日

一

二

三

四

五

六

29

30

31

01

02

03

04

05

06

07

08

09

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

01

02

03

04

05

06

07

08

09

1月

38 条

2月

1 条

3月

3 条

4月

0 条

5月

0 条

6月

0 条

7月

0 条

8月

0 条

9月

0 条

10月

0 条

11月

0 条

12月

0 条

AI新闻

已选标签:

多模态AI

12月 14日

1 条新闻

04:35

AI数据中心热潮可能对其他基础设施项目不利

AI数据中心热潮可能对其他基础设施项目不利

随着数据中心建设加速，尤其是AI相关的基础设施如大语言模型和多模态模型的部署需求激增，预计2025年将达到超过410亿美元的投资规模。这不仅与政府在交通建设上的支出相当，还导致了劳动力短缺问题加剧，影响其他基础设施项目的进度。此现象反映了AI技术快速发展对算力资源及物理空间的需求增加，同时也提出了成本控制和技术优化的新挑战。

来源：TechCrunch AI

12月 13日

11 条新闻

22:41

美国视频生成老炮儿，入局世界模型

美国视频生成老炮儿，入局世界模型

Runway发布首个通用世界模型GWM-1及其变体，包括模拟真实环境的GWM Worlds、模拟对话的GWM Avatars和用于机器人操作的GWM Robotics。这些基于Gen-4.5升级版构建的模型采用自回归架构，支持实时交互控制，展示了在虚拟环境构建、客户服务及机器人训练等领域的应用潜力。同时，Gen-4.5新增原生音频生成与编辑功能，进一步扩展了其应用场景。

来源：量子位

22:37

面向「空天具身智能」，北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」，北航团队提出星座规划新基准丨NeurIPS’25

北航团队提出首个大规模真实星座调度基准AEOS-Bench，并创新性地将Transformer模型与航天工程需求融合，训练出内嵌时间约束的调度模型AEOS-Former。该研究为卫星星座任务规划提供了高效解决方案，显著提升了任务完成率和资源利用率，展示了AI在空天具身智能领域的巨大潜力。

来源：量子位

13:02

CPU，为何“偷偷转型”？

随着GPU销售额首次超越CPU，半导体产业进入加速计算主导的新周期。面对大规模并行计算任务，传统CPU面临能效比与I/O瓶颈挑战，正转型为异构系统的调度中枢。技术革新包括微架构层面的去推测化和系统级架构的专用化分流，以适应AI负载需求。此外，CPU在推理场景、内存扩展及边缘计算中扮演重要角色，市场对开放架构与异构协同能力的需求日益增长。

来源：36氪

13:02

CPU，为何“偷偷转型”？

随着GPU销售额首次超越CPU，半导体产业进入加速计算主导的新周期。面对大规模并行计算任务，传统CPU面临能效比与I/O瓶颈挑战，正转型为异构系统的调度中枢。技术革新包括微架构层面的去推测化和系统级架构的专用化分流，以适应AI负载需求。此外，CPU在推理场景、内存扩展及边缘计算中扮演重要角色，市场对开放架构与异构协同能力的需求日益增长。

来源：36氪

12:53

交大高金朱宁：经济学家视角下AI时代的范式思维转变 | MEET2026

交大高金朱宁：经济学家视角下AI时代的范式思维转变 | MEET2026

上海交通大学金融学教授朱宁从经济学家视角探讨了AI时代的范式思维转变，指出随着AI技术的发展，人类的核心优势如算力、创意和时间等逐渐变得不再稀缺，这将对经济学逻辑产生深远影响。他强调，在AI时代，应更多考虑如何掌握AI技术并与之共生，而非担忧行业被替代。此外，AI还将改变全球财富分配格局及国际贸易形式，引发新的监管与治理挑战。

来源：量子位

12:53

交大高金朱宁：经济学家视角下AI时代的范式思维转变 | MEET2026

交大高金朱宁：经济学家视角下AI时代的范式思维转变 | MEET2026

上海交通大学金融学教授朱宁从经济学家视角探讨了AI时代的范式思维转变，指出随着AI技术的发展，人类的核心优势如算力、创意和时间等逐渐变得不再稀缺，这将对经济学逻辑产生深远影响。他强调，在AI时代，应更多考虑如何掌握AI技术并与之共生，而非担忧行业被替代。此外，AI还将改变全球财富分配格局及国际贸易形式，引发新的监管与治理挑战。

来源：量子位

11:00

深圳将建全国首个机器人友好示范城区

12月12日至14日，广东省具身智能训练场“1+1+N”体系将正式发布。“1+1+N”体系包括：“1”个广东核心中枢——广东省具身智能训练场（简称“省训练场”），由主训练场和管理中心两部分构成。“1”个深圳示范窗口——深圳具身智能示范区，探索建设全国首个具身智能机器人友好示范城区，侧重封闭训练后的机器人在街区开放式训练，激活场景价值。“N”个垂直分训练场——横跨不同地市、深耕不同领域的垂直场景专业化训练平台，联动地市、赋能产业、精准定位、解决痛点，与主训练场优势互补、资源共享、共建共创、相互赋能。（深圳发布）

来源：钛媒体

09:58

谷歌称将Gemini的翻译功能引入谷歌的文本翻译

谷歌称将Gemini的翻译功能引入谷歌的文本翻译，并推出耳机实时语音转语音翻译的测试版体验。（广角观察）

来源：钛媒体

04:45

在iOS 26.2中，苹果再次允许您回滚液态玻璃——这次是在锁屏上

在iOS 26.2中，苹果再次允许您回滚液态玻璃——这次是在锁屏上

Apple在iOS 26.2更新中增强了用户对Liquid Glass透明度的控制，允许调整锁屏时钟透明度。此次更新体现了苹果对用户反馈的响应及界面设计的灵活性。值得注意的是，新版本中的Podcasts应用增加了AI生成章节功能，提升了用户体验。这些改进展示了AI技术在个性化和内容优化方面的潜力，同时反映了苹果在人机交互设计上的持续探索。

来源：TechCrunch AI

03:38

好的，领英的算法到底怎么了？

好的，领英的算法到底怎么了？

新闻报道了LinkedIn用户通过#WearthePants实验测试平台算法对性别偏见的假设。实验者发现，更改个人资料中的性别后，其内容曝光率显著增加。尽管LinkedIn声明其算法不基于人口统计信息来决定内容可见性，但专家认为可能存在隐性偏见。此事件揭示了AI系统在公平性和透明度方面的挑战，尤其是在大语言模型等技术应用于社交媒体时。

来源：TechCrunch AI

01:00

谷歌翻译现支持实时语音翻译至耳机播放

谷歌翻译现支持实时语音翻译至耳机播放

Google推出实时耳机翻译测试版，通过深度学习和语音识别技术实现实时翻译，保持说话者的语调、强调和节奏。该功能支持70多种语言，并计划在2026年扩展到iOS平台和其他国家。同时，Google Translate引入了先进的Gemini能力，提高了文本翻译的准确性，更好地处理俚语、成语等复杂表达。此外，Google还扩展了语言学习工具至近20个国家，增强了用户反馈和学习进度跟踪功能。

来源：TechCrunch AI

12月 12日

8 条新闻

19:38

中国首个全自主无人化人形机器人导览解决方案发布

北京人形机器人创新中心日前发布全国首个全自主无人化人形机器人导览解决方案。该方案深度整合全自主导览、拟人化交互、多机调度、全局IOT联动等关键能力，可覆盖展厅导览、商场导购、业务讲解、文旅景区等多元场景。此次解决方案的发布，标志着人形机器人导览正式迈入“全自主、无人化”的新阶段。未来，该方案可广泛应用于展厅导览、商场导购、业务讲解、文旅景区等场景，通过多机协同与全域联动，为用户带来更专业、更生动的智能服务体验。（央视新闻）

来源：钛媒体

19:38

提示词一响，烂片登场，OpenAI谈下200+迪士尼顶级IP出场费

提示词一响，烂片登场，OpenAI谈下200+迪士尼顶级IP出场费

迪士尼与OpenAI达成10亿美元投资及三年合作协议，授权旗下200多个顶级IP用于生成短视频内容。此举标志着版权方从封锁转为合作，通过UGC反哺Disney+平台，同时利用AI作为生产力工具。然而，这也引发了对品牌形象长期稀释和污染的担忧。

来源：36氪

19:38

花10亿美元，迪士尼让AI来拍“短片”了

迪士尼与OpenAI达成深度合作，授权超过200个IP元素用于Sora和ChatGPT Images中，标志着娱乐行业进入AI工业化阶段。通过生成式AI技术，粉丝可以轻松创作包含迪士尼角色的短视频和静态图像，并有机会在Disney+上展示。此次合作不仅改变了IP运营逻辑，还可能影响未来剧集生命周期评估标准。

来源：36氪

18:36

谷歌最新 Gemini Agent 爆击GPT-5.2？人类最后考试得分见分晓，网友：Altman又该发“红色警报”了

谷歌最新 Gemini Agent 爆击GPT-5.2？人类最后考试得分见分晓，网友：Altman又该发“红色警报”了

谷歌与OpenAI几乎同时发布重磅更新，分别推出Gemini Deep Research Agent和GPT-5.2。Gemini Deep Research基于Gemini 3 Pro构建，具备多步强化学习优化决策序列、超大规模上下文处理能力及可追溯引用来源等优势，在长链推理任务中表现突出。此外，谷歌还开源了DeepSearchQA基准测试，并提供了Interactions API，以增强智能体的交互控制能力。双方在基础模型能力和应用生态主导权上的竞争愈发激烈。

来源：36氪

18:36

实测 GPT-5.2 ：价格暴涨能力微涨，凭什么反击 Gemini

实测 GPT-5.2 ：价格暴涨能力微涨，凭什么反击 Gemini

GPT-5.2发布，包含Instant、Thinking和Pro三个版本，其在多模态理解和推理能力上显著提升，特别是在专业任务处理与3D建模方面表现优异。尽管响应时间变长，但准确性和复杂任务处理能力增强。知识更新至2025年8月。编程测试中，GPT-5.2展示了强大的代码生成能力，但在某些特定场景下仍落后于Claude。价格方面，GPT-5.2较前代上涨约40%。

来源：36氪

17:34

AI版「互联网协议」面世，豆包手机们再也不怕被「封禁」了？

AI版「互联网协议」面世，豆包手机们再也不怕被「封禁」了？

新闻探讨了GUI Agent与MCP协议在智能体AI领域的应用及挑战。GUI Agent通过模拟用户操作，直接在图形界面上执行任务，但面临系统权限、平台秩序和安全边界的问题。相比之下，MCP协议提供了一种统一的接口标准，降低了大模型与外部系统的集成门槛，为智能体AI建立了清晰的权限和边界，被视为未来AI互联网协议的标准。

来源：36氪

16:32

蚂蚁开源首个100B扩散语言模型LLaDA2.0

蚂蚁技术研究院今日宣布推出LLaDA2.0系列离散扩散大语言模型（dLLM），并同步公开了背后的技术报告。LLaDA2.0包含MoE架构的16B (mini)和100B (flash)两个版本，将Diffusion模型的参数规模首次扩展到了100B量级。（广角观察）

来源：钛媒体

16:32

里程碑时刻，首个100B扩散语言模型来了，技术报告揭秘背后细节

里程碑时刻，首个100B扩散语言模型来了，技术报告揭秘背后细节

扩散语言模型（dLLM）在短时间内实现了从16B到100B参数规模的飞跃，展现出超越传统自回归模型的潜力。蚂蚁集团联合多所高校推出的LLaDA2.0系列模型采用MoE架构，在多个复杂任务上表现优异。通过持续预训练策略和系统化后训练流程，成功将AR模型平滑转化为dLLM，并解决了长文本生成效率低下的问题。

来源：36氪

« 上一页
1
2
3
4
5
6
…
19
下一页 »