标签筛选

日期筛选

日

一

二

三

四

五

六

29

30

31

01

02

03

04

05

06

07

08

09

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

01

02

03

04

05

06

07

08

09

1月

38 条

2月

1 条

3月

3 条

4月

0 条

5月

0 条

6月

0 条

7月

0 条

8月

0 条

9月

0 条

10月

0 条

11月

0 条

12月

0 条

AI新闻

已选标签:

多模态AI

12月 2日

15 条新闻

19:24

退货率可达40%的AI眼镜，还是门好生意吗？

智能眼镜赛道在2025年末迎来激烈竞争，各大科技公司纷纷推出AI眼镜产品，价格持续下探至1500元左右。尽管销量增速显著，但高退货率反映了用户需求与技术瓶颈之间的差距。当前AI眼镜主要应用于便捷拍摄等场景，但在续航、AI功能实用性及网络连接稳定性方面存在不足。行业正经历残酷洗牌，企业需加速技术创新和生态建设以应对未来挑战。

来源：36氪

19:24

豆包的AI助手江湖

豆包的AI助手江湖

字节跳动推出搭载豆包AI助手的工程样机M153，标志着其在端侧多模态生成式AI应用上的重要进展。该手机助手通过高通骁龙8至尊版芯片支持，实现了自动语音识别、大语言模型交互等功能，展示了长文本处理、记忆及个性化服务等技术能力。与努比亚合作，豆包尝试了从工具到助理的角色转变，强调体验功能而非硬件性能的竞争。这表明，在AI助手领域，软件与硬件正在共同进化，以满足用户对于便捷交互的需求。

来源：36氪

18:22

这下Altman急了，OpenAI紧急启动「红色警报」

这下Altman急了，OpenAI紧急启动「红色警报」

OpenAI 面临谷歌等竞争对手的强势复苏，宣布进入红色警报状态，将集中资源改进ChatGPT。尽管过去一年中OpenAI在多模态、智能体等领域进行了广泛探索，但产品后续发展乏力。为应对挑战，OpenAI计划发布新推理模型，优化图像生成能力，并加强个性化互动与模型行为，以提升用户体验和竞争力。

来源：36氪

18:22

数据中心，电力告急

数据中心，电力告急

随着AI算力需求激增，数据中心电力消耗问题日益突出。高盛报告指出，美国AI发展面临的主要障碍是电力供应。初创公司如PowerLattice和Empower正致力于研发高效电源管理芯片，旨在减少能耗并提升计算效率，预计未来几年内将实现千兆瓦级别的能源节省。同时，第三代半导体材料GaN与SiC的应用，以及800V高压直流架构的推广，将进一步推动AI基础设施向更高效、更环保的方向发展。

来源：36氪

17:56

Runway Gen-4.5刷屏发布，把重量尘土和光影都做对了，网友：颠覆

Runway Gen-4.5刷屏发布，把重量尘土和光影都做对了，网友：颠覆

Runway Gen-4.5在文本转视频基准测试中以1247分超越所有现有模型，实现物理和视觉准确性突破。该模型擅长执行复杂序列式指令，生成的视频具有逼真的重量感与动量特征，适用于多种风格和场景。尽管存在因果推理等局限性，Gen-4.5展示了AI在多模态融合及内容生成领域的显著进步。

来源：量子位

16:52

商汤分拆了一家AI医疗公司，半年融资10亿，剑指“医疗世界模型”

商汤分拆了一家AI医疗公司，半年融资10亿，剑指“医疗世界模型”

商汤分拆的AI医疗公司半年内融资10亿，目标构建‘医疗世界模型’，以实现对医疗场景的全面感知与深度理解。其自研大语言模型‘大医®’在专业测试中表现优异，结合多模态基础模型群和双中台架构，形成数据-模型-场景-产业闭环。已在病理、影像等多个临床方向上线40余款AI模块，并与多家医院及企业合作，推动智慧医院建设。

来源：量子位

16:18

马斯克开「AI救国猛药」：3年解决美38万亿国债危机

马斯克开「AI救国猛药」：3年解决美38万亿国债危机

马斯克提出AI和机器人可在三年内解决美国债务危机，通过提高生产效率和降低劳动成本实现通缩。他强调旗下公司Tesla、SpaceX、xAI及Starlink正形成一个以AI为核心的技术体系，涵盖自动驾驶、真实世界AI、太空通信等。长期来看，AI与机器人将极大丰富物质供给，使货币失去意义，工作成为兴趣选择。此外，孙正义看好AI未来潜力，尽管抛售英伟达股票，但仍致力于投资AI领域。

来源：36氪

16:18

V3.2逼近Gemini 3，DeepSeek硬气喊话：接下来我要堆算力了

V3.2逼近Gemini 3，DeepSeek硬气喊话：接下来我要堆算力了

DeepSeek发布V3.2和V3.2-Speciale，证明了通过优化方法和数据而非单纯扩大模型规模来解决训练后瓶颈的可行性。V3.2引入稀疏注意力机制DSA，提高效率并融合思考与工具调用；Speciale则专注于深度推理，验证了过程监督可泛化至多个领域。两者共同展示了未来AI模型可能不再依赖人力堆砌，而是依靠自我博弈实现持续演进的趋势。

来源：36氪

16:18

五年，终于等来Transformers v5

五年，终于等来Transformers v5

Transformers v5 发布首个 RC 版本，标志着该 AI 基础设施库正式从 v4 升级至 v5。此次更新聚焦于极致简洁性、预训练支持、高性能推理引擎互操作性及量化提升为核心功能。Transformers 作为领先的模型定义库，通过持续演进保持其在人工智能领域的相关性与领先优势，进一步推动了多模态模型的发展，并加强了与各类推理引擎的兼容性，为未来AI技术的应用提供了坚实的基础。

来源：36氪

12:11

阿里发布Qwen-Image模型新版本，千问APP首发接入

阿里巴巴发布了图片生成及编辑模型Qwen-Image的更新。新模型在图像编辑中维持了更高的一致性，并在多视角转换、多图像融合、多模态推理等方面取得突破进展。目前，新版本Qwen-Image已首发接入千问APP，用户可无限次免费使用。（广角观察）

来源：钛媒体

11:09

可灵AI发布全新视频和图像模型可灵O1

可灵AI正式发布其全新产品“可灵O1”，定位为首个大一统的多模态创作工具。可灵O1基于全新的视频和图像模型，整合文字、视频、图片、主体等多模态输入。（广角观察）

来源：钛媒体

09:04

ChatGPT 三周年遭 DeepSeek 暴击，23 页技术报告藏着开源登顶的全部秘密

ChatGPT 三周年遭 DeepSeek 暴击，23 页技术报告藏着开源登顶的全部秘密

DeepSeek 发布了两款新模型 V3.2 和 V3.2-Speciale，分别在推理能力和工具调用方面取得突破。V3.2 引入稀疏注意力机制 DSA，显著提升了处理长文档的效率和性能；同时通过强化学习训练框架，实现了边思考边使用工具的能力，适用于日常问答、写作等场景。V3.2-Speciale 则面向高级任务，性能媲美 Gemini-3.0-Pro，但在成本和实用性上有所妥协。

来源：36氪

09:03

OpenAI危，DeepSeek放大招：追平谷歌最强，手撕GPT-5 High

OpenAI危，DeepSeek放大招：追平谷歌最强，手撕GPT-5 High

DeepSeek发布V3.2正式版，性能全面超越GPT-5 High，与谷歌Gemini-3.0 Pro持平。新模型凭借DSA稀疏注意力架构，在数学编程等多领域取得4项国际奥赛金牌级成绩，打破了速度、成本与智能的不可能三角。通过思维上下文管理和虚拟演练场训练，V3.2实现了高效推理与工具使用的无缝结合，展示了在有限算力下实现强智能的新路径。

来源：36氪

08:03

谷歌扩展Gemini 3和Nano Banana Pro在搜索中的应用

谷歌当地时间12月1日宣布，将在近120个国家和地区，将模型Gemini 3引入谷歌搜索的AI模式。即日起，谷歌AI Pro和Ultra订阅用户可开始使用Gemini 3 Pro。此外，谷歌称，还将在更多国家推出AI模式的生成式图像模型Nano Banana Pro，即日起AI Pro及Ultra订阅用户可率先使用。（广角观察）

来源：钛媒体

05:00

英伟达宣布推出新的开放AI模型和自动驾驶研究工具

英伟达宣布推出新的开放AI模型和自动驾驶研究工具

NVIDIA发布Alpamayo-R1，一款专为自动驾驶研究设计的开放视觉语言模型，基于Cosmos Reason模型，旨在提升车辆在复杂环境下的决策能力。该技术是实现4级自动驾驶的关键。同时，NVIDIA提供了Cosmos Cookbook等资源，帮助开发者更好地训练和使用Cosmos模型。这些举措表明NVIDIA正全力推进物理AI领域的发展，特别是机器人与自动驾驶方面。

来源：TechCrunch AI

12月 1日

5 条新闻

22:50

黑森林实验室以32.5亿美元估值筹集3亿美元资金

黑森林实验室以32.5亿美元估值筹集3亿美元资金

德国AI实验室Black Forest Labs完成3亿美元B轮融资，估值达32.5亿美元。该公司专注于开发生成和编辑图像的基础AI模型，其最新版本Flux 2支持高达4K分辨率的图像生成，并能参考多达10张图片保持风格一致性。该技术已被Adobe、ElevenLabs等多家公司采用。

来源：TechCrunch AI

22:30

2025年至今至少新增了80家科技独角兽企业

2025年至今至少新增了80家科技独角兽企业

2025年，AI领域涌现了多个独角兽企业，涵盖从基础技术到应用创新的广泛范围。Genspark和Gamma等公司通过开发AI代理及生成视觉内容取得显著进展；Modal、Fireworks AI和LangChain等平台则在云计算、开源模型基础设施及代理工程方面展现出强大潜力。这些企业在级解决方案不仅推动了AI技术的发展，也在自动驾驶、医疗诊断等领域实现了商业落地。此外，随着对算力效率与数据安全的关注增加，未来趋势将更加注重多模态融合与可解释性研究。

来源：TechCrunch AI

22:14

字节“豆包手机”刚开卖，吉利系进展也曝光了：首月速成200人团队，挖遍华为小米荣耀

字节“豆包手机”刚开卖，吉利系进展也曝光了：首月速成200人团队，挖遍华为小米荣耀

字节跳动推出搭载自研大模型Agent服务的AI手机，目标在于抢占AIOS赛道。与此同时，吉利系成立智跃千里公司，聚焦下一代AI终端生态和交互方式，计划自主研发包括手机、XR眼镜在内的硬件产品及AIOS系统。此举表明了AI与终端设备正经历更深层次融合的趋势，AI终端将成为连接模型能力与生活场景的关键入口，涵盖大模型、操作系统、软硬结合的产品形态及新交互模式。

来源：量子位

22:03

DeepSeek-V3.2系列开源，性能直接对标Gemini-3.0-Pro

DeepSeek-V3.2系列开源，性能直接对标Gemini-3.0-Pro

DeepSeek发布V3.2系列开源模型，性能对标Gemini-3.0-Pro。DeepSeek-V3.2适用于日常问答与工具调用，推理能力达GPT-5水平；DeepSeek-V3.2-Speciale专注复杂推理任务，在数学证明、编程竞赛等表现卓越。引入DSA稀疏注意力机制大幅降低计算成本，强化学习训练预算超预训练10%，显著提升模型在长序列处理及Agent任务上的效率与泛化能力。

来源：量子位

19:46

DeepSeek宣布同时发布两个正式版模型

DeepSeek宣布同时发布两个正式版模型：DeepSeek-V3.2和DeepSeek-V3.2-Speciale。官方网页端、App和API均已更新为正式版DeepSeek-V3.2；Speciale版本目前仅以临时API服务形式开放，以供社区评测与研究。

DeepSeek-V3.2的目标是平衡推理能力与输出长度，适合日常使用，例如问答场景和通用Agent任务场景；V3.2-Speciale是DeepSeek-V3.2的长思考增强版，同时结合了DeepSeek-Math-V2的定理证明能力。（广角观察）

来源：钛媒体

« 上一页
1
…
12
13
14
15
16
…
19
下一页 »