标签筛选

日期筛选

日

一

二

三

四

五

六

29

30

31

01

02

03

04

05

06

07

08

09

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

01

02

03

04

05

06

07

08

09

1月

38 条

2月

1 条

3月

3 条

4月

0 条

5月

0 条

6月

0 条

7月

0 条

8月

0 条

9月

0 条

10月

0 条

11月

0 条

12月

0 条

AI新闻

已选标签:

多模态AI

12月 9日

4 条新闻

09:05

智谱开源“会操作手机的AI”AutoGLM

智谱深夜开源其核心AI Agent模型AutoGLM。该模型被业界视为全球首个具备“Phone Use”（手机操作）能力的AI Agent，能够稳定完成外卖点单、机票预订等长达数十步的复杂操作流程。此次开源意味着硬件厂商、手机厂商和开发者均可基于AutoGLM，在自己的设备或系统中复现一个能“看懂”屏幕、并模拟真人进行点击、输入、滑动的AI助手。目前，AutoGLM已支持微信、淘宝、抖音、美团等超过50个高频中文应用的核心场景，其自动化操作能力与此前引发热议的“豆包手机”演示相似。（广角观察）

来源：钛媒体

09:05

谷歌新架构逆天，为了让AI拥有长期记忆，豆包们都想了哪些招数？

谷歌新架构逆天，为了让AI拥有长期记忆，豆包们都想了哪些招数？

Google提出HOPE框架，旨在解决大模型长期记忆问题，通过区分短期与长期记忆系统，实现更稳定、个性化的信息存储和调用。这一进展标志着大模型正从依赖超长上下文窗口向构建可持续更新的记忆体系转变，对于提升智能助手的连续性和可靠性至关重要。同时，行业内的探索如字节MemAgent和MiniMax等也在推动长期记忆机制内化为模型核心能力，强调记忆应参与决策而非仅作为外部存储。

来源：36氪

09:04

豆包手机助手把大厂们架在了火上烤

豆包手机助手把大厂们架在了火上烤

豆包手机助手的发布，展示了AI助手在执行复杂任务方面的潜力，如下载应用、外卖比价等，但遭遇了互联网大厂基于安全考量的技术限制。这反映了AI时代超级入口竞争加剧，软硬一体成为新趋势。同时，端云协同AI的发展以解决隐私和安全问题变得尤为重要。

来源：36氪

05:29

谷歌的AI试穿应用Doppl新增可购物发现频道

谷歌的AI试穿应用Doppl新增可购物发现频道

Google在Doppl应用中引入了可购物的发现流，利用AI生成视频展示个性化推荐服装，用户可虚拟试穿。该功能基于深度学习和计算机视觉技术，通过分析用户偏好提供定制化建议。此举旨在提升用户体验并探索新的电商策略，应对来自亚马逊等竞争对手的压力。

来源：TechCrunch AI

12月 8日

16 条新闻

21:45

北京市科委立项课题”AI辅助3D游戏内容生产平台研发与应用”正式启动

由元境与北航新媒体艺术与设计学院联合主办的”智绘万象·聚力共生”3D数字内容创新发展高峰论坛上，北京市科委立项课题”AI辅助3D游戏内容生产平台研发与应用”日前正式启动，元境同步与浙江省北大信息技术高等研究院、重庆千方实业发展有限公司达成战略合作，构建空间计算技术生态，加速3D AIGC在游戏、动漫等领域的应用落地。（广角观察）

来源：钛媒体

21:38

看完最新国产AI写的公众号文章，我慌了！

看完最新国产AI写的公众号文章，我慌了！

智谱最新升级的GLM-4.6V模型展示了强大的多模态处理能力，能够高效生成图文并茂的公众号文章、解读论文与财报、复刻网页设计等。该模型在多个主流评测中取得SOTA成绩，尤其在视觉推理方面表现出色，支持从图片到视频等多种格式的内容理解与生成。其创新性地将工具调用能力融入视觉模型，为实际应用场景中的多模态Agent提供了强有力的技术支持。

来源：量子位

20:42

理想也做AI眼镜了，小鹏、蔚来、小米还不速速跟进？

理想也做AI眼镜了，小鹏、蔚来、小米还不速速跟进？

新闻探讨了AI眼镜从技术到应用的潜力及挑战，强调其在多模态数据处理、实时流式语音交互上的突破。理想Livis眼镜通过结合大模型和流式智能语音框架，实现了更快捷自然的用户体验，特别是在车控场景中展现出显著优势。随着AI技术进步，AI眼镜有望成为下一代主流消费电子，推动新一轮‘范式转移’。

来源：36氪

19:40

GMI Cloud：出海是AI企业释放产能、获取新生的最佳途径｜WISE 2025

GMI Cloud：出海是AI企业释放产能、获取新生的最佳途径｜WISE 2025

GMI Cloud VP钱宇靖在WISE2025大会上分享了AI应用出海效能升级的关键，包括算力全球化、需求与价值的全球化转型。他指出，AI市场正经历指数级增长，特别是在北美地区，用户已广泛接受AI工具。面对出海挑战如服务及时性、扩展性和稳定性，GMI Cloud通过建设大规模AI工厂、优化集群引擎和推理引擎来提供解决方案，支持全球范围内的自动扩缩容与高可用设计，助力企业更高效地部署海外AI应用。

来源：36氪

19:39

Apple Silicon 五周年，无心插柳长出了一片 AI 市场

Apple Silicon 五周年，无心插柳长出了一片 AI 市场

苹果通过macOS 26.2 Beta更新，增强了Mac设备的AI处理能力，特别是针对本地运行超大规模AI模型的能力进行了优化。新版本支持M5处理器上的神经网络加速器，并引入了基于雷雳5协议的新传输方案，显著提升了Mac集群的数据交换效率与负载分配灵活性，使得四台Mac Studio能够本地运行接近GPT-4规模的大语言模型。这一改进不仅促进了个人开发者对AI技术的应用探索，也为寻求高敏感数据本地化处理的企业提供了更经济高效的解决方案。

来源：36氪

18:37

谷歌重启，阿里入局：AI眼镜会沦为神话还是笑话

AI眼镜赛道竞争激烈，巨头如阿里、谷歌等纷纷入局，核心在于构建垂直场景闭环与物理世界数据掌控。2025年全球市场规模预计达42亿美元。硬件参数不再是胜负关键，生态整合与用户体验成为焦点。技术上，终端侧大模型轻量化推动自然语音交互；商业上，目标是全天候无感化交互，形成独特服务闭环。未来，谁能有效整合硬件体验、生态协同与数据价值，谁就能在AI眼镜市场中胜出。

来源：36氪

18:37

AI会消灭搜索吗？

AI会消灭搜索吗？

本文探讨了AI搜索如何从信息分发进化为服务撮合，分析了AI搜索引擎在对话式交互、多模态理解和任务执行方面的技术突破。以Perplexity和谷歌Gemini 3为例，展示了基于大语言模型的AI搜索通过自然语言处理和上下文记忆能力提升用户体验。同时，讨论了AI搜索在电商、社交等领域的应用前景及商业模式探索，预测其将推动万亿级信息服务市场的变革。

来源：36氪

17:35

谷歌突砍Gemini免费版炸锅，数据养模遭背刺？GPT-5.2突袭Gemini 3，Demis Hassabis：谷歌须占最强位

谷歌突砍Gemini免费版炸锅，数据养模遭背刺？GPT-5.2突袭Gemini 3，Demis Hassabis：谷歌须占最强位

谷歌大幅削减了Gemini API的免费使用额度，从每日250次请求降至20次，影响了小型项目的开发者。此举反映了谷歌在大模型竞争中的策略转变，更加注重盈利与资源优化。同时，谷歌强调其在多模态融合、视频处理等领域的技术进步，并表示未来将聚焦于跨模态能力的发展，以提升AI系统的整体性能和应用范围。

来源：36氪

17:34

4万人抢着体验，日本AI洗澡机器人爆红，智能浴室这回成真了？

4万人抢着体验，日本AI洗澡机器人爆红，智能浴室这回成真了？

日本Science公司推出的「未来人类洗澡机」通过AI技术实现了从洗澡到烘干的全自动流程，利用传感器收集用户健康数据并提供个性化建议。该设备吸引了4万名消费者报名体验，展示了AI在智能家居领域的应用潜力。尽管当前版本价格高昂且体积庞大，但其为浴室智能化提供了新的方向，有望推动全屋智能的发展。

来源：36氪

16:43

机器人集体到香港户外极限挑战，狗比人强

机器人集体到香港户外极限挑战，狗比人强

ATEC2025机器人挑战赛在香港举行，强调自主完成任务与户外适应性。比赛涵盖垃圾分拣、自主浇花、定向越野及吊桥穿越等项目，考察了机器人的视觉感知、跨地形移动、长程规划等能力。四足机器人（机器狗）在多个任务中表现出色，尤其在复杂地形下的稳定性与操作精度方面优于人形机器人。赛事揭示了当前机器人技术在软硬件协同设计、环境感知、多步骤推理及全身控制等方面的挑战，为未来具身智能的发展方向提供了重要参考。

来源：量子位

16:33

a16z 100万亿Token研究揭示的真相：中国力量重塑全球AI版图

a16z 100万亿Token研究揭示的真相：中国力量重塑全球AI版图

a16z发布的《State of AI》报告基于超100万亿Token数据，揭示了AI从实验室到实际应用的转变。三大趋势包括：生态多元化、智能体推理范式和全球分布式创新。中国开源模型如DeepSeek、Qwen崛起，尤其在2025年后期市场份额显著增长。编程辅助和角色扮演成为主要应用场景，推理优化模型处理量占比超过50%。亚洲尤其是中国在全球AI使用中的份额大幅提升，标志着AI技术与应用的新格局。

来源：36氪

13:22

“OpenAI链”年内涨幅远落后于“谷歌链”

据报道，华尔街对人工智能相关企业的态度正在转变。OpenAI不再被视为人工智能技术的尖端力量，并面临关于其缺乏盈利能力以及需要快速增长以支付巨额开支承诺的质疑。而谷歌母公司正崛起为资金雄厚、触角遍及人工智能各领域的竞争者。因此，与OpenAI相关的公司股票，主要包括甲骨文、CoreWeave和超微半导体，以及持有其11%股份的微软、英伟达和软银，正面临沉重的抛售压力。而Alphabet的增长势头不仅推高了其自身股价，还带动了相关企业如博通、Lumentum、天弘科技和迅达科技的股价上涨。据统计，与OpenA相关的一篮子公司在2025年上涨了74%，虽然表现亮眼，但远不及与Alphabet相关的股票146%的涨幅。（广角观察）

来源：钛媒体

12:20

豆包打响第一枪，超级Agent和超级APP开战了

豆包打响第一枪，超级Agent和超级APP开战了

豆包手机助手作为AI智能体在NubiaM153上的应用尝试，展示了通过系统级权限实现跨APP自动化操作的能力。尽管面临微信等超级APP的安全拦截与用户隐私保护挑战，字节跳动正积极寻求解决方案，并强调该产品目前仅面向开发者预览。此次尝试反映了AI技术向移动端渗透的趋势，预示着未来智能手机将更多地依赖于原生AI服务和智能体来提升用户体验，但同时也引发了关于移动互联网入口生态重塑的讨论。

来源：36氪

12:20

AI连路都走不明白，别意淫了

本次会议揭示了AI在物理世界应用中的挑战，强调了AI技术从数字世界向现实世界迁移的重要性。专家们认为，未来的AI发展将更加注重实际操作能力，如机器人、自动驾驶等领域的应用，并提出通过视频学习来提升AI理解物理世界的能力。同时，讨论了大模型的局限性和成本问题，指出未来趋势是开发更小、更密集的模型以适应边缘计算需求。此外，还探讨了AI在To B领域的商业价值，特别是在高危、高能耗行业中的应用潜力。

来源：36氪

11:17

Google DeepMind CEO：AGI 还差 1–2 个突破？

Demis Hassabis 在 Axios AI+ 峰会上表示，实现 AGI 仅需一到两个 AlphaGo 级别的技术突破，预测 5-10 年内达成。Gemini 模型已展示多模态理解、判断及创造能力，但缺乏持续学习、长期规划和稳定记忆等关键特性。Hassabis 强调，通向 AGI 的关键在于世界建模与智能体系统的技术创新，并指出科学方法是 DeepMind 的核心优势。

来源：36氪

11:17

寻找产业新风向，与院士、企业家共话AI落地

寻找产业新风向，与院士、企业家共话AI落地

2025年，中国AI产业从大规模模型转向深度应用，聚焦商业可行性与垂直领域精耕。随着政策支持，AI在低空经济、工业制造等具体场景中寻求突破，但面临算力成本高昂及行业壁垒问题。12月12日，在杭州举办的长三角人工智能产业融合共生发展大会旨在打破信息孤岛，促进AI技术与实体经济深度融合，加速推动中国算力产业发展。

来源：36氪

« 上一页
1
…
8
9
10
11
12
…
19
下一页 »