标签筛选

日期筛选

日

一

二

三

四

五

六

29

30

31

01

02

03

04

05

06

07

08

09

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

01

02

03

04

05

06

07

08

09

1月

65 条

2月

6 条

3月

16 条

4月

0 条

5月

0 条

6月

0 条

7月

0 条

8月

0 条

9月

0 条

10月

0 条

11月

0 条

12月

0 条

AI新闻

已选标签:

多模态AI

AI对话

2月 4日

2 条新闻

06:01

刚刚，腾讯姚顺雨团队首个成果发布，揭示大模型真正瓶颈

刚刚，腾讯姚顺雨团队首个成果发布，揭示大模型真正瓶颈

腾讯混元团队发布CL-bench，专门评测大语言模型从上下文中学习新知识的能力。研究显示当前SOTA模型在这方面表现不佳，平均任务解决率仅为17.2%。CL-bench通过500个复杂上下文任务，要求模型在解决每个任务时必须从上下文中学习并应用新知识。这标志着大模型需要从静态记忆向动态学习转变。

🔗 [项目主页]：www.clbench.com

来源：36氪

02:00

Xcode迈向代理编程，深化与OpenAI和Anthropic的整合

Xcode迈向代理编程，深化与OpenAI和Anthropic的整合

Xcode 26.3引入了Agentic编码工具，包括Anthropic的Claude Agent和OpenAI的Codex，直接集成到Apple的官方开发套件中。这些工具能够利用Xcode的更多功能进行复杂自动化，并访问最新的开发者文档以确保使用最新API和最佳实践。新版本支持自然语言命令，使开发者可以更高效地构建和调试项目。这标志着苹果在提升开发效率方面迈出了重要一步。

🔗 [工具链接]：https://developer.apple.com/xcode/

来源：TechCrunch AI

1月 20日

2 条新闻

13:53

OpenAI去年收入超200亿美元，首款硬件设备将于今年下半年推出

OpenAI收入激增，2025年突破200亿美元，算力规模三年内增长9.5倍。公司正从单一算力供应商转向多元化合作，并启动总投资5000亿美元的全球AI算力网络“星门”计划。此外，OpenAI宣布首款硬件设备将于2026年下半年推出，标志着其向软硬一体化转型。这款由前苹果首席设计师主导设计的无屏便携AI终端，旨在重新定义人机交互方式。

来源：36氪

13:01

谷歌新发现：DeepSeek推理分裂出多重人格，左右脑互搏越来越聪明

谷歌新发现：DeepSeek推理分裂出多重人格，左右脑互搏越来越聪明

谷歌最新研究揭示，顶尖AI模型如DeepSeek-R1在解题时会自发‘分裂’出多个人格，进行类似人类的‘左右脑互搏’式对话，从而提升推理准确率。这种内部对话机制不仅让AI更聪明，还暗示了社交互动对智能进化的关键作用。对于开发者而言，这不仅是理解AI思维的新视角，也是优化模型性能的突破口。

🔗 [战略白皮书]：https://arxiv.org/abs/2601.10825

来源：量子位

1月 15日

16 条新闻

17:22

GPT-5.2连肝7天，300万行代码造出Chrome级浏览器

GPT-5.2连肝7天，300万行代码造出Chrome级浏览器

【导读】一个大模型持续写代码，能写多久？一小时？一天？还是像大部分AI编程工具那样，完成一个任务就结束对话？Cursor的CEO MichaelTruell决定搞一次极限压力测试！
Michael Truell让Cursor中的GPT-5.2连续运行了整整一周。
不是一小时，不是一天，而是不眠不休，昼夜不停，168小时持续写代码。
结果？
300万行代码。数千个文件。
AI完全从零构建出一个全新浏览器。
而且，还是Chrome那种浏览器。
HTML解析、CSS布局、文本渲染、还有一个自研的JavaScript虚拟机——全是AI自己写的。
Michael Truell轻描淡写地发了条推文：它基本能跑！简单的网页能快速且正确地渲染出来。
一个模型究竟能跑多久
传统的AI编程工具，比如Github Copilot和早期的其他IDE，都是一问一答模式。
对话长度有限，上下文有限，任务复杂度有限。
后来出现了所谓的Agentic编程——Claude Code、Cursor Agent、Windsurf等工具让AI可以自主执行多步任务，读取文件、运行命令、修复错误。
这已经是很大的进步，但大多数情

来源：36氪

15:54

阿福“满月”交上优异答卷，但“独美”为时尚早

阿福“满月”交上优异答卷，但“独美”为时尚早

医疗AI应用’阿福’在改名后的一个月内用户数翻倍至3000万，单日提问量突破1000万。这标志着AI技术正在解决医疗资源分布不均的问题，并逐渐从工具属性转向专业服务。蚂蚁集团通过整合内外部资源，特别是收购’好大夫在线’，为’阿福’提供了强大的数据支持和专业度保障。然而，面对来自其他大厂的竞争以及用户对隐私的关注，’阿福’仍需不断优化用户体验以保持增长势头。

来源：36氪

15:17

清华新研究，Nature+Science双杀！

清华新研究，Nature+Science双杀！

清华团队最新研究揭示了AI在科研领域中的双刃剑效应：尽管个体科学家通过AI加速了论文发表和职业晋升，但整体科学探索的广度却因此收窄。研究指出，这种现象源于当前AI模型缺乏通用性。为解决这一问题，团队推出了跨学科科研智能体OmniScientist，旨在推动更广泛、更深入的科研创新。

🔗 [认知原点]：https://arxiv.org/abs/2412.07727

来源：量子位

13:11

AI开始“动手”了，全世界第一个带头的是阿里千问

AI开始“动手”了，全世界第一个带头的是阿里千问

阿里千问App率先实现AI在真实世界中的任务执行能力，成为全球首个大规模开放“搜索-决策-支付-履约”全链路AI功能的科技公司。通过Qwen最强模型与阿里生态的深度融合，千问App现在能一键搞定点外卖、做攻略、购物比价等日常琐事，极大提升了生活和工作效率，让AI真正成为你的私人助理。这不仅标志着人机交互的新拐点，也为职场人士提供了防替代的实操价值。

来源：量子位

12:49

李彦宏的AI野心，淹没在字节和阿里的战火里

李彦宏的AI野心，淹没在字节和阿里的战火里

百度在AI领域的先发优势正逐渐被字节和阿里超越。尽管百度拥有从芯片到应用的全栈自研能力，但在C端与开发者群体中已明显落后。面对豆包、千问等竞争对手的价格战和技术突破，百度被迫调整策略，宣布文心大模型开源。然而，这一举措并未能扭转局势，反而暴露出其在市场战略上的失误。百度必须重新审视自身定位，以适应快速变化的AI竞争格局。

来源：36氪

11:47

今年最快千亿独角兽诞生

今年最快千亿独角兽诞生

机器人赛道迎来新星！Skild AI完成14亿美元C轮融资，估值飙升至140亿美元。其通用机器人大脑Skild Brain已适配多类机器人形态，并在复杂环境中执行任务。该技术有望填补美国超百万岗位缺口，成为职场效率跃迁的关键。科技巨头如软银、英伟达等纷纷加注，预示着通用大脑之争才刚刚开始。

来源：36氪

11:47

魅族22 Next将至，小方屏集体爆发：AI算力正在「解放」手机形态

魅族22 Next将至，小方屏集体爆发：AI算力正在「解放」手机形态

AI 算力与交互方式的脱钩正推动智能手机形态变革。魅族 22 Next 作为一款 4 英寸正方形屏幕、支持 5G 的 AI 终端，不仅重构了 Flyme 交互，还原生支持 Agent to Agent 跨智能体协作，成为智能家居和 IoT 设备控制的新入口。小方屏设备的复兴标志着 AI 时代下硬件形态的多样化趋势，未来 AI 硬件将更加分化，专注于不同场景入口。

来源：36氪

11:04

一年拿下三轮融资！影目INMO正在鼻梁上“复刻”一个AI手机

一年拿下三轮融资！影目INMO正在鼻梁上“复刻”一个AI手机

影目INMO在智能眼镜赛道上狂飙突进，一年内完成三轮融资近5亿，产品首发即售罄。其轻量化一体式AI+AR眼镜不仅成为资本宠儿，更在市场上大放异彩，吸引贾樟柯等大咖背书，并荣登京东金榜榜首。通过自研IMOS系统结合GLM大模型，实现双向对话实时翻译等功能，正逐步定义下一代移动终端形态。

来源：量子位

10:45

云海医数发布云键AI精灵，中医红外算法不限时使用

红外数字中医软件服务商云海医数正式推出”云键AI精灵”，该产品通过标准化接口技术，兼容市面所有红外硬件厂商。此前，硬件厂商接入中医红外算法需支付单次超5万元的对接费及后续年费，云键AI精灵采用不限时套餐收费模式，减少用户长期成本。目前红外设备主要应用于工业、消防及医学治未病科，云海医数依托该产品推动其向大健康市场拓展。其检测系统涵盖九大体质辨识、十二经络分析及健康风险评估等。公司透露，未来计划向美容行业延伸服务，进一步挖掘红外技术的健康管理应用潜力。（广角观察）

来源：钛媒体

10:45

阿里千问App推出AI购物，全面接入淘宝等阿里业务

千问App宣布全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里生态业务，在全球首先实现点外卖、买东西、订机票等AI购物功能，并向所有用户开放测试。几天前，谷歌宣布与沃尔玛等零售商的AI购物合作计划，但目前尚未上线。（广角观察）

来源：钛媒体

10:45

英首相：X平台伪造色情图像“可耻”，英国不会妥协

英国首相斯塔默1月14日说，社交媒体平台X的人工智能聊天机器人“格罗克”（Grok）伪造色情图像，这“令人作呕”且“可耻”，英国不会对此妥协。

“格罗克”由马斯克旗下人工智能企业xAI公司开发，内置于马斯克旗下社交媒体平台X。这一工具已被滥用于生成基于真实人物的虚假性暴露内容，并在X平台上散播，受害者包括众多女性和未成年人。

斯塔默说，如果X平台不对此采取行动，那么英国政府会“全力支持”英国通信管理局对其采取行动。（新华社）

来源：钛媒体

10:45

OpenAI签下近700亿AI芯片巨单

OpenAI与Cerebras达成百亿美元合作，部署全球最大的高速AI推理平台。Cerebras芯片以超大规模晶体管集成，实现比GPU快15倍的响应速度，直接推动AI实时处理能力跃升。此次合作不仅标志着对英伟达传统算力解决方案的重大挑战，也预示着多元算力路线正成为头部玩家的新战场。

来源：36氪

10:45

GPT-4 技术功臣疑似泄密被开除，OpenAI 系创业天团上演「无间道」

GPT-4 技术功臣疑似泄密被开除，OpenAI 系创业天团上演「无间道」

AI巨头Thinking Machines Lab突发人事地震，前OpenAI CTO Barret Zoph因不当行为被解职，PyTorch之父Soumith Chintala接任。Zoph与部分团队成员计划回归OpenAI，引发业界震动。此次变动不仅揭示了高层间的权力博弈，也反映了初创公司内部管理的挑战。

来源：36氪

09:44

X平台宣布采取措施制止Grok生成色情图像

埃隆·马斯克旗下社交平台X于1月14日发表声明称，将对其人工智能聊天机器人Grok采取限制措施，禁止该功能生成真人裸露图像。此前Grok因平台监管缺失，被广泛滥用于生成网络色情图片，甚至涉及儿童色情领域，遭到多个国家的批评与抵制。X平台安全团队在声明中表示：“我们已实施技术措施，防止Grok账号允许编辑真人穿着比基尼等暴露服装的图像。此项限制适用于所有用户，包括付费订阅者。”此外，X平台安全团队还称，其正在全天候工作以增设防护措施，移除违规及非法内容，在必要时将永久封禁账户并与当地政府及执法部门开展协作。（广角观察）

来源：钛媒体

09:41

大模型长脑子了？研究发现LLM中层会自发模拟人脑进化

大模型长脑子了？研究发现LLM中层会自发模拟人脑进化

最新研究揭示，大型语言模型在训练过程中自发演化出类似人脑的协同核心结构，这不仅是对智能本质的一次深刻洞察，也为提升AI效率和可解释性提供了新路径。研究表明，通过强化学习微调协同核心，能显著提升模型性能，为职场人士提供了一种防替代、效率跃迁的实操方案。

来源：36氪

09:40

内置2nm芯片，OpenAI想用AI耳机打爆iPhone

内置2nm芯片，OpenAI想用AI耳机打爆iPhone

OpenAI正秘密研发代号为’Sweetpea’的随身AI硬件项目，旨在重新定义个人计算起点。这款设备采用耳后佩戴设计，全天候语音交互，无需唤醒词即可捕捉用户意图。它搭载2纳米制程芯片及定制音频模型，直接调用Siri执行系统级操作，力图成为全功能AI助理。面对苹果等巨头的竞争，Sweetpea能否成功突围尚待观察。

来源：36氪