AI新闻

已选标签:
AI训练
AI对话
2月 4日
2 条新闻
06:01

刚刚,腾讯姚顺雨团队首个成果发布,揭示大模型真正瓶颈

刚刚,腾讯姚顺雨团队首个成果发布,揭示大模型真正瓶颈

腾讯混元团队发布CL-bench,专门评测大语言模型从上下文中学习新知识的能力。研究显示当前SOTA模型在这方面表现不佳,平均任务解决率仅为17.2%。CL-bench通过500个复杂上下文任务,要求模型在解决每个任务时必须从上下文中学习并应用新知识。这标志着大模型需要从静态记忆向动态学习转变。

🔗 [项目主页]:www.clbench.com

来源:36氪

02:00

Xcode迈向代理编程,深化与OpenAI和Anthropic的整合

Xcode迈向代理编程,深化与OpenAI和Anthropic的整合

Xcode 26.3引入了Agentic编码工具,包括Anthropic的Claude Agent和OpenAI的Codex,直接集成到Apple的官方开发套件中。这些工具能够利用Xcode的更多功能进行复杂自动化,并访问最新的开发者文档以确保使用最新API和最佳实践。新版本支持自然语言命令,使开发者可以更高效地构建和调试项目。这标志着苹果在提升开发效率方面迈出了重要一步。

🔗 [工具链接]:https://developer.apple.com/xcode/

来源:TechCrunch AI

1月 20日
2 条新闻
13:53

OpenAI去年收入超200亿美元,首款硬件设备将于今年下半年推出

OpenAI收入激增,2025年突破200亿美元,算力规模三年内增长9.5倍。公司正从单一算力供应商转向多元化合作,并启动总投资5000亿美元的全球AI算力网络“星门”计划。此外,OpenAI宣布首款硬件设备将于2026年下半年推出,标志着其向软硬一体化转型。这款由前苹果首席设计师主导设计的无屏便携AI终端,旨在重新定义人机交互方式。

来源:36氪

13:01

谷歌新发现:DeepSeek推理分裂出多重人格,左右脑互搏越来越聪明

谷歌新发现:DeepSeek推理分裂出多重人格,左右脑互搏越来越聪明

谷歌最新研究揭示,顶尖AI模型如DeepSeek-R1在解题时会自发‘分裂’出多个人格,进行类似人类的‘左右脑互搏’式对话,从而提升推理准确率。这种内部对话机制不仅让AI更聪明,还暗示了社交互动对智能进化的关键作用。对于开发者而言,这不仅是理解AI思维的新视角,也是优化模型性能的突破口。

🔗 [战略白皮书]:https://arxiv.org/abs/2601.10825

来源:量子位

1月 15日
16 条新闻
17:22

GPT-5.2连肝7天,300万行代码造出Chrome级浏览器

GPT-5.2连肝7天,300万行代码造出Chrome级浏览器

【导读】一个大模型持续写代码,能写多久?一小时?一天?还是像大部分AI编程工具那样,完成一个任务就结束对话?Cursor的CEO MichaelTruell决定搞一次极限压力测试!
Michael Truell让Cursor中的GPT-5.2连续运行了整整一周。
不是一小时,不是一天,而是不眠不休,昼夜不停,168小时持续写代码。
结果?
300万行代码。数千个文件。
AI完全从零构建出一个全新浏览器。
而且,还是Chrome那种浏览器。
HTML解析、CSS布局、文本渲染、还有一个自研的JavaScript虚拟机——全是AI自己写的。
Michael Truell轻描淡写地发了条推文:它基本能跑!简单的网页能快速且正确地渲染出来。
一个模型究竟能跑多久
传统的AI编程工具,比如Github Copilot和早期的其他IDE,都是一问一答模式。
对话长度有限,上下文有限,任务复杂度有限。
后来出现了所谓的Agentic编程——Claude Code、Cursor Agent、Windsurf等工具让AI可以自主执行多步任务,读取文件、运行命令、修复错误。
这已经是很大的进步,但大多数情

来源:36氪

15:54

阿福“满月”交上优异答卷,但“独美”为时尚早

阿福“满月”交上优异答卷,但“独美”为时尚早

医疗AI应用’阿福’在改名后的一个月内用户数翻倍至3000万,单日提问量突破1000万。这标志着AI技术正在解决医疗资源分布不均的问题,并逐渐从工具属性转向专业服务。蚂蚁集团通过整合内外部资源,特别是收购’好大夫在线’,为’阿福’提供了强大的数据支持和专业度保障。然而,面对来自其他大厂的竞争以及用户对隐私的关注,’阿福’仍需不断优化用户体验以保持增长势头。

来源:36氪

12:49

李彦宏的AI野心,淹没在字节和阿里的战火里

李彦宏的AI野心,淹没在字节和阿里的战火里

百度在AI领域的先发优势正逐渐被字节和阿里超越。尽管百度拥有从芯片到应用的全栈自研能力,但在C端与开发者群体中已明显落后。面对豆包、千问等竞争对手的价格战和技术突破,百度被迫调整策略,宣布文心大模型开源。然而,这一举措并未能扭转局势,反而暴露出其在市场战略上的失误。百度必须重新审视自身定位,以适应快速变化的AI竞争格局。

来源:36氪

11:47

XSKY发布AI数据方案AIMesh,大幅降低AI推理硬件投入成本

XSKY星辰天合发布全栈AI数据方案AIMesh,包含三个核心组件:训练数据网MeshFS、全局对象网MeshSpace、推理内存网MeshFusion,定位为面向“AI工厂”的数据与内存网。性能上,MeshFS在顺序读带宽上比行业通用方案提升30%,顺序写带宽超出50%,解决训练数据供给滞后问题;MeshSpace单个对象存储桶每秒支持高达一百万对象写入,大块写性能提升近50%,延迟降低30%;MeshFusion将服务器本地NVMeSSD转化为L3级外部内存,以1%的硬件成本实现近乎无限的上下文窗口,大幅降低AI推理的硬件投入成本。(广角观察)

来源:钛媒体

10:45

英首相:X平台伪造色情图像“可耻”,英国不会妥协

英国首相斯塔默1月14日说,社交媒体平台X的人工智能聊天机器人“格罗克”(Grok)伪造色情图像,这“令人作呕”且“可耻”,英国不会对此妥协。

“格罗克”由马斯克旗下人工智能企业xAI公司开发,内置于马斯克旗下社交媒体平台X。这一工具已被滥用于生成基于真实人物的虚假性暴露内容,并在X平台上散播,受害者包括众多女性和未成年人。

斯塔默说,如果X平台不对此采取行动,那么英国政府会“全力支持”英国通信管理局对其采取行动。(新华社)

来源:钛媒体

09:44

X平台宣布采取措施制止Grok生成色情图像

埃隆·马斯克旗下社交平台X于1月14日发表声明称,将对其人工智能聊天机器人Grok采取限制措施,禁止该功能生成真人裸露图像。此前Grok因平台监管缺失,被广泛滥用于生成网络色情图片,甚至涉及儿童色情领域,遭到多个国家的批评与抵制。X平台安全团队在声明中表示:“我们已实施技术措施,防止Grok账号允许编辑真人穿着比基尼等暴露服装的图像。此项限制适用于所有用户,包括付费订阅者。”此外,X平台安全团队还称,其正在全天候工作以增设防护措施,移除违规及非法内容,在必要时将永久封禁账户并与当地政府及执法部门开展协作。(广角观察)

来源:钛媒体

09:40

内置2nm芯片,OpenAI想用AI耳机打爆iPhone

内置2nm芯片,OpenAI想用AI耳机打爆iPhone

OpenAI正秘密研发代号为’Sweetpea’的随身AI硬件项目,旨在重新定义个人计算起点。这款设备采用耳后佩戴设计,全天候语音交互,无需唤醒词即可捕捉用户意图。它搭载2纳米制程芯片及定制音频模型,直接调用Siri执行系统级操作,力图成为全功能AI助理。面对苹果等巨头的竞争,Sweetpea能否成功突围尚待观察。

来源:36氪

08:39

OpenAI将从Cerebras购买至多750兆瓦算力,交易价值据悉超100亿美元

OpenAI周三表示,该公司将在三年内从芯片制造商Cerebras购买至多750兆瓦的计算能力。据知情人士透露,该交易在合同期内的总价值超过100亿美元。这是OpenAI近期达成的一系列数十亿美元交易中的最新一笔。OpenAI在其网站上发布的一篇文章中表示:“将Cerebras集成到我们的计算解决方案组合中,旨在大幅提升人工智能的响应速度。”OpenAI还表示,这些算力将分批上线,直至2028年。

周三达成的这项合作将有助于Cerebras实现收入来源多元化,摆脱对总部位于阿联酋的科技公司G42的过度依赖。G42既是Cerebras的投资者,也是其最大的客户之一。(广角观察)

来源:钛媒体

08:33

DeepSeek与字节跳动踏进同一条河

DeepSeek发表核心论文,提出流形约束超连接(mHC)架构,直击大规模模型训练稳定性难题。这一创新不仅为硬件受限的中国AI企业提供了性能与效率兼顾的新路径,还通过数学约束与系统级优化解决了字节跳动超连接技术在规模化训练中的信号发散问题。mHC架构的成功,标志着AI竞赛不再仅依赖尖端算力芯片,硬件限制反而成为创新催化剂。

🔗 [核心技术战略白皮书]:https://arxiv.org/abs/2412.07856

来源:36氪

07:32

AI聊天机器人涉生成不良图像争议,马斯克回应:不知情

当地时间1月14日,美国企业家埃隆·马斯克就其旗下人工智能企业xAI的聊天机器人“格罗克(Grok)”近期出现的争议回应称,其并不知道关于“格罗克”存在生成任何“未成年人裸露图像”的情况。

目前,“格罗克”因相关争议在全球范围内面临监管与舆论双重压力,多国政府及妇女、儿童权益组织已呼吁苹果、谷歌将该应用从应用商店下架。对此,马斯克强调,“格罗克”的程序设定为拒绝非法请求,且必须遵守各国法律。

“格罗克”由xAI公司开发,并内置于马斯克旗下社交媒体X平台,X用户可直接调用该聊天机器人。近期,X平台出现部分用户利用“格罗克”编辑图片和视频的现象,一些用户借此生成真实人物的虚假性暴露内容,并在X平台上散播,受害者包括数百名成年女性和未成年人。英国等多个国家对此予以谴责。(央视新闻)

来源:钛媒体

06:42

马斯克否认知晓Grok中存在的未成年色情内容,加州总检察长启动调查

马斯克否认知晓Grok中存在的未成年色情内容,加州总检察长启动调查

面对全球政府对非自愿性内容生成的严厉监管,Musk否认Grok产生任何未成年裸照。加州总检察长已启动调查,聚焦xAI是否违反了相关法律。尽管xAI声称已采取措施限制问题图片生成,但其效果仍存争议。此事件凸显了AI平台在内容治理上的挑战与责任。

🔗 [原文链接]:https://techcrunch.com/2026/01/14/musk-denies-awareness-of-grok-sexual-underage-images-as-california-ag-launches-probe/

来源:TechCrunch AI

06:30

OpenAI签署价值100亿美元的协议,采购Cerebras计算资源

OpenAI签署价值100亿美元的协议,采购Cerebras计算资源

OpenAI与Cerebras达成超100亿美元计算力协议,确保至2028年享有750兆瓦算力。此合作旨在加速AI响应速度,提供更自然的交互体验,构建实时AI扩展基础。Cerebras声称其专为AI设计的芯片系统比GPU更快,这将彻底改变AI应用领域,如同宽带改变了互联网一样。对于追求效率和差异化竞争力的企业和个人来说,这无疑是一次技术飞跃的机会。

来源:TechCrunch AI

02:36

Google趋势探索页面新增Gemini功能

Google趋势探索页面新增Gemini功能

Google Trends Explore页面迎来重大升级,Gemini加持下自动识别并对比搜索趋势,极大简化了手动分析过程,提升研究效率。新设计不仅支持更多关键词对比,还增加了上升查询显示数量,使数据解读更加直观。对于内容创作者、记者及研究人员而言,这无疑是一次‘认知跃迁’的机会,助力你在信息海洋中快速定位热点。

来源:TechCrunch AI