AI新闻

已选标签:
多模态AI
12月 24日
8 条新闻
17:40

不拼爹,拼AI,青少年们用Claude“写”出百万生意,圈粉25万投资者,谷歌风投也主动求合作?

AI技术的快速发展,特别是大语言模型和多模态模型的应用,显著降低了软件开发门槛,激发了年轻创业者们的热情。15岁的Nick Dobroshinsky利用AI生成金融分析报告,创建了BeyondSPX平台;16岁的Raghav Arora则通过AI预测库存需求,成功创办GetASAP生鲜配送公司。这些案例展示了AI在金融科技、供应链管理等领域的巨大潜力,同时也揭示了AI编程工具如何赋能新一代创业者,推动商业创新。

来源:36氪

16:37

最鲁棒的MLLM,港科大开源「退化感知推理新范式」

最鲁棒的MLLM,港科大开源「退化感知推理新范式」

针对多模态大语言模型(MLLMs)在真实世界视觉退化环境下的性能瓶颈,香港科技大学与西北工业大学等团队提出Robust-R1,通过构建显式结构化推理系统实现从‘抵抗干扰’到‘理解干扰’的范式转变。该系统使模型能够主动诊断并量化退化参数,分析其对图像语义的影响,并据此调整推理策略,显著提升了模型在自动驾驶、医疗影像等领域的鲁棒性和可解释性。

来源:36氪

16:36

生成不遗忘,「超长时序」世界模型,北大EgoLCD长短时记忆加持

生成不遗忘,「超长时序」世界模型,北大EgoLCD长短时记忆加持

北大、中大等机构联合发布EgoLCD模型,借鉴人类长短时记忆机制,首创稀疏KV缓存+LoRA动态适应架构,有效解决长视频生成中的内容漂移问题。在EgoVid-5M基准测试中,EgoLCD在时间一致性和生成质量上全面超越现有主流模型,为构建具身智能世界模型迈出关键一步。

来源:36氪

16:36

“商汤系”跑出一堆独角兽,可闫俊杰无法复制

“商汤系”跑出一堆独角兽,可闫俊杰无法复制

商汤系AI创业公司MiniMax与Vivix AI凭借深厚的技术积累及产品落地经验,成为资本新宠。MiniMax通过模型和ToC产品并行布局,实现快速商业化,2025年前9个月收入达5343.7万美元。Vivix AI仅用10个月估值飙升至13.2亿美元。两家公司在多模态交互、大语言模型等领域展现强劲发展潜力,推动AI技术在智能助手、内容生成等应用领域的突破。

来源:36氪

14:32

中国下半年新上线AI应用共205个,流量规模上通用和垂类AI分庭抗礼

Quest Mobile发布的《2025下半年AI应用交互革新与生态落地报告》显示,中国下半年新上线AI应用共205个,其中,应用插件(In-App AI)占比达81.5%,PC端网页应用占比10.7%,原生App占比7.8%。AI图像处理与AI专业顾问是下半年热门赛道;AI搜索与AI综合助手虽已形成近7亿规模用户池,仍吸引新玩家突破性入局争夺流量入口。

最新统计周期内(12月8日至12月14日),周活跃用户规模Top10的AI APP中,有6个通用AI,4个垂类场景的专业AI,形成了通用和垂类AI分庭抗礼的格局。豆包的周活跃规模达到了1.55亿,DeepSeek、元宝分别为8156万、2084万。蚂蚁阿福App、灵光App周(12.08-12.14)活跃用户规模分别达1025.4万和295.2万,位列下半年新上线原生App第一、第二。(广角观察)

来源:钛媒体

12:28

YC 2025年度AI报告:Gemini崛起、Vibe Coding成熟,你需要更新的15个认知

YC 2025年度AI报告:Gemini崛起、Vibe Coding成熟,你需要更新的15个认知

Y Combinator最新一期播客总结了2025年AI行业趋势,Anthropic和Gemini在模型竞争中崛起,分别凭借优秀的代码编写能力和推理能力超越OpenAI。同时,AI基础设施泡沫预示着计算资源将更加廉价且充沛,为初创公司提供了更多机会。此外,Vibe Coding成为一种成熟的开发方式,垂直领域的小模型击败通用大模型,显示出专有数据的重要性。

来源:36氪

12:28

原地平线智能驾驶总裁创业机器人一年:9988元,养一只家里的“小狗哥”

原地平线智能驾驶总裁创业机器人一年:9988元,养一只家里的“小狗哥”

维他动力推出消费级四足机器狗“Vbot超能机器狗”,定位为家庭伙伴,具备全地形通过能力、自主跟随及多场景应用功能。该产品采用混合架构,云端大模型处理复杂语言理解与推理,端侧自研模型保障任务响应效率和弱网环境下的表现。其核心竞争力在于打造具有探索好奇心、生存欲及安全意识的自主智能体,旨在推动AI机器人在C端市场的普及。

来源:36氪

12月 18日
1 条新闻
10:52

谷歌推出最新人工智能模型双子座3 Flash

谷歌公司17日宣布推出最新人工智能模型双子座3 Flash。谷歌称,双子座3 Flash是其最新推出的兼具前沿智能与高速性能的模型,保留了双子座3在高级推理、视觉理解和交互式代码生成等方面的核心能力,同时显著提升了响应速度和成本效率,在多个标准评测中表现优异。据谷歌介绍,该模型性能超越了双子座2.5 Pro,速度提升约3倍,且运行成本远低于前代。在用于评估代理编码能力的专业基准测试中,其得分甚至超过了双子座3 Pro。(新华社)

来源:钛媒体

12月 15日
6 条新闻
12:24

人人拥有AI科学家,一文读懂Deep Research的今生与未来

人人拥有AI科学家,一文读懂Deep Research的今生与未来

Deep Research 推动 LLM 从文本生成向知识发现转变,实现复杂开放式任务。该技术已被应用于科研、软件工程等领域,支持学术综述、实验执行等任务。研究将其划分为自主搜索、整合研究和全栈AI科学家三个阶段,涵盖查询规划、知识检索、记忆管理和答案生成四大核心组件。未来面临检索时机、记忆进化、训练算法及评估体系等挑战,需发展统一推理范式、标准化记忆系统及模块化框架以提升通用性和可靠性。

来源:36氪

12:24

OpenAI突然开源新模型,99.9%的权重是0,新稀疏性方法代替MoE

OpenAI突然开源新模型,99.9%的权重是0,新稀疏性方法代替MoE

OpenAI开源了一种名为Circuit Sparsity的新模型,该模型通过极大稀疏化(99.9%权重为零)实现了内部计算过程的高度可解释性,直接针对传统稠密Transformer模型的黑箱问题。与MoE模型相比,Circuit Sparsity追求的是原生稀疏性和任务功能解耦,尽管当前面临算力成本高的挑战,但其在提升AI可解释性方面展现出巨大潜力。

来源:36氪

12:24

AI御三家年终“火拼”

2025年人工智能领域竞争激烈,OpenAI发布GPT-5.2,强调专业知识处理能力与超长上下文记忆;Anthropic推出Claude 4.5,提升自主编程及工具操作稳定性;谷歌DeepMind发布Gemini 3,实现原生多模态融合。三者在推理、编程及智能体任务上均有显著进步,推动AI向更高效、多功能方向发展。

来源:36氪

12:16

苏州大学首篇数学四大刊!解决了40年未决的丢番图逼近问题

苏州大学首篇数学四大刊!解决了40年未决的丢番图逼近问题

苏州大学副教授张涵与国际合作者将数论中的辛钦定理推广至自相似测度,解决了40年未决的丢番图逼近问题。该成果不仅促进了数学领域的交叉研究,还为AI在处理复杂数据分布、优化算法及提升模型训练效率等方面提供了新思路,特别是在多模态融合和边缘计算等未来趋势中展现出巨大潜力。

来源:量子位

11:22

迪士尼OpenAI达成70亿协议,火速控诉谷歌侵权

迪士尼OpenAI达成70亿协议,火速控诉谷歌侵权

迪士尼与OpenAI签署十亿美元协议,授权超过200个角色用于Sora的视频生成,同时禁止使用其IP训练模型;而谷歌因涉嫌侵权收到律师函。事件表明,AI行业的竞争将转向内容授权,而非单纯的技术和算力比拼。迪士尼通过这一系列操作,重新定义了AI在内容版权上的边界,强调了尊重创作者及其作品的重要性。

来源:36氪

12月 14日
4 条新闻
11:39

太初元碁乔梁:AI算法已经跑到单芯片极限|MEET2026

太初元碁乔梁:AI算法已经跑到单芯片极限|MEET2026

随着AI技术的发展,行业应用对算力的需求与日俱增。太初元碁联合创始人乔梁指出,当前单芯片性能已成AI算法发展的瓶颈,为此太初元碁设计了实现128卡间高速互联的TC link,为AI算法提供硬件基础。未来,高性能计算将贯穿从科学研究到AI落地的全链路,成为各类计算场景的底层支撑力量。超智融合和异构融合被视为解决算力需求的关键路径,开源生态建设也被认为是推动AI产业生态发展的重要一环。

来源:量子位

10:45

科技大佬为何难逃「币圈引力」?

摩尔线程作为中国版英伟达,在科创板上市后市值飙升,反映了当前AI与算力领域的资本热度。文章探讨了科技大佬如马斯克、奥特曼等在虚拟币和AI领域之间的复杂关系及背后动机,强调了算力作为连接这两者的关键纽带作用。同时指出,无论是训练大模型还是进行加密挖矿,争夺算力成为核心之一,而算力的发展也受到政策环境、电力供应等因素的影响。

来源:36氪

04:35

AI数据中心热潮可能对其他基础设施项目不利

AI数据中心热潮可能对其他基础设施项目不利

随着数据中心建设加速,尤其是AI相关的基础设施如大语言模型和多模态模型的部署需求激增,预计2025年将达到超过410亿美元的投资规模。这不仅与政府在交通建设上的支出相当,还导致了劳动力短缺问题加剧,影响其他基础设施项目的进度。此现象反映了AI技术快速发展对算力资源及物理空间的需求增加,同时也提出了成本控制和技术优化的新挑战。

来源:TechCrunch AI

12月 13日
1 条新闻
22:41

美国视频生成老炮儿,入局世界模型

美国视频生成老炮儿,入局世界模型

Runway发布首个通用世界模型GWM-1及其变体,包括模拟真实环境的GWM Worlds、模拟对话的GWM Avatars和用于机器人操作的GWM Robotics。这些基于Gen-4.5升级版构建的模型采用自回归架构,支持实时交互控制,展示了在虚拟环境构建、客户服务及机器人训练等领域的应用潜力。同时,Gen-4.5新增原生音频生成与编辑功能,进一步扩展了其应用场景。

来源:量子位