AI新闻

已选标签:
多模态AI
AI训练
1月 8日
5 条新闻
09:01

173 分钟对谈,马斯克只讲 3 件事:AI、能源、机器人

马斯克预测2026年实现AGI,三年内机器人外科医生将超越人类。AI发展受限于能源效率,而非算法。他正建设吉瓦级AI工厂与大规模机器人产线,强调电力获取和设备散热等工程问题是当前AI发展的真正瓶颈。未来AI竞赛的核心在于对物理世界的掌控力。医疗领域,Optimus机器人将通过云端学习提升手术技能;教育领域,AI如Grok将成为个性化终身导师;经济上,AI将推动从短缺经济向富足经济转变。

来源:36氪

07:31

2026年度最佳 AI 工具指南

文章总结了当前最优秀的AI工具,涵盖从日常问答到专业编程等多个应用场景。ChatGPT、Gemini和Claude等大语言模型因其卓越的多模态处理能力和跨领域应用而被评为S级必备工具;NotebookLM与Perplexity则在学习研究和信息检索方面表现出色;此外,ElevenLabs、Heygen及n8n等分别在音频生成、视频制作及自动化工作流构建上提供了创新解决方案。这些工具不仅推动了AI技术的发展,也为各行各业带来了显著效率提升。

来源:36氪

02:01

CES 2026:实时跟进卡特彼勒与英伟达的最新动态,还有机器人出租车、机器人及其他展会惊喜

卡特彼勒与英伟达合作,在CES上展示了一款名为Cat AI的辅助AI系统,该系统基于NVIDIA Jetson Thor物理AI平台开发,旨在为中型挖掘机提供支持。此项目标志着卡特彼勒从传统的人工操作向智能机器人助手转型的重要一步,利用先进的AI技术如深度学习和计算机视觉来提高施工效率,并探索其在实际应用中的潜力。

来源:TechCrunch AI

02:00

天窗推出Calendar 2,助您家庭井井有条

Skylight 在 CES 2026 上推出了 Skylight Calendar 2,这款家庭组织工具不仅拥有更时尚的设计,还通过 AI 技术实现了跨平台日历整合、智能事件识别与添加等功能。此外,它利用计算机视觉技术帮助用户根据冰箱内的食材推荐食谱,并自动生成购物清单。这些创新功能展示了 AI 在提升家庭生活效率和便捷性方面的潜力。

来源:TechCrunch AI

01:00

卡特彼勒携手英伟达,将人工智能引入其建筑设备

卡特彼勒与英伟达合作,将AI和自动化技术融入其建筑机械中,推出基于Nvidia Jetson Thor平台的Cat AI辅助系统,应用于306 CR迷你挖掘机。该系统通过AI代理帮助操作员获取信息、资源访问、安全提示及服务预约,并收集大量数据以优化施工模拟。卡特彼勒还利用Nvidia Omniverse创建工地数字孪生体,提高项目规划准确性。此举标志着传统制造业向智能化转型的重要一步,展现了物理AI在实际场景中的应用潜力。

来源:TechCrunch AI

12月 27日
1 条新闻
02:38

2026年股权市场预测:人工智能代理、重磅IPO及风险投资的未来

TechCrunch 的 Equity 节目回顾了 2025 年 AI 领域的重大发展,包括大规模融资和物理 AI 的崛起,并对 2026 年进行了预测。讨论涵盖AI代理的发展、好莱坞对AI生成内容的抵制及VC面临的流动性危机等话题。特别强调了世界模型作为AI新趋势及其与大语言模型的区别,以及AI初创企业融资模式的变化。

来源:TechCrunch AI

12月 24日
8 条新闻
17:40

不拼爹,拼AI,青少年们用Claude“写”出百万生意,圈粉25万投资者,谷歌风投也主动求合作?

AI技术的快速发展,特别是大语言模型和多模态模型的应用,显著降低了软件开发门槛,激发了年轻创业者们的热情。15岁的Nick Dobroshinsky利用AI生成金融分析报告,创建了BeyondSPX平台;16岁的Raghav Arora则通过AI预测库存需求,成功创办GetASAP生鲜配送公司。这些案例展示了AI在金融科技、供应链管理等领域的巨大潜力,同时也揭示了AI编程工具如何赋能新一代创业者,推动商业创新。

来源:36氪

16:37

最鲁棒的MLLM,港科大开源「退化感知推理新范式」

最鲁棒的MLLM,港科大开源「退化感知推理新范式」

针对多模态大语言模型(MLLMs)在真实世界视觉退化环境下的性能瓶颈,香港科技大学与西北工业大学等团队提出Robust-R1,通过构建显式结构化推理系统实现从‘抵抗干扰’到‘理解干扰’的范式转变。该系统使模型能够主动诊断并量化退化参数,分析其对图像语义的影响,并据此调整推理策略,显著提升了模型在自动驾驶、医疗影像等领域的鲁棒性和可解释性。

来源:36氪

16:36

生成不遗忘,「超长时序」世界模型,北大EgoLCD长短时记忆加持

生成不遗忘,「超长时序」世界模型,北大EgoLCD长短时记忆加持

北大、中大等机构联合发布EgoLCD模型,借鉴人类长短时记忆机制,首创稀疏KV缓存+LoRA动态适应架构,有效解决长视频生成中的内容漂移问题。在EgoVid-5M基准测试中,EgoLCD在时间一致性和生成质量上全面超越现有主流模型,为构建具身智能世界模型迈出关键一步。

来源:36氪

16:36

“商汤系”跑出一堆独角兽,可闫俊杰无法复制

“商汤系”跑出一堆独角兽,可闫俊杰无法复制

商汤系AI创业公司MiniMax与Vivix AI凭借深厚的技术积累及产品落地经验,成为资本新宠。MiniMax通过模型和ToC产品并行布局,实现快速商业化,2025年前9个月收入达5343.7万美元。Vivix AI仅用10个月估值飙升至13.2亿美元。两家公司在多模态交互、大语言模型等领域展现强劲发展潜力,推动AI技术在智能助手、内容生成等应用领域的突破。

来源:36氪

14:32

中国下半年新上线AI应用共205个,流量规模上通用和垂类AI分庭抗礼

Quest Mobile发布的《2025下半年AI应用交互革新与生态落地报告》显示,中国下半年新上线AI应用共205个,其中,应用插件(In-App AI)占比达81.5%,PC端网页应用占比10.7%,原生App占比7.8%。AI图像处理与AI专业顾问是下半年热门赛道;AI搜索与AI综合助手虽已形成近7亿规模用户池,仍吸引新玩家突破性入局争夺流量入口。

最新统计周期内(12月8日至12月14日),周活跃用户规模Top10的AI APP中,有6个通用AI,4个垂类场景的专业AI,形成了通用和垂类AI分庭抗礼的格局。豆包的周活跃规模达到了1.55亿,DeepSeek、元宝分别为8156万、2084万。蚂蚁阿福App、灵光App周(12.08-12.14)活跃用户规模分别达1025.4万和295.2万,位列下半年新上线原生App第一、第二。(广角观察)

来源:钛媒体

12:28

YC 2025年度AI报告:Gemini崛起、Vibe Coding成熟,你需要更新的15个认知

YC 2025年度AI报告:Gemini崛起、Vibe Coding成熟,你需要更新的15个认知

Y Combinator最新一期播客总结了2025年AI行业趋势,Anthropic和Gemini在模型竞争中崛起,分别凭借优秀的代码编写能力和推理能力超越OpenAI。同时,AI基础设施泡沫预示着计算资源将更加廉价且充沛,为初创公司提供了更多机会。此外,Vibe Coding成为一种成熟的开发方式,垂直领域的小模型击败通用大模型,显示出专有数据的重要性。

来源:36氪

12:28

原地平线智能驾驶总裁创业机器人一年:9988元,养一只家里的“小狗哥”

原地平线智能驾驶总裁创业机器人一年:9988元,养一只家里的“小狗哥”

维他动力推出消费级四足机器狗“Vbot超能机器狗”,定位为家庭伙伴,具备全地形通过能力、自主跟随及多场景应用功能。该产品采用混合架构,云端大模型处理复杂语言理解与推理,端侧自研模型保障任务响应效率和弱网环境下的表现。其核心竞争力在于打造具有探索好奇心、生存欲及安全意识的自主智能体,旨在推动AI机器人在C端市场的普及。

来源:36氪

12月 18日
1 条新闻
10:52

谷歌推出最新人工智能模型双子座3 Flash

谷歌公司17日宣布推出最新人工智能模型双子座3 Flash。谷歌称,双子座3 Flash是其最新推出的兼具前沿智能与高速性能的模型,保留了双子座3在高级推理、视觉理解和交互式代码生成等方面的核心能力,同时显著提升了响应速度和成本效率,在多个标准评测中表现优异。据谷歌介绍,该模型性能超越了双子座2.5 Pro,速度提升约3倍,且运行成本远低于前代。在用于评估代理编码能力的专业基准测试中,其得分甚至超过了双子座3 Pro。(新华社)

来源:钛媒体

12月 15日
5 条新闻
12:24

人人拥有AI科学家,一文读懂Deep Research的今生与未来

人人拥有AI科学家,一文读懂Deep Research的今生与未来

Deep Research 推动 LLM 从文本生成向知识发现转变,实现复杂开放式任务。该技术已被应用于科研、软件工程等领域,支持学术综述、实验执行等任务。研究将其划分为自主搜索、整合研究和全栈AI科学家三个阶段,涵盖查询规划、知识检索、记忆管理和答案生成四大核心组件。未来面临检索时机、记忆进化、训练算法及评估体系等挑战,需发展统一推理范式、标准化记忆系统及模块化框架以提升通用性和可靠性。

来源:36氪

12:24

OpenAI突然开源新模型,99.9%的权重是0,新稀疏性方法代替MoE

OpenAI突然开源新模型,99.9%的权重是0,新稀疏性方法代替MoE

OpenAI开源了一种名为Circuit Sparsity的新模型,该模型通过极大稀疏化(99.9%权重为零)实现了内部计算过程的高度可解释性,直接针对传统稠密Transformer模型的黑箱问题。与MoE模型相比,Circuit Sparsity追求的是原生稀疏性和任务功能解耦,尽管当前面临算力成本高的挑战,但其在提升AI可解释性方面展现出巨大潜力。

来源:36氪

12:24

AI御三家年终“火拼”

2025年人工智能领域竞争激烈,OpenAI发布GPT-5.2,强调专业知识处理能力与超长上下文记忆;Anthropic推出Claude 4.5,提升自主编程及工具操作稳定性;谷歌DeepMind发布Gemini 3,实现原生多模态融合。三者在推理、编程及智能体任务上均有显著进步,推动AI向更高效、多功能方向发展。

来源:36氪

12:24

60岁俄罗斯大叔靠给AI盖房赚翻了,斩获微软1400亿大单

60岁俄罗斯大叔靠给AI盖房赚翻了,斩获微软1400亿大单

荷兰AI基础设施公司Nebius凭借其强大的工程团队、与英伟达的紧密合作以及独特的资本运作策略,在短时间内赢得微软和Meta的大额算力订单,实现了业绩的飞速增长。Nebius不仅继承了Yandex的技术积累和人才资源,还具备自设计数据中心等关键设施的能力,使其在AI基建领域脱颖而出。通过实施覆盖硬件、IaaS及AI平台的全栈服务战略,Nebius正快速扩张其在全球范围内的算力建设规模,预计到2026年将建成总规模达2.5GW的算力集群。

来源:36氪

12:16

苏州大学首篇数学四大刊!解决了40年未决的丢番图逼近问题

苏州大学首篇数学四大刊!解决了40年未决的丢番图逼近问题

苏州大学副教授张涵与国际合作者将数论中的辛钦定理推广至自相似测度,解决了40年未决的丢番图逼近问题。该成果不仅促进了数学领域的交叉研究,还为AI在处理复杂数据分布、优化算法及提升模型训练效率等方面提供了新思路,特别是在多模态融合和边缘计算等未来趋势中展现出巨大潜力。

来源:量子位