AI新闻

已选标签:
AI智能体
模型突破
12月 2日
20 条新闻
17:56

Runway Gen-4.5刷屏发布,把重量尘土和光影都做对了,网友:颠覆

Runway Gen-4.5刷屏发布,把重量尘土和光影都做对了,网友:颠覆

Runway Gen-4.5在文本转视频基准测试中以1247分超越所有现有模型,实现物理和视觉准确性突破。该模型擅长执行复杂序列式指令,生成的视频具有逼真的重量感与动量特征,适用于多种风格和场景。尽管存在因果推理等局限性,Gen-4.5展示了AI在多模态融合及内容生成领域的显著进步。

来源:量子位

16:52

商汤分拆了一家AI医疗公司,半年融资10亿,剑指“医疗世界模型”

商汤分拆了一家AI医疗公司,半年融资10亿,剑指“医疗世界模型”

商汤分拆的AI医疗公司半年内融资10亿,目标构建‘医疗世界模型’,以实现对医疗场景的全面感知与深度理解。其自研大语言模型‘大医®’在专业测试中表现优异,结合多模态基础模型群和双中台架构,形成数据-模型-场景-产业闭环。已在病理、影像等多个临床方向上线40余款AI模块,并与多家医院及企业合作,推动智慧医院建设。

来源:量子位

16:18

马斯克开「AI救国猛药」:3年解决美38万亿国债危机

马斯克开「AI救国猛药」:3年解决美38万亿国债危机

马斯克提出AI和机器人可在三年内解决美国债务危机,通过提高生产效率和降低劳动成本实现通缩。他强调旗下公司Tesla、SpaceX、xAI及Starlink正形成一个以AI为核心的技术体系,涵盖自动驾驶、真实世界AI、太空通信等。长期来看,AI与机器人将极大丰富物质供给,使货币失去意义,工作成为兴趣选择。此外,孙正义看好AI未来潜力,尽管抛售英伟达股票,但仍致力于投资AI领域。

来源:36氪

16:18

V3.2逼近Gemini 3,DeepSeek硬气喊话:接下来我要堆算力了

V3.2逼近Gemini 3,DeepSeek硬气喊话:接下来我要堆算力了

DeepSeek发布V3.2和V3.2-Speciale,证明了通过优化方法和数据而非单纯扩大模型规模来解决训练后瓶颈的可行性。V3.2引入稀疏注意力机制DSA,提高效率并融合思考与工具调用;Speciale则专注于深度推理,验证了过程监督可泛化至多个领域。两者共同展示了未来AI模型可能不再依赖人力堆砌,而是依靠自我博弈实现持续演进的趋势。

来源:36氪

16:18

五年,终于等来Transformers v5

五年,终于等来Transformers v5

Transformers v5 发布首个 RC 版本,标志着该 AI 基础设施库正式从 v4 升级至 v5。此次更新聚焦于极致简洁性、预训练支持、高性能推理引擎互操作性及量化提升为核心功能。Transformers 作为领先的模型定义库,通过持续演进保持其在人工智能领域的相关性与领先优势,进一步推动了多模态模型的发展,并加强了与各类推理引擎的兼容性,为未来AI技术的应用提供了坚实的基础。

来源:36氪

15:17

中国首个作物“AI基因科学家”问世,明年面向全球上线

中国作物学界首位“AI同事”——由上海人工智能实验室联合崖州湾国家实验室、中国农业大学等机构共同研发的“丰登·基因科学家”今年夏天问世后受到各方关注。最新获悉,这一基于大模型的科研智能体计划明年面向全球上线。“丰登·基因科学家”不仅能精准回答育种领域问题,更能模拟育种专家的思维链条:提出科学假设、自主设计实验、解析结果数据。截至目前,已辅助科研人员发现数十个此前未被报道的作物基因功能,并获得实验证实。 (上观新闻)

来源:钛媒体

15:16

前苹果大牛归国创业,「万有引力」打造首颗全功能空间计算MR芯片

前苹果大牛归国创业,「万有引力」打造首颗全功能空间计算MR芯片

万有引力电子科技推出三款空间计算芯片,包括MR专用的极智G-X100、AI/AR专用ISP的极眸G-VX100及面向数字人渲染的极颜G-EB100,形成全栈解决方案。这些芯片针对感知计算、AI推理与实时3D渲染进行了优化,特别是在低延迟和高能效方面实现了突破。此外,通过“极域”平台,该公司提供了一个从底层算力到终端应用的技术闭环,旨在解决行业面临的专用芯片依赖度高、系统级生态薄弱等问题,推动空间计算技术向大规模产业化迈进。

来源:36氪

13:35

世界模型和具身大脑最新突破:90%生成数据,VLA性能暴涨300%|开源

世界模型和具身大脑最新突破:90%生成数据,VLA性能暴涨300%|开源

极佳视界发布并开源了具身世界模型GigaWorld-0,该模型在VLA训练中实现了90%的数据由世界模型生成,并使VLA性能提升300%。GigaWorld-0通过视频和3D生成技术,解决了真实机器人数据稀缺问题,支持高效、高泛化、低成本的具身智能训练。其创新架构包括稀疏注意力机制与MoE架构,以及基于物理信息神经网络的可微分物理引擎,显著提升了生成数据的质量与多样性。

来源:量子位

12:11

AI初创公司Runway推出影片生成模型Gen 4.5,测评排名超谷歌和OpenAI

人工智能(AI)初创公司Runway周一宣布推出最新影片生成模型Gen 4.5,能依照文字指令生成高画质影片,并在第三方评测平台Video Arena夺下第一名,谷歌Veo 3排名第二,OpenAI的Sora 2 Pro则位居第七。据介绍,新模型擅长理解物理效果、人类动作、镜头运动与因果关系,能更精准地模拟真实世界情境。Gen 4.5将于本周逐步向所有Runway用户全面开放。(广角观察)

来源:钛媒体

12:10

鹏城实验室出品,一座“世界模型”融资数亿元

鹏城实验室出品,一座“世界模型”融资数亿元

扎克伯格领导的Meta通过重金引进顶尖AI人才,包括收购Scale AI和引入杨立昆等,旨在构建强大的AI团队。然而,杨立昆认为现有大语言模型缺乏对物理世界的理解能力,提出‘世界模型’作为实现AGI的新路径。中国科学家们也正积极探索‘物理空间智能模型’,如拓元智慧提出的VWA架构,以解决当前模型在物理推理与跨场景迁移上的局限性,推动AI向更实际应用场景发展。

来源:36氪

12:10

AI重塑了管理假设,组织不一样了

随着AI技术的发展,大型企业正逐渐采用集权模式,通过AI工具实现更高效的管理与决策。AI使得高层能够穿透中层,直接进行大幅宽、穿透式的管控,简化了信息处理流程,减少了对中层的依赖。同时,基层员工借助AI工具提高了工作交付质量,进一步降低了监管难度。这导致组织结构趋向扁平化,中层角色被压缩,未来仅保留具备顶层设计思维和线下场景价值的人才。

来源:36氪

11:53

PixVerse(拍我AI)V5.5发布:国内首款分镜+音频一键生成AI视频大模型

PixVerse(拍我AI)V5.5发布:国内首款分镜+音频一键生成AI视频大模型

拍我AI V5.5发布,国内首款实现分镜+音频一键生成视频的大模型。该版本支持多镜头与音频同步生成,具备完整叙事能力,大幅降低视频创作门槛。用户只需输入简短提示词即可生成高质量视频,涵盖景别变化、对白、音效等。此外,平台还提供图像到视频的一体化工作流及多种编辑功能,推动AI视频成为内容生产的基础设施。

来源:量子位

09:04

梁文锋署名论文,DeepSeek最强开源Agent模型炸场

梁文锋署名论文,DeepSeek最强开源Agent模型炸场

DeepSeek发布新模型DeepSeek-V3.2及长思考增强版Speciale,性能超越现有开源模型,在推理、智能体等多领域基准测试中表现出色。通过引入DSA稀疏注意力机制、强化学习协议和工具使用场景泛化流程,显著提升长序列处理效率与泛化能力。V3.2系列已开源,并在多个国际竞赛中取得优异成绩,展现了强大的复杂任务处理能力。

来源:36氪

09:04

ChatGPT 三周年遭 DeepSeek 暴击,23 页技术报告藏着开源登顶的全部秘密

ChatGPT 三周年遭 DeepSeek 暴击,23 页技术报告藏着开源登顶的全部秘密

DeepSeek 发布了两款新模型 V3.2 和 V3.2-Speciale,分别在推理能力和工具调用方面取得突破。V3.2 引入稀疏注意力机制 DSA,显著提升了处理长文档的效率和性能;同时通过强化学习训练框架,实现了边思考边使用工具的能力,适用于日常问答、写作等场景。V3.2-Speciale 则面向高级任务,性能媲美 Gemini-3.0-Pro,但在成本和实用性上有所妥协。

来源:36氪

09:03

OpenAI危,DeepSeek放大招:追平谷歌最强,手撕GPT-5 High

OpenAI危,DeepSeek放大招:追平谷歌最强,手撕GPT-5 High

DeepSeek发布V3.2正式版,性能全面超越GPT-5 High,与谷歌Gemini-3.0 Pro持平。新模型凭借DSA稀疏注意力架构,在数学编程等多领域取得4项国际奥赛金牌级成绩,打破了速度、成本与智能的不可能三角。通过思维上下文管理和虚拟演练场训练,V3.2实现了高效推理与工具使用的无缝结合,展示了在有限算力下实现强智能的新路径。

来源:36氪

05:00

英伟达宣布推出新的开放AI模型和自动驾驶研究工具

英伟达宣布推出新的开放AI模型和自动驾驶研究工具

NVIDIA发布Alpamayo-R1,一款专为自动驾驶研究设计的开放视觉语言模型,基于Cosmos Reason模型,旨在提升车辆在复杂环境下的决策能力。该技术是实现4级自动驾驶的关键。同时,NVIDIA提供了Cosmos Cookbook等资源,帮助开发者更好地训练和使用Cosmos模型。这些举措表明NVIDIA正全力推进物理AI领域的发展,特别是机器人与自动驾驶方面。

来源:TechCrunch AI