AI新闻

已选标签:
多模态AI
模型突破
12月 9日
17 条新闻
16:26

群核科技推出Aholo空间智能平台,并发布3D AI创作工具LuxReal

群核科技在2025酷+大会宣布开放底层空间智能能力,提供可视化与结构化空间数据,连接物理与数字世界。公司发布的战略全景图显示,公司由3D软件商升级为空间智能基础设施商,服务具身智能、AIGC等场景,并推出Aholo空间智能开放平台,开放14年积累的重建、生成、编辑与理解能力,支持API/SDK快速构建高保真3D空间,覆盖设计、XR、影视等领域。

同期发布3D AI创作工具LuxReal,基于自研Lux3D模型提升AI视频空间一致性。已与华策影视、PICO等合作拓展影视、XR及机器人仿真应用,酷家乐等平台AI化升级后效率提升百倍。据悉,LuxReal已开启全球内测邀请,并将于12月中下旬正式启动内测。(广角观察)

来源:钛媒体

16:26

智元宣布开源高性能视频数据加载库VideoDataset

智元机器人宣布开源VideoDataset。据介绍,VideoDataset是智元机器人团队基于实际AI训练需求深度开发的高性能视频数据加载库,其基于NVIDIA Video Codec SDK进行封装,通过多解码器(Decoder)调度和生产者—消费者模型等多种手段实现了解码与训练的完全异步流水线,使解码器利用率达到90%以上。(广角观察)

来源:钛媒体

15:43

论文自动变漫画PPT!Nano Banana同款用秘塔免费生成,还有一对一语音讲解

论文自动变漫画PPT!Nano Banana同款用秘塔免费生成,还有一对一语音讲解

秘塔AI推出了一款创新的漫画式课件生成工具,能够将学术论文或行业报告自动生成为图文并茂、附带语音讲解的PPT。该工具支持多种风格选择,无需繁琐申请即可免费使用,极大提升了知识获取效率与学习体验。此应用展示了AI在教育辅助领域的潜力,特别是通过多模态处理技术实现信息的可视化和口语化表达,降低了复杂信息的理解门槛。

来源:量子位

15:23

准确率腰斩,大模型视觉能力一出日常生活就「失灵」

准确率腰斩,大模型视觉能力一出日常生活就「失灵」

EgoCross项目团队提出首个跨域第一人称视频问答基准,涵盖手术、工业、极限运动和动物视角四大领域,揭示现有多模态大语言模型在跨域场景下的泛化瓶颈。通过全面评测8款主流MLLM,发现即使最佳模型在跨域场景中表现也显著下降。研究探索了提示学习、监督微调及强化学习等方法,其中RL方法带来最显著性能提升(平均22%),为构建更具泛化能力的AI系统提供了新方向。

来源:36氪

15:23

稚晖君5000台机器人量产下线,创业仅3年,订单数亿元

稚晖君5000台机器人量产下线,创业仅3年,订单数亿元

智元机器人创始人彭志辉实现了5000台通用具身机器人的量产,涵盖全尺寸、半尺寸人形及轮式机器人三大系列。远征A2搭载ActionGPT动作大模型,灵犀X2面向家庭与商演场景,精灵G2则专注于工业智造。通过真机强化学习等技术,这些机器人在汽车制造、3C电子装配、讲解接待和文娱商演等多个领域实现商业落地。

来源:36氪

15:22

梁文锋,Nature全球年度十大科学人物

梁文锋,Nature全球年度十大科学人物

梁文锋因DeepSeek模型对AI领域的贡献入选《自然》2025年度十大科学人物。DeepSeek以性价比策略降低大模型成本,并证明了无需堆砌数据与参数也能实现一线能力。最近,DeepSeek开源V3.2系列,在Agent评测中达到最高水平。梁文锋的背景从量化投资转向AGI探索,展示了跨领域创新的可能性。

来源:36氪

13:19

努比亚总裁与抖音副总裁回应豆包AI手机问题

努比亚技术有限公司总裁倪飞发文称,团队已收到一些问题与反馈,正在与合作伙伴积极沟通与解决。抖音集团副总裁李亮转发并配文称:AI带来的变革是真实存在的,用户的需求也是真实存在的。豆包和中兴的探索是一个开始,不论这次是否会成功,但AI一定是未来。(广角观察)

来源:钛媒体

12:17

“AI DemoDay,怎么来的都是老登?”

“AI DemoDay,怎么来的都是老登?”

新闻揭示了AI创业领域中年龄结构的转变,尽管国外AI创业多由年轻团队主导,如Cursor等快速成长的95后、00后创业者,但国内两场重要DemoDay上,80后及95前创业者占据多数。这反映了随着AI技术向应用层深入发展,对行业理解、资源积累的需求增加,使得‘年轻’逐渐成为相对劣势。同时,指出大模型领域已形成寡头垄断趋势,而其他应用方向则需更全面的产品开发与市场策略。

来源:36氪

12:16

被OpenAI开除的天才少年:联手谷歌,围剿英伟达

被OpenAI开除的天才少年:联手谷歌,围剿英伟达

谷歌正通过扶持云服务商Fluidstack分发自研TPU芯片,以打破英伟达在AI算力市场的垄断。此举不仅反映了谷歌在提升算力效率和成本控制上的努力,也揭示了AI领域内资本与技术之间的激烈竞争。前OpenAI研究员阿申布伦纳创立的基金有意领投Fluidstack的新一轮融资,进一步加剧了这场围绕AI基础设施建设的博弈。

来源:36氪

10:12

AI 时代,怎么跟模型说话?

本文探讨了2025年AI对话的重要性,以及提示词技能在职场中的价值。Anthropic的哲学博士Amanda Askell通过与Claude模型的交互,塑造其温和、耐心的性格,并强调AI模型应被视为协作伙伴而非工具。她提出三个核心原则:明确需求、任务分解和提供上下文。Anthropic还通过一份长达14,000个token的灵魂文档,在训练阶段就让Claude形成稳定的价值观。未来,AI产品将不仅竞争于能力,更在于性格和价值观的设计上。

来源:36氪

09:05

智谱开源“会操作手机的AI”AutoGLM

智谱深夜开源其核心AI Agent模型AutoGLM。该模型被业界视为全球首个具备“Phone Use”(手机操作)能力的AI Agent,能够稳定完成外卖点单、机票预订等长达数十步的复杂操作流程。此次开源意味着硬件厂商、手机厂商和开发者均可基于AutoGLM,在自己的设备或系统中复现一个能“看懂”屏幕、并模拟真人进行点击、输入、滑动的AI助手。目前,AutoGLM已支持微信、淘宝、抖音、美团等超过50个高频中文应用的核心场景,其自动化操作能力与此前引发热议的“豆包手机”演示相似。(广角观察)

来源:钛媒体

09:05

3个05后,被曝获3.5亿新融资

3个05后,被曝获3.5亿新融资

Aaru,一家利用AI Agents模拟人类行为以预测特定群体反应的初创企业,完成由红点创投领投的A轮融资,名义估值达10亿美元。其核心技术基于深度学习和大数据分析,在政治选举、民意调查等领域展现出显著优势。通过与知名企业和机构合作,Aaru正推动AI在数据分析预测领域的商业落地和发展。

来源:36氪

09:05

谷歌新架构逆天,为了让AI拥有长期记忆,豆包们都想了哪些招数?

谷歌新架构逆天,为了让AI拥有长期记忆,豆包们都想了哪些招数?

Google提出HOPE框架,旨在解决大模型长期记忆问题,通过区分短期与长期记忆系统,实现更稳定、个性化的信息存储和调用。这一进展标志着大模型正从依赖超长上下文窗口向构建可持续更新的记忆体系转变,对于提升智能助手的连续性和可靠性至关重要。同时,行业内的探索如字节MemAgent和MiniMax等也在推动长期记忆机制内化为模型核心能力,强调记忆应参与决策而非仅作为外部存储。

来源:36氪

09:05

估值破万亿,1845亿梁文锋和他的DeepSeek近况如何?

估值破万亿,1845亿梁文锋和他的DeepSeek近况如何?

DeepSeek凭借1.05万亿元估值成为中国第二大、全球第六大独角兽企业,其最新发布的DeepSeek-V3.2模型在推理能力上达到GPT-5水平。通过开源与高性价比策略,DeepSeek推动了AI行业的快速发展,并在生成式AI工具中保持强劲竞争力。创始人梁文锋的领导力和技术背景为公司注入了创新基因,面对国内外激烈竞争,DeepSeek持续优化模型性能,降低成本,提升用户体验。

来源:36氪

08:26

小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东

小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东

小冰创始人李笛开启新创业旅程,成立Nextie公司,专注于群体智能与认知模型。通过多智能体协作,旨在教会AI‘认知’而非单纯的知识积累,强调在类似人类协作中产生智能。其内测产品’团子’采用AI辩论机制,在特定任务上已取得SOTA。Nextie计划启动千万美元融资,商业模式倾向于按任务结果定价。

来源:量子位

12月 8日
3 条新闻
21:45

张予彤以月之暗面总裁身份出席活动,与金沙江纠纷或已解决

最近多个信源显示,张予彤近期在以“月之暗面总裁”的身份对外出席活动,并得到月之暗面方面的确认,“负责公司的整体战略与商业化,包括融资,也会参与一些新产品的开发”。就张予彤是否已正式就任月之暗面总裁一事求证月之暗面官方,截至发稿未获得回应。

金沙江与月之暗面(以及杨植麟、张予彤个人)之间的纠纷,目前公开信息处于完全“沉默”的状态,暂时没有新的司法进展、和解公告或双方发声对外释放。 (创投家CLUB)

来源:钛媒体

21:45

北京市科委立项课题”AI辅助3D游戏内容生产平台研发与应用”正式启动

由元境与北航新媒体艺术与设计学院联合主办的”智绘万象·聚力共生”3D数字内容创新发展高峰论坛上,北京市科委立项课题”AI辅助3D游戏内容生产平台研发与应用”日前正式启动,元境同步与浙江省北大信息技术高等研究院、重庆千方实业发展有限公司达成战略合作,构建空间计算技术生态,加速3D AIGC在游戏、动漫等领域的应用落地。(广角观察)

来源:钛媒体

21:38

看完最新国产AI写的公众号文章,我慌了!

看完最新国产AI写的公众号文章,我慌了!

智谱最新升级的GLM-4.6V模型展示了强大的多模态处理能力,能够高效生成图文并茂的公众号文章、解读论文与财报、复刻网页设计等。该模型在多个主流评测中取得SOTA成绩,尤其在视觉推理方面表现出色,支持从图片到视频等多种格式的内容理解与生成。其创新性地将工具调用能力融入视觉模型,为实际应用场景中的多模态Agent提供了强有力的技术支持。

来源:量子位