AI新闻

已选标签:
模型突破
多模态AI
12月 9日
20 条新闻
20:32

国产多模态AI再开源,实测截图转网页、搜图购物,价格减半

国产多模态AI再开源,实测截图转网页、搜图购物,价格减半

智谱开源了GLM-4.6V系列多模态大模型,包括基础版和轻量版,支持智能图文混排、识图购物、前端复刻及长上下文理解等任务。该模型在多模态交互、逻辑推理和长上下文能力上取得SOTA表现,并且价格相比前代降低50%,轻量版全面免费。AutoGLM作为首个具备手机操作能力的AI Agent也被一同开源。

来源:36氪

20:32

对话AI“老炮”邹阳:AGI不是你该关心的,现在的技术足够改变世界

本文探讨了AI技术在当前阶段的实际应用价值与未来发展方向。邹阳认为,尽管大语言模型可能无法实现AGI,但现有技术水平已足以对企业流程进行深度改造,尤其在重复性、高频次的工作场景中展现巨大潜力。他强调,AI的价值在于成为企业脑力工作的‘外接大脑’,而非仅限于对话机器人等表面应用。此外,文章还指出,随着模型能力增量减小,行业应更加关注工程化和实际落地,而非盲目追求技术的下一次飞跃。

来源:36氪

19:31

36氪 2026 CES现场策划:深度专访+创业者投资人社交局

2026年CES预示新一轮AI浪潮,中国智能硬件企业出海势头强劲。AI技术广泛融入消费电子产品,推动AI眼镜、机器人等快速发展。行业正从技术突破转向场景化落地,重点在于将AI潜能转化为实际产品体验。同创伟业等投资机构看好AI Agent重塑智能终端产品定义及交互体验的潜力,预计未来2-3年是关键投资窗口期。

来源:36氪

18:29

人工智能生成广告:机遇、挑战与对策

新闻探讨了生成式人工智能技术,如大语言模型和多模态模型,在广告行业中的应用与变革。从程序化推荐到基于用户意图理解的智能广告系统,AI正在重塑数字广告的生产、投放及效果评估流程。以谷歌Gemini和腾讯混元大模型为例,展示了AI如何推动广告从被动呈现转向主动交互,并实现“一人千面”的个性化体验。然而,技术成熟度不足、数据合规性以及算法偏见等问题也对广告业提出了新的挑战。

来源:36氪

18:28

一文读懂Android XR发布会:谷歌“亲儿子”明年开卖

一文读懂Android XR发布会:谷歌“亲儿子”明年开卖

谷歌发布Android XR平台,整合多模态AI能力,支持智能眼镜与头显设备。通过Gemini AI实现情境感知式交互,如视觉搜索、实时翻译等功能。同时,推出有线XR眼镜Project Aura,平衡算力与佩戴舒适度。此外,更新了Android XR SDK,提供Jetpack Glimmer和Projected库,简化开发流程,并遵循OpenXR标准,促进生态发展。

来源:36氪

18:18

共推空天领域智能化升级!趋境科技与金航数码强强联手

共推空天领域智能化升级!趋境科技与金航数码强强联手

趋境科技与金航数码达成战略合作,共同推动空天领域智能化升级。基于趋境科技的高性能大模型私有化部署算力底座及金航数码的应用能力,双方已在航空等复杂装备工业领域成功落地多个大模型解决方案,实现降低推理门槛10倍的效果。此次合作深化了在智能化数据库、数据分析、辅助编程等方面的应用,并计划推广至更广泛的航空航天场景中,加速行业智能化转型。

来源:量子位

17:27

IDC:预计2030年中国具身智能机器人用户支出规模飙升至770亿美元

IDC最新报告预测,2025年中国具身智能机器人用户支出规模预计超过14亿美元,到2030年将飙升至770亿美元,年均复合增长率(CAGR)高达94%。IDC指出,当前,在政策推动、资本活跃与产业链协同加速的共同作用下,中国正快速形成完整的具身智能机器人产业链,政府推进技术标准与示范应用建设,资本持续投入,产业端则通过开放合作加快技术成果的工程化落地。(广角观察)

来源:钛媒体

17:27

豆包踢开Agent大门,但微信说不定先进门

豆包踢开Agent大门,但微信说不定先进门

字节跳动推出豆包手机助手,尝试将AI前置在手机系统层以全局操作各类App,但遭遇腾讯、阿里系平台权限限制。尽管面临挑战,豆包作为端侧AI产品展现了革新交互逻辑的潜力,但也引发了关于数据安全与商业竞争的新议题。未来,超级App如微信可能成为短期内AI智能体的主要落地场景,而如何平衡技术创新与生态合作将是关键。

来源:36氪

17:27

特斯拉机器人又被抓包:疑似遥控「摘头显」摔倒,名场面诞生

特斯拉机器人又被抓包:疑似遥控「摘头显」摔倒,名场面诞生

特斯拉人形机器人Optimus在近期活动中因疑似远程操控引发热议,暴露了当前人形机器人技术在自主智能方面的局限。尽管面临争议,马斯克坚信Optimus将极大推动经济发展,甚至改变社会结构。从技术角度看,实现精准的力反馈、低延迟信号传输等是远程操控人形机器人的关键挑战。长远来看,随着深度学习、多模态处理能力的进步,真正的完全自主智能仍需行业共同努力。

来源:36氪

17:27

2026年全球保险业展望:AI“重编码”游戏规则

2026年全球保险业展望:AI“重编码”游戏规则

全球保险业正经历从规模驱动到技术、资本与服务能力的深度变革。生成式AI、物联网监测及地理空间分析等技术在非寿险领域广泛应用,推动行业从记录风险向预测风险转变,提升精算能力和控制赔付成本。同时,AI在核保、理赔、客服等环节加速落地,但其规模化应用仍面临数据质量与系统基础挑战。未来保险业的核心竞争力将聚焦于技术底座能力、资本结构灵活性、数据模型深度及以客户为中心的服务体系构建。

来源:36氪

16:26

群核科技推出Aholo空间智能平台,并发布3D AI创作工具LuxReal

群核科技在2025酷+大会宣布开放底层空间智能能力,提供可视化与结构化空间数据,连接物理与数字世界。公司发布的战略全景图显示,公司由3D软件商升级为空间智能基础设施商,服务具身智能、AIGC等场景,并推出Aholo空间智能开放平台,开放14年积累的重建、生成、编辑与理解能力,支持API/SDK快速构建高保真3D空间,覆盖设计、XR、影视等领域。

同期发布3D AI创作工具LuxReal,基于自研Lux3D模型提升AI视频空间一致性。已与华策影视、PICO等合作拓展影视、XR及机器人仿真应用,酷家乐等平台AI化升级后效率提升百倍。据悉,LuxReal已开启全球内测邀请,并将于12月中下旬正式启动内测。(广角观察)

来源:钛媒体

16:26

智元宣布开源高性能视频数据加载库VideoDataset

智元机器人宣布开源VideoDataset。据介绍,VideoDataset是智元机器人团队基于实际AI训练需求深度开发的高性能视频数据加载库,其基于NVIDIA Video Codec SDK进行封装,通过多解码器(Decoder)调度和生产者—消费者模型等多种手段实现了解码与训练的完全异步流水线,使解码器利用率达到90%以上。(广角观察)

来源:钛媒体

15:43

论文自动变漫画PPT!Nano Banana同款用秘塔免费生成,还有一对一语音讲解

论文自动变漫画PPT!Nano Banana同款用秘塔免费生成,还有一对一语音讲解

秘塔AI推出了一款创新的漫画式课件生成工具,能够将学术论文或行业报告自动生成为图文并茂、附带语音讲解的PPT。该工具支持多种风格选择,无需繁琐申请即可免费使用,极大提升了知识获取效率与学习体验。此应用展示了AI在教育辅助领域的潜力,特别是通过多模态处理技术实现信息的可视化和口语化表达,降低了复杂信息的理解门槛。

来源:量子位

15:23

准确率腰斩,大模型视觉能力一出日常生活就「失灵」

准确率腰斩,大模型视觉能力一出日常生活就「失灵」

EgoCross项目团队提出首个跨域第一人称视频问答基准,涵盖手术、工业、极限运动和动物视角四大领域,揭示现有多模态大语言模型在跨域场景下的泛化瓶颈。通过全面评测8款主流MLLM,发现即使最佳模型在跨域场景中表现也显著下降。研究探索了提示学习、监督微调及强化学习等方法,其中RL方法带来最显著性能提升(平均22%),为构建更具泛化能力的AI系统提供了新方向。

来源:36氪

15:23

稚晖君5000台机器人量产下线,创业仅3年,订单数亿元

稚晖君5000台机器人量产下线,创业仅3年,订单数亿元

智元机器人创始人彭志辉实现了5000台通用具身机器人的量产,涵盖全尺寸、半尺寸人形及轮式机器人三大系列。远征A2搭载ActionGPT动作大模型,灵犀X2面向家庭与商演场景,精灵G2则专注于工业智造。通过真机强化学习等技术,这些机器人在汽车制造、3C电子装配、讲解接待和文娱商演等多个领域实现商业落地。

来源:36氪

15:22

梁文锋,Nature全球年度十大科学人物

梁文锋,Nature全球年度十大科学人物

梁文锋因DeepSeek模型对AI领域的贡献入选《自然》2025年度十大科学人物。DeepSeek以性价比策略降低大模型成本,并证明了无需堆砌数据与参数也能实现一线能力。最近,DeepSeek开源V3.2系列,在Agent评测中达到最高水平。梁文锋的背景从量化投资转向AGI探索,展示了跨领域创新的可能性。

来源:36氪

13:19

努比亚总裁与抖音副总裁回应豆包AI手机问题

努比亚技术有限公司总裁倪飞发文称,团队已收到一些问题与反馈,正在与合作伙伴积极沟通与解决。抖音集团副总裁李亮转发并配文称:AI带来的变革是真实存在的,用户的需求也是真实存在的。豆包和中兴的探索是一个开始,不论这次是否会成功,但AI一定是未来。(广角观察)

来源:钛媒体