AI新闻

已选标签:
多模态AI
具身智能
12月 9日
10 条新闻
18:18

共推空天领域智能化升级!趋境科技与金航数码强强联手

共推空天领域智能化升级!趋境科技与金航数码强强联手

趋境科技与金航数码达成战略合作,共同推动空天领域智能化升级。基于趋境科技的高性能大模型私有化部署算力底座及金航数码的应用能力,双方已在航空等复杂装备工业领域成功落地多个大模型解决方案,实现降低推理门槛10倍的效果。此次合作深化了在智能化数据库、数据分析、辅助编程等方面的应用,并计划推广至更广泛的航空航天场景中,加速行业智能化转型。

来源:量子位

17:27

IDC:预计2030年中国具身智能机器人用户支出规模飙升至770亿美元

IDC最新报告预测,2025年中国具身智能机器人用户支出规模预计超过14亿美元,到2030年将飙升至770亿美元,年均复合增长率(CAGR)高达94%。IDC指出,当前,在政策推动、资本活跃与产业链协同加速的共同作用下,中国正快速形成完整的具身智能机器人产业链,政府推进技术标准与示范应用建设,资本持续投入,产业端则通过开放合作加快技术成果的工程化落地。(广角观察)

来源:钛媒体

17:27

特斯拉机器人又被抓包:疑似遥控「摘头显」摔倒,名场面诞生

特斯拉机器人又被抓包:疑似遥控「摘头显」摔倒,名场面诞生

特斯拉人形机器人Optimus在近期活动中因疑似远程操控引发热议,暴露了当前人形机器人技术在自主智能方面的局限。尽管面临争议,马斯克坚信Optimus将极大推动经济发展,甚至改变社会结构。从技术角度看,实现精准的力反馈、低延迟信号传输等是远程操控人形机器人的关键挑战。长远来看,随着深度学习、多模态处理能力的进步,真正的完全自主智能仍需行业共同努力。

来源:36氪

17:27

2026年全球保险业展望:AI“重编码”游戏规则

2026年全球保险业展望:AI“重编码”游戏规则

全球保险业正经历从规模驱动到技术、资本与服务能力的深度变革。生成式AI、物联网监测及地理空间分析等技术在非寿险领域广泛应用,推动行业从记录风险向预测风险转变,提升精算能力和控制赔付成本。同时,AI在核保、理赔、客服等环节加速落地,但其规模化应用仍面临数据质量与系统基础挑战。未来保险业的核心竞争力将聚焦于技术底座能力、资本结构灵活性、数据模型深度及以客户为中心的服务体系构建。

来源:36氪

15:43

论文自动变漫画PPT!Nano Banana同款用秘塔免费生成,还有一对一语音讲解

论文自动变漫画PPT!Nano Banana同款用秘塔免费生成,还有一对一语音讲解

秘塔AI推出了一款创新的漫画式课件生成工具,能够将学术论文或行业报告自动生成为图文并茂、附带语音讲解的PPT。该工具支持多种风格选择,无需繁琐申请即可免费使用,极大提升了知识获取效率与学习体验。此应用展示了AI在教育辅助领域的潜力,特别是通过多模态处理技术实现信息的可视化和口语化表达,降低了复杂信息的理解门槛。

来源:量子位

15:23

准确率腰斩,大模型视觉能力一出日常生活就「失灵」

准确率腰斩,大模型视觉能力一出日常生活就「失灵」

EgoCross项目团队提出首个跨域第一人称视频问答基准,涵盖手术、工业、极限运动和动物视角四大领域,揭示现有多模态大语言模型在跨域场景下的泛化瓶颈。通过全面评测8款主流MLLM,发现即使最佳模型在跨域场景中表现也显著下降。研究探索了提示学习、监督微调及强化学习等方法,其中RL方法带来最显著性能提升(平均22%),为构建更具泛化能力的AI系统提供了新方向。

来源:36氪

09:05

智谱开源“会操作手机的AI”AutoGLM

智谱深夜开源其核心AI Agent模型AutoGLM。该模型被业界视为全球首个具备“Phone Use”(手机操作)能力的AI Agent,能够稳定完成外卖点单、机票预订等长达数十步的复杂操作流程。此次开源意味着硬件厂商、手机厂商和开发者均可基于AutoGLM,在自己的设备或系统中复现一个能“看懂”屏幕、并模拟真人进行点击、输入、滑动的AI助手。目前,AutoGLM已支持微信、淘宝、抖音、美团等超过50个高频中文应用的核心场景,其自动化操作能力与此前引发热议的“豆包手机”演示相似。(广角观察)

来源:钛媒体

09:05

谷歌新架构逆天,为了让AI拥有长期记忆,豆包们都想了哪些招数?

谷歌新架构逆天,为了让AI拥有长期记忆,豆包们都想了哪些招数?

Google提出HOPE框架,旨在解决大模型长期记忆问题,通过区分短期与长期记忆系统,实现更稳定、个性化的信息存储和调用。这一进展标志着大模型正从依赖超长上下文窗口向构建可持续更新的记忆体系转变,对于提升智能助手的连续性和可靠性至关重要。同时,行业内的探索如字节MemAgent和MiniMax等也在推动长期记忆机制内化为模型核心能力,强调记忆应参与决策而非仅作为外部存储。

来源:36氪

12月 8日
10 条新闻
21:45

北京市科委立项课题”AI辅助3D游戏内容生产平台研发与应用”正式启动

由元境与北航新媒体艺术与设计学院联合主办的”智绘万象·聚力共生”3D数字内容创新发展高峰论坛上,北京市科委立项课题”AI辅助3D游戏内容生产平台研发与应用”日前正式启动,元境同步与浙江省北大信息技术高等研究院、重庆千方实业发展有限公司达成战略合作,构建空间计算技术生态,加速3D AIGC在游戏、动漫等领域的应用落地。(广角观察)

来源:钛媒体

21:38

看完最新国产AI写的公众号文章,我慌了!

看完最新国产AI写的公众号文章,我慌了!

智谱最新升级的GLM-4.6V模型展示了强大的多模态处理能力,能够高效生成图文并茂的公众号文章、解读论文与财报、复刻网页设计等。该模型在多个主流评测中取得SOTA成绩,尤其在视觉推理方面表现出色,支持从图片到视频等多种格式的内容理解与生成。其创新性地将工具调用能力融入视觉模型,为实际应用场景中的多模态Agent提供了强有力的技术支持。

来源:量子位

20:42

理想也做AI眼镜了,小鹏、蔚来、小米还不速速跟进?

理想也做AI眼镜了,小鹏、蔚来、小米还不速速跟进?

新闻探讨了AI眼镜从技术到应用的潜力及挑战,强调其在多模态数据处理、实时流式语音交互上的突破。理想Livis眼镜通过结合大模型和流式智能语音框架,实现了更快捷自然的用户体验,特别是在车控场景中展现出显著优势。随着AI技术进步,AI眼镜有望成为下一代主流消费电子,推动新一轮‘范式转移’。

来源:36氪

19:40

GMI Cloud:出海是AI企业释放产能、获取新生的最佳途径|WISE 2025

GMI Cloud:出海是AI企业释放产能、获取新生的最佳途径|WISE 2025

GMI Cloud VP钱宇靖在WISE2025大会上分享了AI应用出海效能升级的关键,包括算力全球化、需求与价值的全球化转型。他指出,AI市场正经历指数级增长,特别是在北美地区,用户已广泛接受AI工具。面对出海挑战如服务及时性、扩展性和稳定性,GMI Cloud通过建设大规模AI工厂、优化集群引擎和推理引擎来提供解决方案,支持全球范围内的自动扩缩容与高可用设计,助力企业更高效地部署海外AI应用。

来源:36氪

19:39

Apple Silicon 五周年,无心插柳长出了一片 AI 市场

Apple Silicon 五周年,无心插柳长出了一片 AI 市场

苹果通过macOS 26.2 Beta更新,增强了Mac设备的AI处理能力,特别是针对本地运行超大规模AI模型的能力进行了优化。新版本支持M5处理器上的神经网络加速器,并引入了基于雷雳5协议的新传输方案,显著提升了Mac集群的数据交换效率与负载分配灵活性,使得四台Mac Studio能够本地运行接近GPT-4规模的大语言模型。这一改进不仅促进了个人开发者对AI技术的应用探索,也为寻求高敏感数据本地化处理的企业提供了更经济高效的解决方案。

来源:36氪

18:37

「中科硅纪」完成新一轮战略融资,推进行业级灵巧手+具身大小脑量产与场景落地​丨36氪首发

「中科硅纪」完成新一轮战略融资,推进行业级灵巧手+具身大小脑量产与场景落地​丨36氪首发

中科硅纪完成新一轮融资,资金将用于灵巧手产品量产及具身大小脑模型迭代。公司专注于类人灵巧操作硬件与系统解决方案研发,其Casia Hand系列已实现核心零部件国产化,并在工业、服务等多个领域形成产品矩阵。通过引入金属合金绳材和自研高精度光纤传感数据手套等技术创新,解决了绳驱系统工程应用难题。同时,中科硅纪提供小脑(基础控制)与大脑(任务理解与推理)软件支持,加速了复杂场景下的快速部署。

来源:36氪

18:37

谷歌重启,阿里入局:AI眼镜会沦为神话还是笑话

AI眼镜赛道竞争激烈,巨头如阿里、谷歌等纷纷入局,核心在于构建垂直场景闭环与物理世界数据掌控。2025年全球市场规模预计达42亿美元。硬件参数不再是胜负关键,生态整合与用户体验成为焦点。技术上,终端侧大模型轻量化推动自然语音交互;商业上,目标是全天候无感化交互,形成独特服务闭环。未来,谁能有效整合硬件体验、生态协同与数据价值,谁就能在AI眼镜市场中胜出。

来源:36氪

18:37

AI会消灭搜索吗?

AI会消灭搜索吗?

本文探讨了AI搜索如何从信息分发进化为服务撮合,分析了AI搜索引擎在对话式交互、多模态理解和任务执行方面的技术突破。以Perplexity和谷歌Gemini 3为例,展示了基于大语言模型的AI搜索通过自然语言处理和上下文记忆能力提升用户体验。同时,讨论了AI搜索在电商、社交等领域的应用前景及商业模式探索,预测其将推动万亿级信息服务市场的变革。

来源:36氪

17:35

谷歌突砍Gemini免费版炸锅,数据养模遭背刺?GPT-5.2突袭Gemini 3,Demis Hassabis:谷歌须占最强位

谷歌突砍Gemini免费版炸锅,数据养模遭背刺?GPT-5.2突袭Gemini 3,Demis Hassabis:谷歌须占最强位

谷歌大幅削减了Gemini API的免费使用额度,从每日250次请求降至20次,影响了小型项目的开发者。此举反映了谷歌在大模型竞争中的策略转变,更加注重盈利与资源优化。同时,谷歌强调其在多模态融合、视频处理等领域的技术进步,并表示未来将聚焦于跨模态能力的发展,以提升AI系统的整体性能和应用范围。

来源:36氪

17:34

4万人抢着体验,日本AI洗澡机器人爆红,智能浴室这回成真了?

4万人抢着体验,日本AI洗澡机器人爆红,智能浴室这回成真了?

日本Science公司推出的「未来人类洗澡机」通过AI技术实现了从洗澡到烘干的全自动流程,利用传感器收集用户健康数据并提供个性化建议。该设备吸引了4万名消费者报名体验,展示了AI在智能家居领域的应用潜力。尽管当前版本价格高昂且体积庞大,但其为浴室智能化提供了新的方向,有望推动全屋智能的发展。

来源:36氪