AI新闻

已选标签:
AI训练
多模态AI
12月 9日
13 条新闻
18:29

人工智能生成广告:机遇、挑战与对策

新闻探讨了生成式人工智能技术,如大语言模型和多模态模型,在广告行业中的应用与变革。从程序化推荐到基于用户意图理解的智能广告系统,AI正在重塑数字广告的生产、投放及效果评估流程。以谷歌Gemini和腾讯混元大模型为例,展示了AI如何推动广告从被动呈现转向主动交互,并实现“一人千面”的个性化体验。然而,技术成熟度不足、数据合规性以及算法偏见等问题也对广告业提出了新的挑战。

来源:36氪

18:28

一文读懂Android XR发布会:谷歌“亲儿子”明年开卖

一文读懂Android XR发布会:谷歌“亲儿子”明年开卖

谷歌发布Android XR平台,整合多模态AI能力,支持智能眼镜与头显设备。通过Gemini AI实现情境感知式交互,如视觉搜索、实时翻译等功能。同时,推出有线XR眼镜Project Aura,平衡算力与佩戴舒适度。此外,更新了Android XR SDK,提供Jetpack Glimmer和Projected库,简化开发流程,并遵循OpenXR标准,促进生态发展。

来源:36氪

18:18

共推空天领域智能化升级!趋境科技与金航数码强强联手

共推空天领域智能化升级!趋境科技与金航数码强强联手

趋境科技与金航数码达成战略合作,共同推动空天领域智能化升级。基于趋境科技的高性能大模型私有化部署算力底座及金航数码的应用能力,双方已在航空等复杂装备工业领域成功落地多个大模型解决方案,实现降低推理门槛10倍的效果。此次合作深化了在智能化数据库、数据分析、辅助编程等方面的应用,并计划推广至更广泛的航空航天场景中,加速行业智能化转型。

来源:量子位

17:27

特斯拉机器人又被抓包:疑似遥控「摘头显」摔倒,名场面诞生

特斯拉机器人又被抓包:疑似遥控「摘头显」摔倒,名场面诞生

特斯拉人形机器人Optimus在近期活动中因疑似远程操控引发热议,暴露了当前人形机器人技术在自主智能方面的局限。尽管面临争议,马斯克坚信Optimus将极大推动经济发展,甚至改变社会结构。从技术角度看,实现精准的力反馈、低延迟信号传输等是远程操控人形机器人的关键挑战。长远来看,随着深度学习、多模态处理能力的进步,真正的完全自主智能仍需行业共同努力。

来源:36氪

17:27

2026年全球保险业展望:AI“重编码”游戏规则

2026年全球保险业展望:AI“重编码”游戏规则

全球保险业正经历从规模驱动到技术、资本与服务能力的深度变革。生成式AI、物联网监测及地理空间分析等技术在非寿险领域广泛应用,推动行业从记录风险向预测风险转变,提升精算能力和控制赔付成本。同时,AI在核保、理赔、客服等环节加速落地,但其规模化应用仍面临数据质量与系统基础挑战。未来保险业的核心竞争力将聚焦于技术底座能力、资本结构灵活性、数据模型深度及以客户为中心的服务体系构建。

来源:36氪

16:26

智元宣布开源高性能视频数据加载库VideoDataset

智元机器人宣布开源VideoDataset。据介绍,VideoDataset是智元机器人团队基于实际AI训练需求深度开发的高性能视频数据加载库,其基于NVIDIA Video Codec SDK进行封装,通过多解码器(Decoder)调度和生产者—消费者模型等多种手段实现了解码与训练的完全异步流水线,使解码器利用率达到90%以上。(广角观察)

来源:钛媒体

15:43

论文自动变漫画PPT!Nano Banana同款用秘塔免费生成,还有一对一语音讲解

论文自动变漫画PPT!Nano Banana同款用秘塔免费生成,还有一对一语音讲解

秘塔AI推出了一款创新的漫画式课件生成工具,能够将学术论文或行业报告自动生成为图文并茂、附带语音讲解的PPT。该工具支持多种风格选择,无需繁琐申请即可免费使用,极大提升了知识获取效率与学习体验。此应用展示了AI在教育辅助领域的潜力,特别是通过多模态处理技术实现信息的可视化和口语化表达,降低了复杂信息的理解门槛。

来源:量子位

15:23

准确率腰斩,大模型视觉能力一出日常生活就「失灵」

准确率腰斩,大模型视觉能力一出日常生活就「失灵」

EgoCross项目团队提出首个跨域第一人称视频问答基准,涵盖手术、工业、极限运动和动物视角四大领域,揭示现有多模态大语言模型在跨域场景下的泛化瓶颈。通过全面评测8款主流MLLM,发现即使最佳模型在跨域场景中表现也显著下降。研究探索了提示学习、监督微调及强化学习等方法,其中RL方法带来最显著性能提升(平均22%),为构建更具泛化能力的AI系统提供了新方向。

来源:36氪

12:16

被OpenAI开除的天才少年:联手谷歌,围剿英伟达

被OpenAI开除的天才少年:联手谷歌,围剿英伟达

谷歌正通过扶持云服务商Fluidstack分发自研TPU芯片,以打破英伟达在AI算力市场的垄断。此举不仅反映了谷歌在提升算力效率和成本控制上的努力,也揭示了AI领域内资本与技术之间的激烈竞争。前OpenAI研究员阿申布伦纳创立的基金有意领投Fluidstack的新一轮融资,进一步加剧了这场围绕AI基础设施建设的博弈。

来源:36氪

09:05

智谱开源“会操作手机的AI”AutoGLM

智谱深夜开源其核心AI Agent模型AutoGLM。该模型被业界视为全球首个具备“Phone Use”(手机操作)能力的AI Agent,能够稳定完成外卖点单、机票预订等长达数十步的复杂操作流程。此次开源意味着硬件厂商、手机厂商和开发者均可基于AutoGLM,在自己的设备或系统中复现一个能“看懂”屏幕、并模拟真人进行点击、输入、滑动的AI助手。目前,AutoGLM已支持微信、淘宝、抖音、美团等超过50个高频中文应用的核心场景,其自动化操作能力与此前引发热议的“豆包手机”演示相似。(广角观察)

来源:钛媒体

09:05

谷歌新架构逆天,为了让AI拥有长期记忆,豆包们都想了哪些招数?

谷歌新架构逆天,为了让AI拥有长期记忆,豆包们都想了哪些招数?

Google提出HOPE框架,旨在解决大模型长期记忆问题,通过区分短期与长期记忆系统,实现更稳定、个性化的信息存储和调用。这一进展标志着大模型正从依赖超长上下文窗口向构建可持续更新的记忆体系转变,对于提升智能助手的连续性和可靠性至关重要。同时,行业内的探索如字节MemAgent和MiniMax等也在推动长期记忆机制内化为模型核心能力,强调记忆应参与决策而非仅作为外部存储。

来源:36氪

12月 8日
7 条新闻
21:45

北京市科委立项课题”AI辅助3D游戏内容生产平台研发与应用”正式启动

由元境与北航新媒体艺术与设计学院联合主办的”智绘万象·聚力共生”3D数字内容创新发展高峰论坛上,北京市科委立项课题”AI辅助3D游戏内容生产平台研发与应用”日前正式启动,元境同步与浙江省北大信息技术高等研究院、重庆千方实业发展有限公司达成战略合作,构建空间计算技术生态,加速3D AIGC在游戏、动漫等领域的应用落地。(广角观察)

来源:钛媒体

21:38

看完最新国产AI写的公众号文章,我慌了!

看完最新国产AI写的公众号文章,我慌了!

智谱最新升级的GLM-4.6V模型展示了强大的多模态处理能力,能够高效生成图文并茂的公众号文章、解读论文与财报、复刻网页设计等。该模型在多个主流评测中取得SOTA成绩,尤其在视觉推理方面表现出色,支持从图片到视频等多种格式的内容理解与生成。其创新性地将工具调用能力融入视觉模型,为实际应用场景中的多模态Agent提供了强有力的技术支持。

来源:量子位

20:42

理想也做AI眼镜了,小鹏、蔚来、小米还不速速跟进?

理想也做AI眼镜了,小鹏、蔚来、小米还不速速跟进?

新闻探讨了AI眼镜从技术到应用的潜力及挑战,强调其在多模态数据处理、实时流式语音交互上的突破。理想Livis眼镜通过结合大模型和流式智能语音框架,实现了更快捷自然的用户体验,特别是在车控场景中展现出显著优势。随着AI技术进步,AI眼镜有望成为下一代主流消费电子,推动新一轮‘范式转移’。

来源:36氪

19:40

GMI Cloud:出海是AI企业释放产能、获取新生的最佳途径|WISE 2025

GMI Cloud:出海是AI企业释放产能、获取新生的最佳途径|WISE 2025

GMI Cloud VP钱宇靖在WISE2025大会上分享了AI应用出海效能升级的关键,包括算力全球化、需求与价值的全球化转型。他指出,AI市场正经历指数级增长,特别是在北美地区,用户已广泛接受AI工具。面对出海挑战如服务及时性、扩展性和稳定性,GMI Cloud通过建设大规模AI工厂、优化集群引擎和推理引擎来提供解决方案,支持全球范围内的自动扩缩容与高可用设计,助力企业更高效地部署海外AI应用。

来源:36氪

19:39

Apple Silicon 五周年,无心插柳长出了一片 AI 市场

Apple Silicon 五周年,无心插柳长出了一片 AI 市场

苹果通过macOS 26.2 Beta更新,增强了Mac设备的AI处理能力,特别是针对本地运行超大规模AI模型的能力进行了优化。新版本支持M5处理器上的神经网络加速器,并引入了基于雷雳5协议的新传输方案,显著提升了Mac集群的数据交换效率与负载分配灵活性,使得四台Mac Studio能够本地运行接近GPT-4规模的大语言模型。这一改进不仅促进了个人开发者对AI技术的应用探索,也为寻求高敏感数据本地化处理的企业提供了更经济高效的解决方案。

来源:36氪

18:37

谷歌重启,阿里入局:AI眼镜会沦为神话还是笑话

AI眼镜赛道竞争激烈,巨头如阿里、谷歌等纷纷入局,核心在于构建垂直场景闭环与物理世界数据掌控。2025年全球市场规模预计达42亿美元。硬件参数不再是胜负关键,生态整合与用户体验成为焦点。技术上,终端侧大模型轻量化推动自然语音交互;商业上,目标是全天候无感化交互,形成独特服务闭环。未来,谁能有效整合硬件体验、生态协同与数据价值,谁就能在AI眼镜市场中胜出。

来源:36氪

18:37

AI会消灭搜索吗?

AI会消灭搜索吗?

本文探讨了AI搜索如何从信息分发进化为服务撮合,分析了AI搜索引擎在对话式交互、多模态理解和任务执行方面的技术突破。以Perplexity和谷歌Gemini 3为例,展示了基于大语言模型的AI搜索通过自然语言处理和上下文记忆能力提升用户体验。同时,讨论了AI搜索在电商、社交等领域的应用前景及商业模式探索,预测其将推动万亿级信息服务市场的变革。

来源:36氪