00:29 欧盟对谷歌的人工智能搜索工具展开反垄断调查 欧盟委员会对谷歌展开反垄断调查,质疑其AI搜索工具是否违反了竞争法。调查聚焦于谷歌是否未经补偿使用网站内容生成AI摘要,并限制其他AI公司使用YouTube内容训练模型。此举旨在确保AI市场竞争公平,保护内容创作者权益。同时,欧盟正考虑简化AI监管规则,以应对高风险应用的挑战。 来源:TechCrunch AI
00:09 印度提议对使用版权内容训练AI的OpenAI和谷歌收费 印度提议对使用版权内容训练AI模型的公司实施强制性版税制度,旨在降低AI公司的合规成本并确保创作者得到补偿。该提案通过设立单一收集机构自动授权AI企业访问所有版权作品,以换取强制支付版税。此举措可能重塑OpenAI和谷歌等公司在全球快速增长市场中的运营方式,并为AI训练提供了一个新的监管框架。 来源:TechCrunch AI
22:39 Meta可能在明年初推出新AI大模型Avocado 相关报道援引知情人士透露,Meta可能在2026年第一季度发布新的大型语言模型“Avocado”,以进一步与谷歌、OpenAI等公司竞争。今年6月曾有市场消息称,包括扎克伯格在内的Meta高管已讨论过对其Llama系列语言模型“削减投资”,转而采用竞争对手开发的模型,包括OpenAI和Anthropic的产品。(广角观察) 来源:钛媒体
22:39 腾讯混元大模型品牌正式更名为Tencent HY 腾讯宣布自研大模型品牌“混元(Tencent Hunyuan)”正式更名为“Tencent HY”,版本号同步升级至2.0。此次调整聚焦传播效率优化与全球化适配,HY作为技术品牌核心标识,未来将通过“HY-1”“HY-Pro”等结构化命名清晰传递代际演进路径,同时弱化中文文化属性以适配国际市场。旗下腾讯元宝作为独立AI助手品牌,未进行任何更名,用户可继续通过“元宝”使用腾讯AI服务。(广角观察) 来源:钛媒体
20:33 金融领域AI代理的应用:自主性带来的合规挑战与风控策略 本文探讨了AI代理在金融服务领域的应用及其带来的法律和监管风险。AI代理利用机器学习技术,如大型语言模型,实现自主决策、目标导向推理及与外部环境互动,适用于反洗钱合规、自然语言交易执行等场景。然而,其高自主性也带来了数据隐私、网络安全、偏见与歧视等复合型风险。金融机构需采取合同制约、技术措施等手段来缓解这些风险,并积极参与监管动态以应对未来法规变化。 来源:36氪
20:32 国产多模态AI再开源,实测截图转网页、搜图购物,价格减半 智谱开源了GLM-4.6V系列多模态大模型,包括基础版和轻量版,支持智能图文混排、识图购物、前端复刻及长上下文理解等任务。该模型在多模态交互、逻辑推理和长上下文能力上取得SOTA表现,并且价格相比前代降低50%,轻量版全面免费。AutoGLM作为首个具备手机操作能力的AI Agent也被一同开源。 来源:36氪
18:29 被忽视的“最后一公里”!跑遍广州八大商场,我发现了AI眼镜的真相 谷歌重返智能眼镜赛道,推出搭载Android XR平台及Gemini AI的消费级AR眼镜Project Aura。尽管AI眼镜在线上热度高,但线下覆盖程度不足,尚未成为主流消费渠道。AI眼镜需结合传统眼镜行业的验光配镜服务与数码行业的技术体验,以满足七亿近视用户的需求。 来源:36氪
18:29 人工智能生成广告:机遇、挑战与对策 新闻探讨了生成式人工智能技术,如大语言模型和多模态模型,在广告行业中的应用与变革。从程序化推荐到基于用户意图理解的智能广告系统,AI正在重塑数字广告的生产、投放及效果评估流程。以谷歌Gemini和腾讯混元大模型为例,展示了AI如何推动广告从被动呈现转向主动交互,并实现“一人千面”的个性化体验。然而,技术成熟度不足、数据合规性以及算法偏见等问题也对广告业提出了新的挑战。 来源:36氪
18:28 一文读懂Android XR发布会:谷歌“亲儿子”明年开卖 谷歌发布Android XR平台,整合多模态AI能力,支持智能眼镜与头显设备。通过Gemini AI实现情境感知式交互,如视觉搜索、实时翻译等功能。同时,推出有线XR眼镜Project Aura,平衡算力与佩戴舒适度。此外,更新了Android XR SDK,提供Jetpack Glimmer和Projected库,简化开发流程,并遵循OpenXR标准,促进生态发展。 来源:36氪
18:18 共推空天领域智能化升级!趋境科技与金航数码强强联手 趋境科技与金航数码达成战略合作,共同推动空天领域智能化升级。基于趋境科技的高性能大模型私有化部署算力底座及金航数码的应用能力,双方已在航空等复杂装备工业领域成功落地多个大模型解决方案,实现降低推理门槛10倍的效果。此次合作深化了在智能化数据库、数据分析、辅助编程等方面的应用,并计划推广至更广泛的航空航天场景中,加速行业智能化转型。 来源:量子位
17:27 特斯拉机器人又被抓包:疑似遥控「摘头显」摔倒,名场面诞生 特斯拉人形机器人Optimus在近期活动中因疑似远程操控引发热议,暴露了当前人形机器人技术在自主智能方面的局限。尽管面临争议,马斯克坚信Optimus将极大推动经济发展,甚至改变社会结构。从技术角度看,实现精准的力反馈、低延迟信号传输等是远程操控人形机器人的关键挑战。长远来看,随着深度学习、多模态处理能力的进步,真正的完全自主智能仍需行业共同努力。 来源:36氪
17:27 2026年全球保险业展望:AI“重编码”游戏规则 全球保险业正经历从规模驱动到技术、资本与服务能力的深度变革。生成式AI、物联网监测及地理空间分析等技术在非寿险领域广泛应用,推动行业从记录风险向预测风险转变,提升精算能力和控制赔付成本。同时,AI在核保、理赔、客服等环节加速落地,但其规模化应用仍面临数据质量与系统基础挑战。未来保险业的核心竞争力将聚焦于技术底座能力、资本结构灵活性、数据模型深度及以客户为中心的服务体系构建。 来源:36氪
15:43 论文自动变漫画PPT!Nano Banana同款用秘塔免费生成,还有一对一语音讲解 秘塔AI推出了一款创新的漫画式课件生成工具,能够将学术论文或行业报告自动生成为图文并茂、附带语音讲解的PPT。该工具支持多种风格选择,无需繁琐申请即可免费使用,极大提升了知识获取效率与学习体验。此应用展示了AI在教育辅助领域的潜力,特别是通过多模态处理技术实现信息的可视化和口语化表达,降低了复杂信息的理解门槛。 来源:量子位
15:23 准确率腰斩,大模型视觉能力一出日常生活就「失灵」 EgoCross项目团队提出首个跨域第一人称视频问答基准,涵盖手术、工业、极限运动和动物视角四大领域,揭示现有多模态大语言模型在跨域场景下的泛化瓶颈。通过全面评测8款主流MLLM,发现即使最佳模型在跨域场景中表现也显著下降。研究探索了提示学习、监督微调及强化学习等方法,其中RL方法带来最显著性能提升(平均22%),为构建更具泛化能力的AI系统提供了新方向。 来源:36氪
09:05 智谱开源“会操作手机的AI”AutoGLM 智谱深夜开源其核心AI Agent模型AutoGLM。该模型被业界视为全球首个具备“Phone Use”(手机操作)能力的AI Agent,能够稳定完成外卖点单、机票预订等长达数十步的复杂操作流程。此次开源意味着硬件厂商、手机厂商和开发者均可基于AutoGLM,在自己的设备或系统中复现一个能“看懂”屏幕、并模拟真人进行点击、输入、滑动的AI助手。目前,AutoGLM已支持微信、淘宝、抖音、美团等超过50个高频中文应用的核心场景,其自动化操作能力与此前引发热议的“豆包手机”演示相似。(广角观察) 来源:钛媒体
09:05 谷歌新架构逆天,为了让AI拥有长期记忆,豆包们都想了哪些招数? Google提出HOPE框架,旨在解决大模型长期记忆问题,通过区分短期与长期记忆系统,实现更稳定、个性化的信息存储和调用。这一进展标志着大模型正从依赖超长上下文窗口向构建可持续更新的记忆体系转变,对于提升智能助手的连续性和可靠性至关重要。同时,行业内的探索如字节MemAgent和MiniMax等也在推动长期记忆机制内化为模型核心能力,强调记忆应参与决策而非仅作为外部存储。 来源:36氪
09:04 豆包手机助手把大厂们架在了火上烤 豆包手机助手的发布,展示了AI助手在执行复杂任务方面的潜力,如下载应用、外卖比价等,但遭遇了互联网大厂基于安全考量的技术限制。这反映了AI时代超级入口竞争加剧,软硬一体成为新趋势。同时,端云协同AI的发展以解决隐私和安全问题变得尤为重要。 来源:36氪
05:29 谷歌的AI试穿应用Doppl新增可购物发现频道 Google在Doppl应用中引入了可购物的发现流,利用AI生成视频展示个性化推荐服装,用户可虚拟试穿。该功能基于深度学习和计算机视觉技术,通过分析用户偏好提供定制化建议。此举旨在提升用户体验并探索新的电商策略,应对来自亚马逊等竞争对手的压力。 来源:TechCrunch AI
21:45 北京市科委立项课题”AI辅助3D游戏内容生产平台研发与应用”正式启动 由元境与北航新媒体艺术与设计学院联合主办的”智绘万象·聚力共生”3D数字内容创新发展高峰论坛上,北京市科委立项课题”AI辅助3D游戏内容生产平台研发与应用”日前正式启动,元境同步与浙江省北大信息技术高等研究院、重庆千方实业发展有限公司达成战略合作,构建空间计算技术生态,加速3D AIGC在游戏、动漫等领域的应用落地。(广角观察) 来源:钛媒体
21:38 看完最新国产AI写的公众号文章,我慌了! 智谱最新升级的GLM-4.6V模型展示了强大的多模态处理能力,能够高效生成图文并茂的公众号文章、解读论文与财报、复刻网页设计等。该模型在多个主流评测中取得SOTA成绩,尤其在视觉推理方面表现出色,支持从图片到视频等多种格式的内容理解与生成。其创新性地将工具调用能力融入视觉模型,为实际应用场景中的多模态Agent提供了强有力的技术支持。 来源:量子位