AI新闻

已选标签:
多模态AI
AI试穿
12月 10日
3 条新闻
01:28

OpenAI、Anthropic和Block加入Linux基金会新倡议,共同推动AI代理时代的标准化

OpenAI、Anthropic和Block加入Linux基金会新倡议,共同推动AI代理时代的标准化

Linux 基金会成立 Agentic AI Foundation (AAIF),旨在促进 AI 代理的开放标准与互操作性,避免市场分裂。成员包括 Anthropic、Block 和 OpenAI 等公司,捐赠了 MCP、Goose 及 AGENTS.md 等开源项目。此举旨在建立共享协议,提升跨平台协作效率与安全性,推动 AI 代理技术在编程、数据分析等领域的广泛应用。

来源:TechCrunch AI

00:30

谷歌首款AI眼镜预计明年推出

谷歌首款AI眼镜预计明年推出

谷歌计划于2026年推出首款AI眼镜,基于Android XR操作系统,与Gentle Monster和Warby Parker合作开发。该眼镜分为屏幕辅助型和无屏语音交互型,后者利用内置扬声器、麦克风及摄像头实现Gemini助手互动与拍照功能;前者则通过镜片显示提供导航或字幕等信息。此外,还展示了Xreal的有线XR眼镜Project Aura,作为头盔与普通眼镜之间的折衷方案,支持办公娱乐扩展。此举措标志着谷歌加入到与Meta竞争智能眼镜市场的行列中。

来源:TechCrunch AI

00:29

欧盟对谷歌的人工智能搜索工具展开反垄断调查

欧盟对谷歌的人工智能搜索工具展开反垄断调查

欧盟委员会对谷歌展开反垄断调查,质疑其AI搜索工具是否违反了竞争法。调查聚焦于谷歌是否未经补偿使用网站内容生成AI摘要,并限制其他AI公司使用YouTube内容训练模型。此举旨在确保AI市场竞争公平,保护内容创作者权益。同时,欧盟正考虑简化AI监管规则,以应对高风险应用的挑战。

来源:TechCrunch AI

12月 9日
15 条新闻
22:39

Meta可能在明年初推出新AI大模型Avocado

相关报道援引知情人士透露,Meta可能在2026年第一季度发布新的大型语言模型“Avocado”,以进一步与谷歌、OpenAI等公司竞争。今年6月曾有市场消息称,包括扎克伯格在内的Meta高管已讨论过对其Llama系列语言模型“削减投资”,转而采用竞争对手开发的模型,包括OpenAI和Anthropic的产品。(广角观察)

来源:钛媒体

22:39

腾讯混元大模型品牌正式更名为Tencent HY

腾讯宣布自研大模型品牌“混元(Tencent Hunyuan)”正式更名为“Tencent HY”,版本号同步升级至2.0。此次调整聚焦传播效率优化与全球化适配,HY作为技术品牌核心标识,未来将通过“HY-1”“HY-Pro”等结构化命名清晰传递代际演进路径,同时弱化中文文化属性以适配国际市场。旗下腾讯元宝作为独立AI助手品牌,未进行任何更名,用户可继续通过“元宝”使用腾讯AI服务。(广角观察)

来源:钛媒体

20:32

国产多模态AI再开源,实测截图转网页、搜图购物,价格减半

国产多模态AI再开源,实测截图转网页、搜图购物,价格减半

智谱开源了GLM-4.6V系列多模态大模型,包括基础版和轻量版,支持智能图文混排、识图购物、前端复刻及长上下文理解等任务。该模型在多模态交互、逻辑推理和长上下文能力上取得SOTA表现,并且价格相比前代降低50%,轻量版全面免费。AutoGLM作为首个具备手机操作能力的AI Agent也被一同开源。

来源:36氪

18:29

人工智能生成广告:机遇、挑战与对策

新闻探讨了生成式人工智能技术,如大语言模型和多模态模型,在广告行业中的应用与变革。从程序化推荐到基于用户意图理解的智能广告系统,AI正在重塑数字广告的生产、投放及效果评估流程。以谷歌Gemini和腾讯混元大模型为例,展示了AI如何推动广告从被动呈现转向主动交互,并实现“一人千面”的个性化体验。然而,技术成熟度不足、数据合规性以及算法偏见等问题也对广告业提出了新的挑战。

来源:36氪

18:28

一文读懂Android XR发布会:谷歌“亲儿子”明年开卖

一文读懂Android XR发布会:谷歌“亲儿子”明年开卖

谷歌发布Android XR平台,整合多模态AI能力,支持智能眼镜与头显设备。通过Gemini AI实现情境感知式交互,如视觉搜索、实时翻译等功能。同时,推出有线XR眼镜Project Aura,平衡算力与佩戴舒适度。此外,更新了Android XR SDK,提供Jetpack Glimmer和Projected库,简化开发流程,并遵循OpenXR标准,促进生态发展。

来源:36氪

18:18

共推空天领域智能化升级!趋境科技与金航数码强强联手

共推空天领域智能化升级!趋境科技与金航数码强强联手

趋境科技与金航数码达成战略合作,共同推动空天领域智能化升级。基于趋境科技的高性能大模型私有化部署算力底座及金航数码的应用能力,双方已在航空等复杂装备工业领域成功落地多个大模型解决方案,实现降低推理门槛10倍的效果。此次合作深化了在智能化数据库、数据分析、辅助编程等方面的应用,并计划推广至更广泛的航空航天场景中,加速行业智能化转型。

来源:量子位

17:27

特斯拉机器人又被抓包:疑似遥控「摘头显」摔倒,名场面诞生

特斯拉机器人又被抓包:疑似遥控「摘头显」摔倒,名场面诞生

特斯拉人形机器人Optimus在近期活动中因疑似远程操控引发热议,暴露了当前人形机器人技术在自主智能方面的局限。尽管面临争议,马斯克坚信Optimus将极大推动经济发展,甚至改变社会结构。从技术角度看,实现精准的力反馈、低延迟信号传输等是远程操控人形机器人的关键挑战。长远来看,随着深度学习、多模态处理能力的进步,真正的完全自主智能仍需行业共同努力。

来源:36氪

17:27

2026年全球保险业展望:AI“重编码”游戏规则

2026年全球保险业展望:AI“重编码”游戏规则

全球保险业正经历从规模驱动到技术、资本与服务能力的深度变革。生成式AI、物联网监测及地理空间分析等技术在非寿险领域广泛应用,推动行业从记录风险向预测风险转变,提升精算能力和控制赔付成本。同时,AI在核保、理赔、客服等环节加速落地,但其规模化应用仍面临数据质量与系统基础挑战。未来保险业的核心竞争力将聚焦于技术底座能力、资本结构灵活性、数据模型深度及以客户为中心的服务体系构建。

来源:36氪

15:43

论文自动变漫画PPT!Nano Banana同款用秘塔免费生成,还有一对一语音讲解

论文自动变漫画PPT!Nano Banana同款用秘塔免费生成,还有一对一语音讲解

秘塔AI推出了一款创新的漫画式课件生成工具,能够将学术论文或行业报告自动生成为图文并茂、附带语音讲解的PPT。该工具支持多种风格选择,无需繁琐申请即可免费使用,极大提升了知识获取效率与学习体验。此应用展示了AI在教育辅助领域的潜力,特别是通过多模态处理技术实现信息的可视化和口语化表达,降低了复杂信息的理解门槛。

来源:量子位

15:23

准确率腰斩,大模型视觉能力一出日常生活就「失灵」

准确率腰斩,大模型视觉能力一出日常生活就「失灵」

EgoCross项目团队提出首个跨域第一人称视频问答基准,涵盖手术、工业、极限运动和动物视角四大领域,揭示现有多模态大语言模型在跨域场景下的泛化瓶颈。通过全面评测8款主流MLLM,发现即使最佳模型在跨域场景中表现也显著下降。研究探索了提示学习、监督微调及强化学习等方法,其中RL方法带来最显著性能提升(平均22%),为构建更具泛化能力的AI系统提供了新方向。

来源:36氪

09:05

智谱开源“会操作手机的AI”AutoGLM

智谱深夜开源其核心AI Agent模型AutoGLM。该模型被业界视为全球首个具备“Phone Use”(手机操作)能力的AI Agent,能够稳定完成外卖点单、机票预订等长达数十步的复杂操作流程。此次开源意味着硬件厂商、手机厂商和开发者均可基于AutoGLM,在自己的设备或系统中复现一个能“看懂”屏幕、并模拟真人进行点击、输入、滑动的AI助手。目前,AutoGLM已支持微信、淘宝、抖音、美团等超过50个高频中文应用的核心场景,其自动化操作能力与此前引发热议的“豆包手机”演示相似。(广角观察)

来源:钛媒体

09:05

谷歌新架构逆天,为了让AI拥有长期记忆,豆包们都想了哪些招数?

谷歌新架构逆天,为了让AI拥有长期记忆,豆包们都想了哪些招数?

Google提出HOPE框架,旨在解决大模型长期记忆问题,通过区分短期与长期记忆系统,实现更稳定、个性化的信息存储和调用。这一进展标志着大模型正从依赖超长上下文窗口向构建可持续更新的记忆体系转变,对于提升智能助手的连续性和可靠性至关重要。同时,行业内的探索如字节MemAgent和MiniMax等也在推动长期记忆机制内化为模型核心能力,强调记忆应参与决策而非仅作为外部存储。

来源:36氪

12月 8日
2 条新闻
21:45

北京市科委立项课题”AI辅助3D游戏内容生产平台研发与应用”正式启动

由元境与北航新媒体艺术与设计学院联合主办的”智绘万象·聚力共生”3D数字内容创新发展高峰论坛上,北京市科委立项课题”AI辅助3D游戏内容生产平台研发与应用”日前正式启动,元境同步与浙江省北大信息技术高等研究院、重庆千方实业发展有限公司达成战略合作,构建空间计算技术生态,加速3D AIGC在游戏、动漫等领域的应用落地。(广角观察)

来源:钛媒体

21:38

看完最新国产AI写的公众号文章,我慌了!

看完最新国产AI写的公众号文章,我慌了!

智谱最新升级的GLM-4.6V模型展示了强大的多模态处理能力,能够高效生成图文并茂的公众号文章、解读论文与财报、复刻网页设计等。该模型在多个主流评测中取得SOTA成绩,尤其在视觉推理方面表现出色,支持从图片到视频等多种格式的内容理解与生成。其创新性地将工具调用能力融入视觉模型,为实际应用场景中的多模态Agent提供了强有力的技术支持。

来源:量子位