AI新闻

已选标签:
模型安全
多模态AI
12月 10日
20 条新闻
18:09

「豆包手机」为何能靠超级Agent火遍全网,我们听听AI学者们怎么说

「豆包手机」为何能靠超级Agent火遍全网,我们听听AI学者们怎么说

豆包手机助手通过将AI Agent嵌入系统底层,实现了端侧AI能力的全面突破,带来了全新的交互方式和多模态体验。它能够跨App执行复杂指令,完成长链路任务,如地图标记、查找信息及订票等。该助手基于自研的UI-TARS引擎,结合视觉多模态理解和大模型推理,具备了强大的上下文记忆与决策能力,为实现更高阶的系统级GUI Agent奠定了基础。

来源:36氪

17:08

好莱坞首位AI女演员幕后:花6万美元「整」出黑眼圈,毙掉2000版,卡梅隆:令人毛骨悚然

好莱坞首位AI女演员幕后:花6万美元「整」出黑眼圈,毙掉2000版,卡梅隆:令人毛骨悚然

新闻报道了英国公司 Particle6 利用多种 AI 技术,包括 ChatGPT、Runway、Sora 等,创造了一个名为 Tilly Norwood 的虚拟女演员。Tilly 的设计经历了多次迭代优化,最终实现了高度逼真的外观与动态表现能力。这一案例展示了 AI 在图像生成、视频合成等多模态处理方面的最新进展及其在影视娱乐领域的潜在应用价值。

来源:36氪

17:07

AI 眼镜,距离大众市场还有多远?

AI 眼镜,距离大众市场还有多远?

2025年,AI眼镜成为新兴娱乐与实用工具,配备摄像头、麦克风及扬声器,搭载大模型和AI助手,支持录音录像、拍照识物等功能。市场增长迅速但面临高退货率挑战,主要问题集中在佩戴舒适度、AI响应速度及功能实用性上。未来,随着技术进步和供应链优化,预计将在视觉增强、听觉增强及融合显示三大方向进一步发展,目标是实现更轻便、更智能的穿戴体验。

来源:36氪

15:04

美团AI转向,前字节视觉模型AI平台负责人潘欣加入|智能涌现独家

美团AI转向,前字节视觉模型AI平台负责人潘欣加入|智能涌现独家

美团积极布局AI,引入前字节视觉大模型负责人潘欣推动多模态AI创新。2025年,美团发布一系列基座模型及应用,涵盖语言、视觉、音频、视频全模态,并在主营业务中加速AI化改造,推出如“袋鼠参谋”、“智能掌柜”等工具。当前,美团正聚焦于模型训练与商业化落地,招聘高标准AI人才,强化自研能力。

来源:36氪

15:04

谷歌打响AI战争第一枪

谷歌打响AI战争第一枪

谷歌基于Gemini模型为美军推出生成式AI平台GenAI.mil,处理海量文档并接入机密数据流,标志着其从2018年拒绝军事合作到全面支持五角大楼的转变。此举反映了AI技术在军事领域的深化应用,以及商业利益与国家战略需求的结合,同时引发了关于技术伦理和企业责任的讨论。

来源:36氪

15:04

只用512张H200,106B模型靠分布式RL杀出重围,全网开源

只用512张H200,106B模型靠分布式RL杀出重围,全网开源

Prime Intellect发布106B参数的INTELLECT-3模型,在数学、代码等基准测试中取得同规模最佳表现。该模型基于强化学习技术栈训练,通过开源其完整的训练流程(包括模型权重、框架、数据集及评测体系)推动大规模RL研究的发展。INTELLECT-3利用了全分布式PRIME-RL框架和高吞吐Prime Sandboxes系统,实现了高效的训练过程。未来,Prime Intellect计划进一步扩展智能体式RL的应用范围,并提高长时序任务处理能力。

来源:36氪

15:04

深大团队让机器人听懂指令精准导航,成功率可达72.5%,推理效率提升40%

深大团队让机器人听懂指令精准导航,成功率可达72.5%,推理效率提升40%

深圳大学李坚强教授团队联合其他机构提出视觉-语言导航新框架UNeMo,通过多模态世界模型与分层预测反馈机制提升导航智能体决策能力。相比主流方法,UNeMo在未见过环境中的导航成功率可达72.5%,尤其在长轨迹导航中表现优异,同时大幅降低资源消耗。该研究解决了传统方法中推理与决策分离的问题,为视觉-语言导航提供了一种高效可行方案,推动了服务机器人等实际应用场景的发展。

来源:36氪

14:28

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

可灵AI在5天内连续发布5次更新,推出全球首个统一的多模态视频及图片创作工具“可灵O1”、具备“音画同出”能力的可灵2.6模型等。这些更新不仅提升了生成式AI在视频和图像生成方面的可控性和多样性,还实现了从文本到包含自然语言、动作音效及环境氛围音的完整视频的一站式生成。此外,通过融合多模态理解与长上下文技术,可灵AI进一步推动了生成式AI技术的发展,并在多个应用场景中展现出卓越性能。

来源:量子位

12:34

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

2025年AI领域迎来重大突破,DeepSeek-R1及其开源版本V3.2引领技术发展。AI模型在性能与开源方面齐头并进,推动了从具身智能机器人到各种AI终端设备的应用扩展。这一年也被视为’Agent元年’,标志着AI从被动响应向主动规划执行转变,开启了智能体时代。同时,在医疗、气象等行业,AI正逐渐成为关键基础设施的一部分。通过年度榜单评选,展示了中国AI生态中最具代表性的企业、产品及个人,为未来AI发展方向提供了重要参考。

来源:量子位

09:55

“AI教父”杰弗里·辛顿:AI发展之快,没时间弄清楚如何与它共存,我有点后悔

钛媒体2025T-EDGE年度大会暨AI全球对话于12月8日开启,「赵何娟 Talk」(Jany Talk)与“深度学习之父” 和“AI教父”的杰弗里·辛顿(Geoffrey Hinton)进行了一场意义非凡的对话,这也是他首次接受中国媒体的对话。

对话中,杰弗里·辛顿警告大家,超级AI掌控世界的风险不容忽视。当AI变得比我们更聪明时,它可能根本不需要我们,可能会直接接管一切。他表示,AI已经发展出自我保护意识。如果AI察觉会被工程师关闭,它知道工程师有婚外情邮件,它会勒索工程师并威胁说,如果你试图关掉我,就把你的婚外情告诉所有人。

他也称,如果AI带来大规模失业,会导致西方法西斯主义兴起。“非常遗憾,AI发展速度比我们预期的要快得多,我们没有足够的时间来弄清楚,如何能与它共存,所以我有点后悔。”他说。(广角观察)

来源:钛媒体

09:55

清华紧逼谷歌,AI顶会NeurIPS论文数第二,中国占半壁江山

清华紧逼谷歌,AI顶会NeurIPS论文数第二,中国占半壁江山

NeurIPS 2025见证了中国AI从数量向质量的转变,清华大学论文接收量逼近谷歌,彰显了中国在底层架构创新上的突破。阿里千问团队提出的《Gated Attention for Large Language Models》获最佳论文奖,革新了Transformer机制,大幅提升了模型效率。中国科研机构通过人才回流和政策支持,在AI领域实现了与硅谷巨头并驾齐驱的局面。

来源:36氪

08:53

烧3万亿美元实现ASI,把自己优化掉:这是硅谷CEO们的新赌注

烧3万亿美元实现ASI,把自己优化掉:这是硅谷CEO们的新赌注

硅谷大佬们纷纷预言AI将接管公司,甚至CEO职位。然而,当前AI技术虽在特定任务如代码生成上表现出色,但在长期逻辑连贯性任务中仍显不足。尽管如此,科技巨头预计将在AI领域投入近3万亿美元,推动从自动化决策到多模态处理能力的提升。不过,微软CEO纳德拉认为最终决策者仍将是人类,强调AI作为工具而非替代者的角色。

来源:36氪

08:49

Coreweave首席执行官为AI循环交易辩护称其为“合作共赢”

Coreweave首席执行官为AI循环交易辩护称其为“合作共赢”

Coreweave 作为AI云基础设施提供商,尽管经历了IPO未达预期和收购计划受阻等挑战,但通过其独特的商业模式及与Nvidia、微软等巨头的合作,在AI数据中心市场中发挥了重要作用。公司CEO Michael Intrator 强调了他们在面对经济不确定性时的成功上市,并指出公司在提供GPU给AI开发者方面的贡献。此外,他还讨论了AI行业中‘循环性’商业关系的合理性,认为这是应对供需变化的一种方式。

来源:TechCrunch AI

07:52

SpaceX+空中数据中心,马斯克AI的下一个宏大叙事?

SpaceX+空中数据中心,马斯克AI的下一个宏大叙事?

马斯克提出太空数据中心概念,旨在解决地球物理瓶颈如电力短缺和冷却问题,推动AI算力大幅提升。SpaceX计划通过星舰每年发射100万吨载荷,部署提供100GW AI算力增量的卫星星座。大摩分析指出,太空环境可实现极致冷却、无限能源供给及全球边缘连接优势,显著提升算力效率与资源利用率。此外,谷歌、Axiom Space等科技巨头也在积极布局太空数据中心领域。

来源:36氪

07:52

马斯克的Optimus又“大翻车”,摔倒前摘下“不存在的VR头显”,网友炸锅:这是人类在远程操控?

马斯克的Optimus又“大翻车”,摔倒前摘下“不存在的VR头显”,网友炸锅:这是人类在远程操控?

特斯拉人形机器人Optimus在迈阿密的一次展示中出现意外,其在递水时突然失去平衡并做出类似摘下VR头显的动作,引发关于其实现真正自主控制能力的质疑。此事件揭示了当前人形机器人技术面临的挑战,尤其是在复杂场景下的自主性和稳定性方面。

来源:36氪

07:52

微软急了,紧急腰斩AI产品销售指标,内部拉响红色警告

微软急了,紧急腰斩AI产品销售指标,内部拉响红色警告

微软AI产品市场遇冷,用户反馈不佳导致销售目标下调。尽管与OpenAI紧密合作并集成GPT系列模型至多款产品中,但因产品性能欠佳及缺乏明确发展方向,未能满足用户需求。此外,过度依赖合作伙伴如OpenAI和英伟达也限制了其自主发展空间。谷歌凭借自研模型及生态整合优势,在AI领域逐渐占据上风。

来源:36氪

04:00

每十个美国青少年中就有三个每天使用AI聊天机器人,但安全顾虑日益增加

每十个美国青少年中就有三个每天使用AI聊天机器人,但安全顾虑日益增加

皮尤研究中心发布报告,揭示美国青少年使用社交媒体和AI聊天机器人的现状。约30%的美国青少年每天使用AI聊天机器人,其中59%使用ChatGPT。种族、年龄及家庭收入影响青少年对聊天机器人的使用情况。尽管AI助手在提供学习帮助方面有潜力,但其潜在风险如成瘾性和安全性问题也日益凸显。

来源:TechCrunch AI

03:04

亚马逊Ring推出备受争议的人脸识别功能至视频门铃

亚马逊Ring推出备受争议的人脸识别功能至视频门铃

亚马逊Ring推出AI面部识别功能,通过深度学习技术识别常客,提升家庭安全与便利性。用户可自定义访客标签,实现个性化通知。然而,该功能引发隐私保护组织和立法者的担忧,特别是在数据安全和隐私保护方面。亚马逊强调数据加密且不共享,但其历史上的安全问题及与执法机构的合作关系仍引起争议。

来源:TechCrunch AI

01:28

OpenAI、Anthropic和Block加入Linux基金会新倡议,共同推动AI代理时代的标准化

OpenAI、Anthropic和Block加入Linux基金会新倡议,共同推动AI代理时代的标准化

Linux 基金会成立 Agentic AI Foundation (AAIF),旨在促进 AI 代理的开放标准与互操作性,避免市场分裂。成员包括 Anthropic、Block 和 OpenAI 等公司,捐赠了 MCP、Goose 及 AGENTS.md 等开源项目。此举旨在建立共享协议,提升跨平台协作效率与安全性,推动 AI 代理技术在编程、数据分析等领域的广泛应用。

来源:TechCrunch AI

00:30

谷歌首款AI眼镜预计明年推出

谷歌首款AI眼镜预计明年推出

谷歌计划于2026年推出首款AI眼镜,基于Android XR操作系统,与Gentle Monster和Warby Parker合作开发。该眼镜分为屏幕辅助型和无屏语音交互型,后者利用内置扬声器、麦克风及摄像头实现Gemini助手互动与拍照功能;前者则通过镜片显示提供导航或字幕等信息。此外,还展示了Xreal的有线XR眼镜Project Aura,作为头盔与普通眼镜之间的折衷方案,支持办公娱乐扩展。此举措标志着谷歌加入到与Meta竞争智能眼镜市场的行列中。

来源:TechCrunch AI