AI新闻

已选标签:
多模态AI
生成模型
12月 10日
20 条新闻
17:08

好莱坞首位AI女演员幕后:花6万美元「整」出黑眼圈,毙掉2000版,卡梅隆:令人毛骨悚然

好莱坞首位AI女演员幕后:花6万美元「整」出黑眼圈,毙掉2000版,卡梅隆:令人毛骨悚然

新闻报道了英国公司 Particle6 利用多种 AI 技术,包括 ChatGPT、Runway、Sora 等,创造了一个名为 Tilly Norwood 的虚拟女演员。Tilly 的设计经历了多次迭代优化,最终实现了高度逼真的外观与动态表现能力。这一案例展示了 AI 在图像生成、视频合成等多模态处理方面的最新进展及其在影视娱乐领域的潜在应用价值。

来源:36氪

17:07

AI 眼镜,距离大众市场还有多远?

AI 眼镜,距离大众市场还有多远?

2025年,AI眼镜成为新兴娱乐与实用工具,配备摄像头、麦克风及扬声器,搭载大模型和AI助手,支持录音录像、拍照识物等功能。市场增长迅速但面临高退货率挑战,主要问题集中在佩戴舒适度、AI响应速度及功能实用性上。未来,随着技术进步和供应链优化,预计将在视觉增强、听觉增强及融合显示三大方向进一步发展,目标是实现更轻便、更智能的穿戴体验。

来源:36氪

16:06

宇树和智元高价争抢春晚赞助席位?智元机器人回应:不是真的

据报道,一批具身智能公司正在竞逐2026年总台马年春晚的赞助商资格。目前,智元和宇树的竞争最为激烈。为了争夺最大赞助商的权益,智元机器人率先开价6000万元,而宇树科技直接将报价拉升至1亿元。对此,智元机器人方面回应称“不是真的”。宇树方面暂无公开表态。 (界面)

来源:钛媒体

16:01

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔与OpenCSG合作推出面向智能初创企业的一体化IT基础设施解决方案,通过AgenticOps方法论和高性能计算节点Dell Pro Max with GB10及PowerScale智能存储系统,提供从数据采集到模型训练的全栈式服务。该方案旨在解决企业在智能化转型中的数据效率低、算力成本高问题,利用Xnet协议层实现高效的数据与模型流转,支持多行业场景下的智能化应用开发与部署,加速AI技术的企业级落地。

来源:量子位

15:04

美团AI转向,前字节视觉模型AI平台负责人潘欣加入|智能涌现独家

美团AI转向,前字节视觉模型AI平台负责人潘欣加入|智能涌现独家

美团积极布局AI,引入前字节视觉大模型负责人潘欣推动多模态AI创新。2025年,美团发布一系列基座模型及应用,涵盖语言、视觉、音频、视频全模态,并在主营业务中加速AI化改造,推出如“袋鼠参谋”、“智能掌柜”等工具。当前,美团正聚焦于模型训练与商业化落地,招聘高标准AI人才,强化自研能力。

来源:36氪

15:04

OpenAI、Anthropic、谷歌罕见同框:Agentic Al基金会成立,打响智能体开源标准战

Linux 基金会推出智能体 AI 基金会(AAIF),旨在为 AI 智能体相关开源项目提供中立托管平台。全球科技巨头如 Anthropic、OpenAI 和 Block 等作为创始成员,贡献了三大核心开源项目:MCP 协议、goose 项目和 AGENTS.md 规范,以推动 AI 智能体与外部工具的标准化交互及跨系统运行能力统一。AAIF 的目标是避免专有技术栈垄断,通过制定开放标准促进互操作性和行业健康发展。

来源:36氪

15:04

谷歌打响AI战争第一枪

谷歌打响AI战争第一枪

谷歌基于Gemini模型为美军推出生成式AI平台GenAI.mil,处理海量文档并接入机密数据流,标志着其从2018年拒绝军事合作到全面支持五角大楼的转变。此举反映了AI技术在军事领域的深化应用,以及商业利益与国家战略需求的结合,同时引发了关于技术伦理和企业责任的讨论。

来源:36氪

15:04

只用512张H200,106B模型靠分布式RL杀出重围,全网开源

只用512张H200,106B模型靠分布式RL杀出重围,全网开源

Prime Intellect发布106B参数的INTELLECT-3模型,在数学、代码等基准测试中取得同规模最佳表现。该模型基于强化学习技术栈训练,通过开源其完整的训练流程(包括模型权重、框架、数据集及评测体系)推动大规模RL研究的发展。INTELLECT-3利用了全分布式PRIME-RL框架和高吞吐Prime Sandboxes系统,实现了高效的训练过程。未来,Prime Intellect计划进一步扩展智能体式RL的应用范围,并提高长时序任务处理能力。

来源:36氪

15:04

2比特复数模型媲美全精度,北大通用框架让大模型在手机上也能流畅运行

2比特复数模型媲美全精度,北大通用框架让大模型在手机上也能流畅运行

北京大学团队提出Fairy2i框架,通过广义线性表示、相位感知量化及递归残差量化技术,在无需重新训练的情况下实现预训练模型的2比特量化,性能接近FP16。该方法解决了大模型在边缘设备部署时面临的算力和存储挑战,为AI在移动设备上的高效运行提供了新路径。

来源:36氪

15:04

深大团队让机器人听懂指令精准导航,成功率可达72.5%,推理效率提升40%

深大团队让机器人听懂指令精准导航,成功率可达72.5%,推理效率提升40%

深圳大学李坚强教授团队联合其他机构提出视觉-语言导航新框架UNeMo,通过多模态世界模型与分层预测反馈机制提升导航智能体决策能力。相比主流方法,UNeMo在未见过环境中的导航成功率可达72.5%,尤其在长轨迹导航中表现优异,同时大幅降低资源消耗。该研究解决了传统方法中推理与决策分离的问题,为视觉-语言导航提供了一种高效可行方案,推动了服务机器人等实际应用场景的发展。

来源:36氪

14:28

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

可灵AI在5天内连续发布5次更新,推出全球首个统一的多模态视频及图片创作工具“可灵O1”、具备“音画同出”能力的可灵2.6模型等。这些更新不仅提升了生成式AI在视频和图像生成方面的可控性和多样性,还实现了从文本到包含自然语言、动作音效及环境氛围音的完整视频的一站式生成。此外,通过融合多模态理解与长上下文技术,可灵AI进一步推动了生成式AI技术的发展,并在多个应用场景中展现出卓越性能。

来源:量子位

12:34

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

2025年AI领域迎来重大突破,DeepSeek-R1及其开源版本V3.2引领技术发展。AI模型在性能与开源方面齐头并进,推动了从具身智能机器人到各种AI终端设备的应用扩展。这一年也被视为’Agent元年’,标志着AI从被动响应向主动规划执行转变,开启了智能体时代。同时,在医疗、气象等行业,AI正逐渐成为关键基础设施的一部分。通过年度榜单评选,展示了中国AI生态中最具代表性的企业、产品及个人,为未来AI发展方向提供了重要参考。

来源:量子位

11:59

100亿身家“足坛首富”,投了最火AI独角兽

100亿身家“足坛首富”,投了最火AI独角兽

C罗投资美国AI初创公司Perplexity,成为其股东之一。Perplexity主打对话式搜索与直观问答,利用自然语言处理技术直接回答用户问题,并提供信息来源透明引用。该公司估值已达200亿美元,被视为增长最快的AI创新企业之一。C罗此举不仅扩大了Perplexity在全球市场的影响力,也为个人品牌注入科技光环,展示了文体明星对人工智能赛道的持续关注和投资趋势。

来源:36氪

10:57

千问月活突破3000万,开放AI PPT等四项新功能

千问APP向所有用户首批开放AI PPT、AI写作、AI文库、AI讲题四项新功能。其中,千问AI PPT支持文档、图片、语音等39种格式输入,并提供超10万份精品模板免费替换。据悉,阿里巴巴还正在陆续将地图、外卖、订票、办公、学习、购物、健康等各类生活场景接入千问。阿里官方信息显示,自11月17日公测仅23天,千问月活跃用户数(含APP、Web、PC端)已突破3000万,成为全球增长最快的AI应用。(广角观察)

来源:钛媒体

10:57

GPT-5.2 内幕曝光:停掉 Sora,八周内死磕 ChatGPT 求生,AGI 梦想向生存低头

GPT-5.2 内幕曝光:停掉 Sora,八周内死磕 ChatGPT 求生,AGI 梦想向生存低头

OpenAI 面临来自 Google 的激烈竞争,决定暂停非核心项目,集中资源在八周内优化 ChatGPT,以恢复其市场地位。即将发布的 GPT-5.2 被寄予厚望,但快速迭代导致的技术妥协可能带来隐患。此外,OpenAI 正转向硬件开发,试图打造 AI 原生设备,视苹果为长期竞争对手。

来源:36氪

09:55

Refly.AI完成种子轮融资,金沙江、高瓴投资

面向非技术用户的AI自动化工作流平台Refly.AI宣布完成数百万美元种子轮融资,该轮融资由金沙江创投、高瓴创投、ClassIn投资。同时,Refly.AI V1.0版本已正式上线,进入邀请码公测阶段。

用户一句话描述需求,Refly.AI 的 Copilot 就能立即构建完整的工作流,将复杂任务的创建时间从数小时缩短到几分钟。而在此前,Refly.AI已历经半年多的小规模内测,吸引了1000+涵盖自媒体、内容创作、市场营销、金融咨询等行业的早期用户参与体验。(创投家CLUB)

来源:钛媒体

09:55

清华紧逼谷歌,AI顶会NeurIPS论文数第二,中国占半壁江山

清华紧逼谷歌,AI顶会NeurIPS论文数第二,中国占半壁江山

NeurIPS 2025见证了中国AI从数量向质量的转变,清华大学论文接收量逼近谷歌,彰显了中国在底层架构创新上的突破。阿里千问团队提出的《Gated Attention for Large Language Models》获最佳论文奖,革新了Transformer机制,大幅提升了模型效率。中国科研机构通过人才回流和政策支持,在AI领域实现了与硅谷巨头并驾齐驱的局面。

来源:36氪

09:55

年营收 10 亿美元的 Surge AI CEO:比算力更重要的,是 AI 的品味

Surge AI 通过自建训练系统和精细的数据标注方法,专注于提升AI模型的判断力与决策质量,而非单纯追求算力或融资规模。其独特的数据处理方式,包括对标注者行为信号的追踪、机器学习反向分析以及提供评估标准等,使得该公司能够为行业顶尖实验室提供高质量服务,并在未接受外部投资的情况下实现显著商业成功。

来源:36氪

08:53

烧3万亿美元实现ASI,把自己优化掉:这是硅谷CEO们的新赌注

烧3万亿美元实现ASI,把自己优化掉:这是硅谷CEO们的新赌注

硅谷大佬们纷纷预言AI将接管公司,甚至CEO职位。然而,当前AI技术虽在特定任务如代码生成上表现出色,但在长期逻辑连贯性任务中仍显不足。尽管如此,科技巨头预计将在AI领域投入近3万亿美元,推动从自动化决策到多模态处理能力的提升。不过,微软CEO纳德拉认为最终决策者仍将是人类,强调AI作为工具而非替代者的角色。

来源:36氪

08:53

非传统AI公司确认其4.75亿美元种子轮融资

非传统AI公司确认其4.75亿美元种子轮融资

Naveen Rao 创立的 Unconventional AI 获得 4.75 亿美元种子轮融资,估值达 45 亿美元。公司目标是构建高效能AI计算机,追求生物级效率。此轮融资由 Andreessen Horowitz 和 Lightspeed Ventures 领投,标志着对下一代算力效率和技术创新的重大投资。Rao 的过往经历包括成功创立并出售 MosaicML 和 Nervana Systems,显示出其在推动AI技术进步方面的深厚背景。

来源:TechCrunch AI