AI新闻

已选标签:
模型突破
生成模型
11月 25日
14 条新闻
12:20

突发,Claude Opus 4.5编程世界第一,把谷歌OpenAI踢下王座

突发,Claude Opus 4.5编程世界第一,把谷歌OpenAI踢下王座

Anthropic发布Claude Opus 4.5,该模型在编程、智能体和计算机使用方面表现出色,刷新多项基准测试记录。Opus 4.5不仅在编码性能上超越Gemini 3 Pro和GPT-5.1,还在处理模糊信息、多系统漏洞修复等方面展现出卓越能力。通过与Claude Code联动使用,平均生产效率提升220%。此外,其在安全性、对齐度及抗提示词注入攻击方面也取得显著进步。Anthropic为开发者提供了新工具,并大幅降低了API调用成本。

来源:36氪

12:19

千问、灵光、夸克,阿里AI疯狂“补课”

阿里近期推出千问APP和灵光APP两款C端AI产品,依托Qwen3-Max等大模型技术,在推理、编程及中文语境理解上展现优势。然而,在多模态与生态整合方面仍存短板,尤其是Agent能力需进一步提升。尽管入局较晚,但凭借算力、数据、人才及开源策略的优势,千问仍有反超竞品的潜力。未来能否成为超级入口,关键在于突破核心技术瓶颈,实现更深层次的生态联动。

来源:36氪

12:19

Claude Opus 4.5来了,单次生成打造《我的世界》,还破解高难度Agent测评

Claude Opus 4.5来了,单次生成打造《我的世界》,还破解高难度Agent测评

Anthropic发布Claude Opus 4.5,全球最强编程模型之一,在SWE-bench Verified测试中得分超80%,面试表现超越人类。该模型在前端开发、复杂项目处理(如《我的世界》克隆版)及多语言编程上表现出色,同时提升了安全性与上下文管理能力。新增思考强度控制和上下文压缩功能,显著降低了使用成本,每百万tokens定价降至5美元(输入)/25美元(输出)。Claude Opus 4.5代表了AI从代码补全向端到端开发伙伴演进的重要里程碑。

来源:36氪

11:30

Nano Banana新玩法无限套娃!“GPT-5都不会处理这种级别的递归”

Nano Banana新玩法无限套娃!“GPT-5都不会处理这种级别的递归”

Nano Banana Pro展示了强大的多模态处理能力,通过复杂的递归图像生成任务,如1998年的艺术家绘制递归场景,赢得了包括Google DeepMind提示工程师Riley Goodside在内的专业人士赞赏。其创新的图像理解和生成技术推动了AI在艺术创作领域的应用边界。同时,Gemini 3发布后市场份额显著提升,显示了用户对更智能、多功能AI模型的偏好趋势。

来源:量子位

11:17

获贝塔斯曼首笔日区投资,HelloBoss发布首个招聘全流程AI Agent

总部位于东京的初创企业 NGA 宣布,旗下人工智能招聘平台 HelloBoss 正式推出首款覆盖求职与招聘全流程的AI智能体(AI Agent)产品。据悉,该产品在个人端可提供AI简历识别与生成、人岗AI匹配及自然语言沟通等功能。企业端则支持AI招聘信息撰写、AI自动匹配与沟通初筛、基于简历的AI招聘对话辅助等服务。其创始人兼 CEO Alex Wang(王沁)是长期扎根东京、具有华人背景的创业者,自 2023 年初HelloBoss 在日本上线以来,在短短两年内实现营收的十倍增长。 同时,HelloBoss宣布完成A轮融资,由贝塔斯曼旗下BAI Capital独家领投。值得一提的是,这是贝塔斯曼成立近200年来首次投资日本市场,也是BAI Capital在日本的首笔投资。所融资金将主要用于技术研发、海外市场拓展以及团队扩充等方面。(广角观察)

来源:钛媒体

10:15

大幅降价、无限聊天、编码能力超越人类专家,Claude Opus 4.5重夺最强模型王冠

大幅降价、无限聊天、编码能力超越人类专家,Claude Opus 4.5重夺最强模型王冠

Anthropic发布Claude Opus 4.5,宣称在软件工程任务上达到最先进性能,超越GPT-5.1、Gemini 3 Pro等对手。新模型在SWE-bench Verified测试中准确率达80.9%,并在实际应用中展现更强判断力和直觉。同时,Anthropic大幅下调定价,使尖端AI技术更易获取。Opus 4.5还实现了效率提升,处理相同任务时所需token减少76%。此外,通过深度集成Office,突破了上下文长度限制,进一步推动AI编程助手的应用和发展。

来源:36氪

09:30

Claude Opus 4.5发布!2小时工程测试超人类,前代Sonnet搞不定的活它轻松拿捏

Claude Opus 4.5发布!2小时工程测试超人类,前代Sonnet搞不定的活它轻松拿捏

Claude Opus 4.5发布,该模型在编码、视觉处理及日常任务执行方面显著提升,尤其在前端开发与电子表格处理上表现突出。其核心优势在于理解和解决复杂问题的能力,测试中得分超过所有人类。Opus 4.5还支持更高效的多智能体系统构建,并通过API和三大云平台开放使用,定价每百万tokens 5美元(输入)/25美元(输出)。此次更新还包括Claude Code及App的升级,增强了用户体验与功能多样性。

来源:量子位

09:14

Gemini 3 之后,谷歌首席科学家 Jeff Dean 说清 AI 的 3 个关键信号

Jeff Dean 在斯坦福演讲中回顾了 15 年 AI 演进,重点介绍了 Gemini 3 的独特能力。Gemini 3 采用 Pathways 架构,通过 MoE 技术实现高效推理,仅激活所需模块。此外,Gemini 3 展现了从回答到行动的转变,通过强化学习和工具调用完成复杂任务。Jeff Dean 强调,AI 的普及需兼顾效率与成本,TPU 和蒸馏技术使得模型在现实约束下落地成为可能。

来源:36氪

09:13

漫剧启示录:互联网最差的生意,可能是AI最好的生意

漫剧启示录:互联网最差的生意,可能是AI最好的生意

AI技术在内容产业中展现出巨大潜力,特别是在漫剧制作领域。通过深度学习等技术,AI已将漫剧制作成本降至每分钟1000-2500元,周期缩短至10-13天,显著提高了生产效率和降低了成本。此外,AIGC(AI Generated Content)正逐步改变内容创作方式,从辅助工具向主导者转变,不仅在图像、视频生成上取得突破,还促进了跨模态内容的融合与创新,预计未来市场空间可达千亿级别。

来源:36氪

08:10

被Meta裁掉的硅谷AI大佬田渊栋:AI时代,所有人终将失业?

Meta裁员事件引发AI行业关注,AI科学家田渊栋离职后受到多家科技巨头青睐。他指出,随着自动化程度提高,未来将有更多工作被AI取代,但人类独有的洞察力与知识仍不可替代。田渊栋强调,在AI时代,人们需寻找个人‘独一无二’的价值所在,尤其是在创造性劳动方面。此外,他还提到当前大模型的学习效率仍不及人类,但在重复性任务上表现出色。

来源:36氪

03:08

Anthropic发布Opus 4.5,新增Chrome和Excel集成功能

Anthropic发布Opus 4.5,新增Chrome和Excel集成功能

Anthropic发布Opus 4.5,其最新旗舰模型在编码基准、工具使用及问题解决方面表现卓越,特别是在SWE-Bench上得分超过80%。新版本增强了长期上下文处理能力,支持“无尽聊天”功能,并优化了内存管理。此外,Claude for Chrome和Excel产品将更广泛地推出,旨在提升AI在编程辅助与办公自动化中的应用效率。

来源:TechCrunch AI

02:29

顶流设计Agent能用Nano Banana Pro了!一句话BlackPink变东北翠花

顶流设计Agent能用Nano Banana Pro了!一句话BlackPink变东北翠花

Lovart设计Agent接入Nano Banana Pro,实现多模态处理能力的显著提升。通过自然语言指令即可完成复杂设计任务,如图像合成、视频生成等,展现出强大的跨模态推理与编辑功能。其独特的Touch Edit特性支持直观的细节调整,极大提高了设计效率和用户体验。该组合在专业设计领域实现了突破性应用,展示了AI技术在创意产业中的巨大潜力。

来源:量子位

11月 24日
6 条新闻
23:15

前MrBeast内容策略师正在开发一款面向创作者灵感激发与数据分析的人工智能工具

前MrBeast内容策略师正在开发一款面向创作者灵感激发与数据分析的人工智能工具

Palo 是一款面向内容创作者的 AI 平台,结合了大语言模型和数据分析技术,旨在通过分析短视频表现提供创作建议。该平台利用混合模型提取视频数据树,涵盖观众情感、兴趣话题等关键指标,并通过语义检索构建创作者画像。此外,Palo 还提供了基于对话的AI策划工具,支持剧本生成与故事板设计,帮助创作者优化内容策略。

来源:TechCrunch AI

22:18

美国银行紧急评估数据泄露风险:黑客攻破金融科技公司

美国银行紧急评估数据泄露风险:黑客攻破金融科技公司

美国多家银行和抵押贷款机构正评估客户数据在一次针对纽约金融科技公司SitusAMC的网络攻击中的损失情况。SitusAMC确认于11月12日发生数据泄露,黑客窃取了与银行客户的业务相关的企业数据及会计记录等。尽管未使用加密恶意软件,但此次事件凸显了金融行业面临的数据安全挑战,特别是在处理大量非公开银行信息时。这促使业界更加重视利用AI技术加强网络安全防护措施,如通过异常检测算法来提高对潜在威胁的识别能力,以及采用联邦学习以增强跨机构间的信息共享安全性。

来源:TechCrunch AI

22:00

Momentic筹集1500万美元以实现软件测试自动化

Momentic筹集1500万美元以实现软件测试自动化

Momentic 通过 AI 自动化软件测试与验证,获得 1500 万美元 A 轮融资。其工具简化了测试流程,用户仅需用自然语言描述关键用户流程即可实现自动化测试。目前已有 2600 名用户,包括 Notion 和 Xero 等企业。尽管面临来自 OpenAI 和 Anthropic 的竞争,Momentic 仍计划利用新资金扩展产品功能,如支持移动环境和更复杂的测试案例管理。

来源:TechCrunch AI

20:52

中关村两院发布全球首个科研全流程智能体系统OmniScientist

2025国际人工智能科学家大会(ICAIS 2025上),北京中关村学院与中关村人工智能研究院正式推出全球首个覆盖科研人才全流程培养的智能体系统OmniScientist。该系统以“元科学洞察”与“学者数字孪生”双引擎驱动,可解析科学逻辑、预判前沿趋势,并依据个体科研风格提供定制化支持,破解选题迷茫、学科壁垒与产学研脱节等痛点,构建贯穿科研全周期的智能支撑体系。

同期,“北纬诺贝论坛”宣布启动,旨在持续汇聚顶尖智慧,邀请诺贝尔奖得主与青年学者、企业家、科学家深度对接、长效合作,实现思想碰撞、创新赋能与精英孵化。(广角观察)

来源:钛媒体

20:34

xLLM社区重磅首秀,揭秘大模型推理全景图与开源AI Infra生态

xLLM社区重磅首秀,揭秘大模型推理全景图与开源AI Infra生态

xLLM社区将于12月6日在北京举办主题为“共建开源AI Infra生态”的Meetup,揭秘其作为连接算力与大模型应用的‘中枢神经’角色。xLLM定位为支持多元化生成式AI场景的强大推理引擎框架,覆盖大语言模型、多模态理解与生成等领域。该框架通过创新架构提供统一高效可扩展的推理支持,并已在京东大促等业务中实现显著效率提升。此外,xLLM集成Mooncake存储解决方案,优化计算单元与算子以提升推理速度,同时强调开放性与硬件适配性,推动AI技术生态协同创新。

来源:量子位