AI新闻

已选标签:
模型安全
模型突破
11月 25日
15 条新闻
14:42

波士顿动力前CTO加盟DeepMind,Gemini要做机器人界的安卓

波士顿动力前CTO加盟DeepMind,Gemini要做机器人界的安卓

谷歌聘请前波士顿动力CTO Aaron Saunders加盟DeepMind,出任硬件工程副总裁,旨在基于Gemini打造一个类似安卓的通用机器人操作系统。Gemini 3发布后,谷歌计划构建一个几乎能够即插即用、适用于任何身体配置的AI系统,涵盖人形与非人形机器人。此举标志着谷歌在机器人领域的战略布局从初步探索转向全面冲刺,通过软硬件协同创新推动多模态融合及具身推理技术的发展。

来源:量子位

14:24

时薪150美元,华尔街精英亲自教AI干掉“自己人”

时薪150美元,华尔街精英亲自教AI干掉“自己人”

新闻揭示了AI技术正在重塑华尔街,金融专业人士转型成为AI导师,助力训练模型。OpenAI、xAI等公司招募前银行家等金融精英,通过其专业知识优化AI在金融领域的应用能力,目标是替代初级金融岗位。这一趋势不仅加速了AI在金融行业的落地,也预示着未来金融行业将经历重大变革,要求从业者重新定位自身角色。

来源:36氪

14:24

马斯克开始用Grok替代员工了!最惨部门裁员90%

马斯克开始用Grok替代员工了!最惨部门裁员90%

马斯克正通过Grok大语言模型替代X(前推特)的员工,特别是在打击垃圾邮件与非法内容等安全领域。此次裁员高达90%,旨在实现平台算法的全面AI化。同时,他启动了Macrohard计划,目标是利用AI自动化软件开发过程,包括代码编写、游戏设计及视频处理等领域。然而,这种激进策略也带来了内部管理挑战和安全风险。

来源:量子位

12:20

突发,Claude Opus 4.5编程世界第一,把谷歌OpenAI踢下王座

突发,Claude Opus 4.5编程世界第一,把谷歌OpenAI踢下王座

Anthropic发布Claude Opus 4.5,该模型在编程、智能体和计算机使用方面表现出色,刷新多项基准测试记录。Opus 4.5不仅在编码性能上超越Gemini 3 Pro和GPT-5.1,还在处理模糊信息、多系统漏洞修复等方面展现出卓越能力。通过与Claude Code联动使用,平均生产效率提升220%。此外,其在安全性、对齐度及抗提示词注入攻击方面也取得显著进步。Anthropic为开发者提供了新工具,并大幅降低了API调用成本。

来源:36氪

12:19

千问、灵光、夸克,阿里AI疯狂“补课”

阿里近期推出千问APP和灵光APP两款C端AI产品,依托Qwen3-Max等大模型技术,在推理、编程及中文语境理解上展现优势。然而,在多模态与生态整合方面仍存短板,尤其是Agent能力需进一步提升。尽管入局较晚,但凭借算力、数据、人才及开源策略的优势,千问仍有反超竞品的潜力。未来能否成为超级入口,关键在于突破核心技术瓶颈,实现更深层次的生态联动。

来源:36氪

12:19

Claude Opus 4.5来了,单次生成打造《我的世界》,还破解高难度Agent测评

Claude Opus 4.5来了,单次生成打造《我的世界》,还破解高难度Agent测评

Anthropic发布Claude Opus 4.5,全球最强编程模型之一,在SWE-bench Verified测试中得分超80%,面试表现超越人类。该模型在前端开发、复杂项目处理(如《我的世界》克隆版)及多语言编程上表现出色,同时提升了安全性与上下文管理能力。新增思考强度控制和上下文压缩功能,显著降低了使用成本,每百万tokens定价降至5美元(输入)/25美元(输出)。Claude Opus 4.5代表了AI从代码补全向端到端开发伙伴演进的重要里程碑。

来源:36氪

11:17

获贝塔斯曼首笔日区投资,HelloBoss发布首个招聘全流程AI Agent

总部位于东京的初创企业 NGA 宣布,旗下人工智能招聘平台 HelloBoss 正式推出首款覆盖求职与招聘全流程的AI智能体(AI Agent)产品。据悉,该产品在个人端可提供AI简历识别与生成、人岗AI匹配及自然语言沟通等功能。企业端则支持AI招聘信息撰写、AI自动匹配与沟通初筛、基于简历的AI招聘对话辅助等服务。其创始人兼 CEO Alex Wang(王沁)是长期扎根东京、具有华人背景的创业者,自 2023 年初HelloBoss 在日本上线以来,在短短两年内实现营收的十倍增长。 同时,HelloBoss宣布完成A轮融资,由贝塔斯曼旗下BAI Capital独家领投。值得一提的是,这是贝塔斯曼成立近200年来首次投资日本市场,也是BAI Capital在日本的首笔投资。所融资金将主要用于技术研发、海外市场拓展以及团队扩充等方面。(广角观察)

来源:钛媒体

10:15

大幅降价、无限聊天、编码能力超越人类专家,Claude Opus 4.5重夺最强模型王冠

大幅降价、无限聊天、编码能力超越人类专家,Claude Opus 4.5重夺最强模型王冠

Anthropic发布Claude Opus 4.5,宣称在软件工程任务上达到最先进性能,超越GPT-5.1、Gemini 3 Pro等对手。新模型在SWE-bench Verified测试中准确率达80.9%,并在实际应用中展现更强判断力和直觉。同时,Anthropic大幅下调定价,使尖端AI技术更易获取。Opus 4.5还实现了效率提升,处理相同任务时所需token减少76%。此外,通过深度集成Office,突破了上下文长度限制,进一步推动AI编程助手的应用和发展。

来源:36氪

09:30

Claude Opus 4.5发布!2小时工程测试超人类,前代Sonnet搞不定的活它轻松拿捏

Claude Opus 4.5发布!2小时工程测试超人类,前代Sonnet搞不定的活它轻松拿捏

Claude Opus 4.5发布,该模型在编码、视觉处理及日常任务执行方面显著提升,尤其在前端开发与电子表格处理上表现突出。其核心优势在于理解和解决复杂问题的能力,测试中得分超过所有人类。Opus 4.5还支持更高效的多智能体系统构建,并通过API和三大云平台开放使用,定价每百万tokens 5美元(输入)/25美元(输出)。此次更新还包括Claude Code及App的升级,增强了用户体验与功能多样性。

来源:量子位

09:14

Gemini 3 之后,谷歌首席科学家 Jeff Dean 说清 AI 的 3 个关键信号

Jeff Dean 在斯坦福演讲中回顾了 15 年 AI 演进,重点介绍了 Gemini 3 的独特能力。Gemini 3 采用 Pathways 架构,通过 MoE 技术实现高效推理,仅激活所需模块。此外,Gemini 3 展现了从回答到行动的转变,通过强化学习和工具调用完成复杂任务。Jeff Dean 强调,AI 的普及需兼顾效率与成本,TPU 和蒸馏技术使得模型在现实约束下落地成为可能。

来源:36氪

08:10

被Meta裁掉的硅谷AI大佬田渊栋:AI时代,所有人终将失业?

Meta裁员事件引发AI行业关注,AI科学家田渊栋离职后受到多家科技巨头青睐。他指出,随着自动化程度提高,未来将有更多工作被AI取代,但人类独有的洞察力与知识仍不可替代。田渊栋强调,在AI时代,人们需寻找个人‘独一无二’的价值所在,尤其是在创造性劳动方面。此外,他还提到当前大模型的学习效率仍不及人类,但在重复性任务上表现出色。

来源:36氪

03:08

Anthropic发布Opus 4.5,新增Chrome和Excel集成功能

Anthropic发布Opus 4.5,新增Chrome和Excel集成功能

Anthropic发布Opus 4.5,其最新旗舰模型在编码基准、工具使用及问题解决方面表现卓越,特别是在SWE-Bench上得分超过80%。新版本增强了长期上下文处理能力,支持“无尽聊天”功能,并优化了内存管理。此外,Claude for Chrome和Excel产品将更广泛地推出,旨在提升AI在编程辅助与办公自动化中的应用效率。

来源:TechCrunch AI

11月 24日
5 条新闻
22:18

美国银行紧急评估数据泄露风险:黑客攻破金融科技公司

美国银行紧急评估数据泄露风险:黑客攻破金融科技公司

美国多家银行和抵押贷款机构正评估客户数据在一次针对纽约金融科技公司SitusAMC的网络攻击中的损失情况。SitusAMC确认于11月12日发生数据泄露,黑客窃取了与银行客户的业务相关的企业数据及会计记录等。尽管未使用加密恶意软件,但此次事件凸显了金融行业面临的数据安全挑战,特别是在处理大量非公开银行信息时。这促使业界更加重视利用AI技术加强网络安全防护措施,如通过异常检测算法来提高对潜在威胁的识别能力,以及采用联邦学习以增强跨机构间的信息共享安全性。

来源:TechCrunch AI

22:00

Momentic筹集1500万美元以实现软件测试自动化

Momentic筹集1500万美元以实现软件测试自动化

Momentic 通过 AI 自动化软件测试与验证,获得 1500 万美元 A 轮融资。其工具简化了测试流程,用户仅需用自然语言描述关键用户流程即可实现自动化测试。目前已有 2600 名用户,包括 Notion 和 Xero 等企业。尽管面临来自 OpenAI 和 Anthropic 的竞争,Momentic 仍计划利用新资金扩展产品功能,如支持移动环境和更复杂的测试案例管理。

来源:TechCrunch AI

20:52

中关村两院发布全球首个科研全流程智能体系统OmniScientist

2025国际人工智能科学家大会(ICAIS 2025上),北京中关村学院与中关村人工智能研究院正式推出全球首个覆盖科研人才全流程培养的智能体系统OmniScientist。该系统以“元科学洞察”与“学者数字孪生”双引擎驱动,可解析科学逻辑、预判前沿趋势,并依据个体科研风格提供定制化支持,破解选题迷茫、学科壁垒与产学研脱节等痛点,构建贯穿科研全周期的智能支撑体系。

同期,“北纬诺贝论坛”宣布启动,旨在持续汇聚顶尖智慧,邀请诺贝尔奖得主与青年学者、企业家、科学家深度对接、长效合作,实现思想碰撞、创新赋能与精英孵化。(广角观察)

来源:钛媒体

20:34

xLLM社区重磅首秀,揭秘大模型推理全景图与开源AI Infra生态

xLLM社区重磅首秀,揭秘大模型推理全景图与开源AI Infra生态

xLLM社区将于12月6日在北京举办主题为“共建开源AI Infra生态”的Meetup,揭秘其作为连接算力与大模型应用的‘中枢神经’角色。xLLM定位为支持多元化生成式AI场景的强大推理引擎框架,覆盖大语言模型、多模态理解与生成等领域。该框架通过创新架构提供统一高效可扩展的推理支持,并已在京东大促等业务中实现显著效率提升。此外,xLLM集成Mooncake存储解决方案,优化计算单元与算子以提升推理速度,同时强调开放性与硬件适配性,推动AI技术生态协同创新。

来源:量子位