AI新闻

已选标签:
模型突破
AI推理
11月 25日
19 条新闻
16:28

Gemini 3,是谢尔盖・布林「骂」出来的?

Gemini 3,是谢尔盖・布林「骂」出来的?

面对ChatGPT的冲击,谷歌创始人布林回归并推动公司内部整合,包括将Google Brain与DeepMind合并。布林亲自解决Gemini被禁止写代码的问题,显著提升了其在编程等领域的应用能力。谷歌凭借深厚的技术积累和资金优势,在AI领域迅速反超,尤其Gemini 3项目对OpenAI构成短期压力。OpenAI计划通过开发新模型Shallotpeat及聚焦AI研究自动化来应对挑战。

来源:36氪

16:28

吴恩达发布论文自动审阅器,ICLR上达到接近人类水平

吴恩达发布论文自动审阅器,ICLR上达到接近人类水平

吴恩达教授发布了一款名为’Agentic Reviewer’的AI智能体审稿人,旨在通过AI技术提高论文评审效率。尽管目前在ICLR等顶级会议中对使用AI进行评审尚无统一规范,但面对大量投稿和漫长的审稿周期,该工具展现了显著潜力。测试显示其与人工审稿的相关性达到0.42,表明AI审稿正逐步接近人类水平。然而,关于AI是否会影响学术多样性及未来如何进一步推动学术研究发展仍存争议。

来源:36氪

15:26

Claude Opus 4.5发布:价格腰斩、无限对话,重夺代码王座

Claude Opus 4.5发布:价格腰斩、无限对话,重夺代码王座

Anthropic发布Claude Opus 4.5,以突破性性能和成本优势重塑大模型市场。该模型在SWE-bench Verified测试中首次超越人类专家,API调用成本降低三分之二,普惠政策进一步降低了使用门槛。Opus 4.5引入了创新的’努力参数’机制,实现了智能与成本的平衡,并展示了自我优化能力。此外,Anthropic还推出了多项生产力工具更新,全面提升了工作流集成及企业级防护能力。

来源:36氪

15:26

在线教育“教父”创业AI教育:三年融10亿元,月收入上千万元

在线教育“教父”创业AI教育:三年融10亿元,月收入上千万元

中国AI教育公司“与爱为舞”成立两年半,已成长为独角兽。公司专注于开发基于大语言模型的AI教育解决方案,包括AI数字人、音视频实时对话式AI教育模型等。其产品“爱学”提供一对一AI家教服务,通过深度学习和自然语言处理技术实现个性化教学。在实际应用中,“爱学”展现出了高完课率和良好的用户接受度,标志着AI技术在教育领域的商业化进展。

来源:36氪

14:42

波士顿动力前CTO加盟DeepMind,Gemini要做机器人界的安卓

波士顿动力前CTO加盟DeepMind,Gemini要做机器人界的安卓

谷歌聘请前波士顿动力CTO Aaron Saunders加盟DeepMind,出任硬件工程副总裁,旨在基于Gemini打造一个类似安卓的通用机器人操作系统。Gemini 3发布后,谷歌计划构建一个几乎能够即插即用、适用于任何身体配置的AI系统,涵盖人形与非人形机器人。此举标志着谷歌在机器人领域的战略布局从初步探索转向全面冲刺,通过软硬件协同创新推动多模态融合及具身推理技术的发展。

来源:量子位

14:24

时薪150美元,华尔街精英亲自教AI干掉“自己人”

时薪150美元,华尔街精英亲自教AI干掉“自己人”

新闻揭示了AI技术正在重塑华尔街,金融专业人士转型成为AI导师,助力训练模型。OpenAI、xAI等公司招募前银行家等金融精英,通过其专业知识优化AI在金融领域的应用能力,目标是替代初级金融岗位。这一趋势不仅加速了AI在金融行业的落地,也预示着未来金融行业将经历重大变革,要求从业者重新定位自身角色。

来源:36氪

14:24

马斯克开始用Grok替代员工了!最惨部门裁员90%

马斯克开始用Grok替代员工了!最惨部门裁员90%

马斯克正通过Grok大语言模型替代X(前推特)的员工,特别是在打击垃圾邮件与非法内容等安全领域。此次裁员高达90%,旨在实现平台算法的全面AI化。同时,他启动了Macrohard计划,目标是利用AI自动化软件开发过程,包括代码编写、游戏设计及视频处理等领域。然而,这种激进策略也带来了内部管理挑战和安全风险。

来源:量子位

12:20

突发,Claude Opus 4.5编程世界第一,把谷歌OpenAI踢下王座

突发,Claude Opus 4.5编程世界第一,把谷歌OpenAI踢下王座

Anthropic发布Claude Opus 4.5,该模型在编程、智能体和计算机使用方面表现出色,刷新多项基准测试记录。Opus 4.5不仅在编码性能上超越Gemini 3 Pro和GPT-5.1,还在处理模糊信息、多系统漏洞修复等方面展现出卓越能力。通过与Claude Code联动使用,平均生产效率提升220%。此外,其在安全性、对齐度及抗提示词注入攻击方面也取得显著进步。Anthropic为开发者提供了新工具,并大幅降低了API调用成本。

来源:36氪

12:19

千问、灵光、夸克,阿里AI疯狂“补课”

阿里近期推出千问APP和灵光APP两款C端AI产品,依托Qwen3-Max等大模型技术,在推理、编程及中文语境理解上展现优势。然而,在多模态与生态整合方面仍存短板,尤其是Agent能力需进一步提升。尽管入局较晚,但凭借算力、数据、人才及开源策略的优势,千问仍有反超竞品的潜力。未来能否成为超级入口,关键在于突破核心技术瓶颈,实现更深层次的生态联动。

来源:36氪

12:19

Claude Opus 4.5来了,单次生成打造《我的世界》,还破解高难度Agent测评

Claude Opus 4.5来了,单次生成打造《我的世界》,还破解高难度Agent测评

Anthropic发布Claude Opus 4.5,全球最强编程模型之一,在SWE-bench Verified测试中得分超80%,面试表现超越人类。该模型在前端开发、复杂项目处理(如《我的世界》克隆版)及多语言编程上表现出色,同时提升了安全性与上下文管理能力。新增思考强度控制和上下文压缩功能,显著降低了使用成本,每百万tokens定价降至5美元(输入)/25美元(输出)。Claude Opus 4.5代表了AI从代码补全向端到端开发伙伴演进的重要里程碑。

来源:36氪

11:17

获贝塔斯曼首笔日区投资,HelloBoss发布首个招聘全流程AI Agent

总部位于东京的初创企业 NGA 宣布,旗下人工智能招聘平台 HelloBoss 正式推出首款覆盖求职与招聘全流程的AI智能体(AI Agent)产品。据悉,该产品在个人端可提供AI简历识别与生成、人岗AI匹配及自然语言沟通等功能。企业端则支持AI招聘信息撰写、AI自动匹配与沟通初筛、基于简历的AI招聘对话辅助等服务。其创始人兼 CEO Alex Wang(王沁)是长期扎根东京、具有华人背景的创业者,自 2023 年初HelloBoss 在日本上线以来,在短短两年内实现营收的十倍增长。 同时,HelloBoss宣布完成A轮融资,由贝塔斯曼旗下BAI Capital独家领投。值得一提的是,这是贝塔斯曼成立近200年来首次投资日本市场,也是BAI Capital在日本的首笔投资。所融资金将主要用于技术研发、海外市场拓展以及团队扩充等方面。(广角观察)

来源:钛媒体

10:15

大幅降价、无限聊天、编码能力超越人类专家,Claude Opus 4.5重夺最强模型王冠

大幅降价、无限聊天、编码能力超越人类专家,Claude Opus 4.5重夺最强模型王冠

Anthropic发布Claude Opus 4.5,宣称在软件工程任务上达到最先进性能,超越GPT-5.1、Gemini 3 Pro等对手。新模型在SWE-bench Verified测试中准确率达80.9%,并在实际应用中展现更强判断力和直觉。同时,Anthropic大幅下调定价,使尖端AI技术更易获取。Opus 4.5还实现了效率提升,处理相同任务时所需token减少76%。此外,通过深度集成Office,突破了上下文长度限制,进一步推动AI编程助手的应用和发展。

来源:36氪

09:30

Claude Opus 4.5发布!2小时工程测试超人类,前代Sonnet搞不定的活它轻松拿捏

Claude Opus 4.5发布!2小时工程测试超人类,前代Sonnet搞不定的活它轻松拿捏

Claude Opus 4.5发布,该模型在编码、视觉处理及日常任务执行方面显著提升,尤其在前端开发与电子表格处理上表现突出。其核心优势在于理解和解决复杂问题的能力,测试中得分超过所有人类。Opus 4.5还支持更高效的多智能体系统构建,并通过API和三大云平台开放使用,定价每百万tokens 5美元(输入)/25美元(输出)。此次更新还包括Claude Code及App的升级,增强了用户体验与功能多样性。

来源:量子位

09:14

Gemini 3 之后,谷歌首席科学家 Jeff Dean 说清 AI 的 3 个关键信号

Jeff Dean 在斯坦福演讲中回顾了 15 年 AI 演进,重点介绍了 Gemini 3 的独特能力。Gemini 3 采用 Pathways 架构,通过 MoE 技术实现高效推理,仅激活所需模块。此外,Gemini 3 展现了从回答到行动的转变,通过强化学习和工具调用完成复杂任务。Jeff Dean 强调,AI 的普及需兼顾效率与成本,TPU 和蒸馏技术使得模型在现实约束下落地成为可能。

来源:36氪

08:10

被Meta裁掉的硅谷AI大佬田渊栋:AI时代,所有人终将失业?

Meta裁员事件引发AI行业关注,AI科学家田渊栋离职后受到多家科技巨头青睐。他指出,随着自动化程度提高,未来将有更多工作被AI取代,但人类独有的洞察力与知识仍不可替代。田渊栋强调,在AI时代,人们需寻找个人‘独一无二’的价值所在,尤其是在创造性劳动方面。此外,他还提到当前大模型的学习效率仍不及人类,但在重复性任务上表现出色。

来源:36氪

03:08

Anthropic发布Opus 4.5,新增Chrome和Excel集成功能

Anthropic发布Opus 4.5,新增Chrome和Excel集成功能

Anthropic发布Opus 4.5,其最新旗舰模型在编码基准、工具使用及问题解决方面表现卓越,特别是在SWE-Bench上得分超过80%。新版本增强了长期上下文处理能力,支持“无尽聊天”功能,并优化了内存管理。此外,Claude for Chrome和Excel产品将更广泛地推出,旨在提升AI在编程辅助与办公自动化中的应用效率。

来源:TechCrunch AI

11月 24日
1 条新闻
22:00

Momentic筹集1500万美元以实现软件测试自动化

Momentic筹集1500万美元以实现软件测试自动化

Momentic 通过 AI 自动化软件测试与验证,获得 1500 万美元 A 轮融资。其工具简化了测试流程,用户仅需用自然语言描述关键用户流程即可实现自动化测试。目前已有 2600 名用户,包括 Notion 和 Xero 等企业。尽管面临来自 OpenAI 和 Anthropic 的竞争,Momentic 仍计划利用新资金扩展产品功能,如支持移动环境和更复杂的测试案例管理。

来源:TechCrunch AI