AI新闻

已选标签:
模型突破
多模态AI
11月 25日
7 条新闻
09:30

Claude Opus 4.5发布!2小时工程测试超人类,前代Sonnet搞不定的活它轻松拿捏

Claude Opus 4.5发布!2小时工程测试超人类,前代Sonnet搞不定的活它轻松拿捏

Claude Opus 4.5发布,该模型在编码、视觉处理及日常任务执行方面显著提升,尤其在前端开发与电子表格处理上表现突出。其核心优势在于理解和解决复杂问题的能力,测试中得分超过所有人类。Opus 4.5还支持更高效的多智能体系统构建,并通过API和三大云平台开放使用,定价每百万tokens 5美元(输入)/25美元(输出)。此次更新还包括Claude Code及App的升级,增强了用户体验与功能多样性。

来源:量子位

09:14

Gemini 3 之后,谷歌首席科学家 Jeff Dean 说清 AI 的 3 个关键信号

Jeff Dean 在斯坦福演讲中回顾了 15 年 AI 演进,重点介绍了 Gemini 3 的独特能力。Gemini 3 采用 Pathways 架构,通过 MoE 技术实现高效推理,仅激活所需模块。此外,Gemini 3 展现了从回答到行动的转变,通过强化学习和工具调用完成复杂任务。Jeff Dean 强调,AI 的普及需兼顾效率与成本,TPU 和蒸馏技术使得模型在现实约束下落地成为可能。

来源:36氪

09:13

漫剧启示录:互联网最差的生意,可能是AI最好的生意

漫剧启示录:互联网最差的生意,可能是AI最好的生意

AI技术在内容产业中展现出巨大潜力,特别是在漫剧制作领域。通过深度学习等技术,AI已将漫剧制作成本降至每分钟1000-2500元,周期缩短至10-13天,显著提高了生产效率和降低了成本。此外,AIGC(AI Generated Content)正逐步改变内容创作方式,从辅助工具向主导者转变,不仅在图像、视频生成上取得突破,还促进了跨模态内容的融合与创新,预计未来市场空间可达千亿级别。

来源:36氪

08:10

被Meta裁掉的硅谷AI大佬田渊栋:AI时代,所有人终将失业?

Meta裁员事件引发AI行业关注,AI科学家田渊栋离职后受到多家科技巨头青睐。他指出,随着自动化程度提高,未来将有更多工作被AI取代,但人类独有的洞察力与知识仍不可替代。田渊栋强调,在AI时代,人们需寻找个人‘独一无二’的价值所在,尤其是在创造性劳动方面。此外,他还提到当前大模型的学习效率仍不及人类,但在重复性任务上表现出色。

来源:36氪

03:08

Anthropic发布Opus 4.5,新增Chrome和Excel集成功能

Anthropic发布Opus 4.5,新增Chrome和Excel集成功能

Anthropic发布Opus 4.5,其最新旗舰模型在编码基准、工具使用及问题解决方面表现卓越,特别是在SWE-Bench上得分超过80%。新版本增强了长期上下文处理能力,支持“无尽聊天”功能,并优化了内存管理。此外,Claude for Chrome和Excel产品将更广泛地推出,旨在提升AI在编程辅助与办公自动化中的应用效率。

来源:TechCrunch AI

02:29

顶流设计Agent能用Nano Banana Pro了!一句话BlackPink变东北翠花

顶流设计Agent能用Nano Banana Pro了!一句话BlackPink变东北翠花

Lovart设计Agent接入Nano Banana Pro,实现多模态处理能力的显著提升。通过自然语言指令即可完成复杂设计任务,如图像合成、视频生成等,展现出强大的跨模态推理与编辑功能。其独特的Touch Edit特性支持直观的细节调整,极大提高了设计效率和用户体验。该组合在专业设计领域实现了突破性应用,展示了AI技术在创意产业中的巨大潜力。

来源:量子位

11月 24日
13 条新闻
23:15

前MrBeast内容策略师正在开发一款面向创作者灵感激发与数据分析的人工智能工具

前MrBeast内容策略师正在开发一款面向创作者灵感激发与数据分析的人工智能工具

Palo 是一款面向内容创作者的 AI 平台,结合了大语言模型和数据分析技术,旨在通过分析短视频表现提供创作建议。该平台利用混合模型提取视频数据树,涵盖观众情感、兴趣话题等关键指标,并通过语义检索构建创作者画像。此外,Palo 还提供了基于对话的AI策划工具,支持剧本生成与故事板设计,帮助创作者优化内容策略。

来源:TechCrunch AI

22:00

Momentic筹集1500万美元以实现软件测试自动化

Momentic筹集1500万美元以实现软件测试自动化

Momentic 通过 AI 自动化软件测试与验证,获得 1500 万美元 A 轮融资。其工具简化了测试流程,用户仅需用自然语言描述关键用户流程即可实现自动化测试。目前已有 2600 名用户,包括 Notion 和 Xero 等企业。尽管面临来自 OpenAI 和 Anthropic 的竞争,Momentic 仍计划利用新资金扩展产品功能,如支持移动环境和更复杂的测试案例管理。

来源:TechCrunch AI

20:52

中关村两院发布全球首个科研全流程智能体系统OmniScientist

2025国际人工智能科学家大会(ICAIS 2025上),北京中关村学院与中关村人工智能研究院正式推出全球首个覆盖科研人才全流程培养的智能体系统OmniScientist。该系统以“元科学洞察”与“学者数字孪生”双引擎驱动,可解析科学逻辑、预判前沿趋势,并依据个体科研风格提供定制化支持,破解选题迷茫、学科壁垒与产学研脱节等痛点,构建贯穿科研全周期的智能支撑体系。

同期,“北纬诺贝论坛”宣布启动,旨在持续汇聚顶尖智慧,邀请诺贝尔奖得主与青年学者、企业家、科学家深度对接、长效合作,实现思想碰撞、创新赋能与精英孵化。(广角观察)

来源:钛媒体

20:34

xLLM社区重磅首秀,揭秘大模型推理全景图与开源AI Infra生态

xLLM社区重磅首秀,揭秘大模型推理全景图与开源AI Infra生态

xLLM社区将于12月6日在北京举办主题为“共建开源AI Infra生态”的Meetup,揭秘其作为连接算力与大模型应用的‘中枢神经’角色。xLLM定位为支持多元化生成式AI场景的强大推理引擎框架,覆盖大语言模型、多模态理解与生成等领域。该框架通过创新架构提供统一高效可扩展的推理支持,并已在京东大促等业务中实现显著效率提升。此外,xLLM集成Mooncake存储解决方案,优化计算单元与算子以提升推理速度,同时强调开放性与硬件适配性,推动AI技术生态协同创新。

来源:量子位

19:50

6天狂飙200万,这个AI应用为何全网爆火?

6天狂飙200万,这个AI应用为何全网爆火?

蚂蚁集团发布的全模态通用AI助手“灵光”在上线六天内下载量突破200万,其核心功能“闪应用”允许用户无需编程即可创建实用小程序,降低了技术门槛。灵光采用多模态交付方式,提升了信息呈现的直观性和美观度。这一趋势表明,AI产品正从强调模型能力转向注重用户体验和实用性,预示着未来AI将更加融入日常生活,并推动软件开发向去中心化、个性化方向发展。

来源:36氪

19:50

00后谈恋爱,用AI当「僚机」

新闻探讨了AI在恋爱场景中的应用,从一键生成高情商回复的恋爱键盘到提供策略的’AI军师’,这些产品正迅速吸引年轻用户。然而,尽管部分产品如Lovekey键盘取得商业成功,但更全面的AI恋爱助手却面临商业化困境,包括高昂的成本、有限的付费意愿等挑战。情感计算专家指出,仅靠文本分析无法完全理解人类情感复杂性,未来需结合多模态数据(如语音、面部表情)以实现更准确的情感识别与分析。

来源:36氪

19:49

奥特曼承认谷歌威胁到OpenAI,即将推出新模型“Shallotpeat”

奥特曼承认谷歌威胁到OpenAI,即将推出新模型“Shallotpeat”

谷歌Gemini 3 Pro和Nano Banana Pro的发布,对OpenAI构成了显著竞争压力。预训练技术成为谷歌弯道超车的关键,尤其是在编程等核心领域展现优势。面对财务和技术挑战,OpenAI正尝试通过优化模型追赶。此转变揭示了AI竞赛从单一模型突破向全栈体系对抗的趋势,谷歌凭借其在算力、数据及产品生态上的全栈优势,在这场竞争中占据了有利位置。

来源:36氪

19:15

睿尔曼开源全球首个高质量、模态数量最多的真机数据集

睿尔曼开源全球首个高质量、模态数量最多的真机数据集

睿尔曼开源全球首个高质量、多模态真机数据集,涵盖图像、关节位置等多模态数据,具备时空硬同步、超低丢帧率等六大技术优势。该数据集基于十大真实场景采集,旨在解决机器人训练数据瓶颈,提升泛化能力与产业化落地速度。项目致力于构建开放共享的机器人开源生态,推动智能机器人算法创新及应用拓展。

来源:量子位

18:46

阿里AI猛补课,蚂蚁的“灵光”灵不灵?

阿里AI猛补课,蚂蚁的“灵光”灵不灵?

蚂蚁集团推出全新AI助手“灵光”,具备全代码生成多模态内容能力,支持生成图文、3D模型等。其“闪应用”功能可在30秒内根据自然语言指令生成可交互的小应用。该产品定位为效率工具,强调信息展现形式的创新与移动端交互体验,旨在提升信息传递效率。技术上,灵光优化了模型架构和工程实现以应对高膨胀率挑战,展示了在多模态处理和代码生成方面的突破。

来源:36氪

18:46

自动驾驶教父Thrun预言,纯视觉路线决胜2026,空中机器人将成新蓝海

自动驾驶教父Thrun预言,纯视觉路线决胜2026,空中机器人将成新蓝海

Sebastian Thrun在摩根士丹利亚太峰会上深入探讨了自动驾驶技术路线,特别是纯视觉方案与多传感器融合方案的优劣。他强调特斯拉的纯视觉FSD测试将是行业转折点,指出纯视觉方案在成本上有显著优势,但面临恶劣天气下的可靠性挑战。Waymo等公司正加速扩展无人驾驶服务,标志着自动驾驶进入规模化阶段。Thrun还分享了Waymo早期发展历程及团队建设哲学,并预测未来3-5年是自动驾驶商业化黄金期。

来源:36氪

18:46

三个00后,干出700亿独角兽

Mercor,一家由00后创立的AI公司,在不到三年内估值达到100亿美元。其业务从AI招聘转型至数据标注,通过自研大模型快速筛选简历并匹配岗位,后扩展至为头部AI企业如OpenAI等提供高质量人类反馈数据。随着ChatGPT等高级模型对专业人才需求激增,Mercor凭借灵活高效的专家任务管理和跨学科团队组建能力,迅速成长为AI基础设施领域的新星。

来源:36氪