AI新闻

已选标签:
模型突破
AI智能体
12月 3日
8 条新闻
10:50

AI也能换岗了,Anthropic教智能体交接班,不怕长任务断片

AI也能换岗了,Anthropic教智能体交接班,不怕长任务断片

Anthropic设计了一种双智能体架构,以解决AI在执行跨越多小时任务时因上下文窗口限制导致的‘失忆’问题。该架构包括初始化智能体和编码智能体两部分,通过功能列表、渐进式推进及测试机制,模仿人类工程师的工作习惯,有效管理项目状态与进度,显著提升了复杂Web应用开发等长时任务的成功率。

来源:36氪

10:50

全面战胜ReAct,斯坦福全新智能体推理框架,性能提升112.5%

全面战胜ReAct,斯坦福全新智能体推理框架,性能提升112.5%

斯坦福和MIT团队提出AI智能体推理新框架ReCAP,通过递归树结构及三大机制,在长上下文任务中显著超越现有主流框架ReAct,解决目标漂移、上下文断层与成本爆炸问题。尽管计算成本增加,但其在关键任务如Robotouieu上的性能提升(同步84.2%,异步112.5%)显示了巨大潜力。ReCAP不仅适用于具身推理和代码编辑,还为依赖复杂决策和长期记忆的任务提供了可能的解决方案。

来源:36氪

08:45

亚马逊杀疯了,连甩十大重磅发布,揭Agent大招、自研芯进展

亚马逊杀疯了,连甩十大重磅发布,揭Agent大招、自研芯进展

亚马逊云科技在AWS re:Invent上发布了一系列AI新品,包括最新AI芯片Trainium4、基于3nm AI芯片的Amazon EC2 Trainium3 UltraServers及第二代自研大模型Amazon Nova 2系列等。Nova 2 Pro在指令跟随、智能体工具使用榜单中超越了GPT-5 mini等多个前沿模型。此外,Amazon Bedrock新增18款全托管开源模型,含阿里Qwen3-NEXT等国内顶尖模型。这些更新展示了亚马逊在提升算力效率、优化模型性能和促进多模态推理方面的重要进展,为AI应用提供了更强大的支持。

来源:36氪

06:18

亚马逊预览三款AI代理,其中包括可连续多日自主编码的“Kiro”

亚马逊预览三款AI代理,其中包括可连续多日自主编码的“Kiro”

AWS 推出三款名为 Frontier 的 AI 代理,包括能够自主工作数天的 Kiro 自主代理。Kiro 基于 AWS 现有的 AI 编码工具开发,支持代码编写、安全审查及 DevOps 任务自动化等。通过‘规范驱动开发’,Kiro 可以学习团队的工作方式并持续优化理解,实现长时间独立运行。此外,AWS 还推出了专门的安全与 DevOps 代理,进一步提升编码效率和安全性。

来源:TechCrunch AI

03:00

Android 16新增AI通知摘要、更多自定义选项等功能

Android 16新增AI通知摘要、更多自定义选项等功能

Google发布Android 16更新,引入AI驱动的通知摘要功能,能够自动整理和简化消息内容。新增的“通知组织者”可智能分类并静默低优先级通知。此外,通过Circle to Search功能增强,用户可通过手势启动AI概览分析可疑信息。在无障碍方面,借助Gemini模型支持的智能听写功能,允许用户使用自然语言指令编辑文本,显著提升语音输入体验。

来源:TechCrunch AI

01:56

报告称,ChatGPT向零售商应用程序的推荐量同比增长了28%

报告称,ChatGPT向零售商应用程序的推荐量同比增长了28%

最新数据显示,ChatGPT 作为电商网站推荐来源的影响力持续增长,特别是在黑色星期五购物周末期间,零售商移动应用的推荐量同比增长28%。然而,这种增长主要集中在大型电商平台如亚马逊和沃尔玛,其市场份额分别增至54%和14.9%。尽管AI聊天机器人在电商推荐中的使用比例仍较小(今年为0.82%),但Adobe报告指出,AI流量在黑色星期五同比增长了805%,且通过AI聊天机器人进入零售网站的用户购买率提高了38%。

来源:TechCrunch AI

01:54

AWS推出新型Nova AI模型及一项赋予客户更多控制权的服务

AWS推出新型Nova AI模型及一项赋予客户更多控制权的服务

AWS 发布 Nova 2 系列 AI 模型,包括四款新模型:Nova 2 Lite、Nova 2 Pro、Nova 2 Sonic 和 Nova 2 Omni,覆盖文本生成、图像处理、语音识别及多模态推理等任务。同时推出 Nova Forge 服务,允许企业客户基于 AWS 预训练模型进行定制化开发,解决现有数据与预训练模型融合难题。

来源:TechCrunch AI

00:00

Simular的AI代理希望为您管理Mac和Windows电脑

Simular的AI代理希望为您管理Mac和Windows电脑

Simular,一家专注于为Mac OS和Windows构建AI代理的初创公司,已筹集2150万美元A轮融资。与控制浏览器不同,Simular直接控制PC,执行复杂任务如数据复制粘贴等。其技术结合了深度学习与神经符号计算,旨在解决LLM幻觉问题,通过用户修正锁定成功轨迹,使任务可重复且确定性高。创始人背景包括Google DeepMind,具备连续学习与强化学习专长。

来源:TechCrunch AI

12月 2日
12 条新闻
23:37

Mistral以新开放权重前沿和小型模型逼近大型AI竞争对手

Mistral以新开放权重前沿和小型模型逼近大型AI竞争对手

法国AI初创公司Mistral发布了其新系列的Mistral 3开放权重模型,包括一个具有多模态和多语言能力的大规模前沿模型及九个可离线运行、完全可定制的小型模型。这些模型旨在满足企业级应用需求,通过精细化调整实现更高效的任务处理。Mistral强调,在实际应用场景中,小型模型经过调优后可以匹敌甚至超越大型封闭源模型的表现,尤其在成本控制与性能优化方面展现出优势。

来源:TechCrunch AI

22:29

谷歌卷土重来:你大爷还是你大爷

谷歌卷土重来:你大爷还是你大爷

谷歌凭借自研TPU芯片及Gemini-3模型,在AI领域强势回归,挑战英伟达GPU的垄断地位。TPU作为专用ASIC芯片,在特定AI任务上展现出更高效率与成本优势,吸引Meta等大客户考虑转向。尽管如此,英伟达依靠其成熟的CUDA生态及其他防御性布局仍保持较强竞争力。此事件反映了AI产业中通用与专用芯片之争,以及对算力效率和成本控制的关注。

来源:36氪

22:29

AI泡沫原罪:英伟达是AI戒不掉的“毒丸”?

AI泡沫原罪:英伟达是AI戒不掉的“毒丸”?

本文通过分析AI产业链核心公司的财务状况,揭示了AI投资热潮下的利润分配不均问题。在AI基建初期,云服务商面临高昂的前期投入与实际现金流紧张的矛盾;算力提供商如英伟达因垄断地位获利丰厚;而下游应用商如OpenAI则因收入增长速度不及成本增加速度而陷入亏损。文章指出,这种利润分配模式导致了整个AI产业生态链的不稳定,需要通过技术创新和商业模式优化来解决。

来源:36氪

20:26

巴黎AI语音初创公司Gradium获得7000万美元种子轮融资

巴黎AI语音初创公司Gradium获得7000万美元种子轮融资

Gradium,一家由法国AI实验室Kyutai孵化的初创公司,获得7000万美元种子轮融资。该公司专注于开发超低延迟的音频语言AI模型,旨在为开发者提供更快更准确的语音技术,并已支持多国语言。尽管面临来自OpenAI等公司的激烈竞争,但随着AI从文本聊天向语音助手及更多应用场景扩展,对高质量语音表达的需求将持续增长。

来源:TechCrunch AI

20:00

能讲“悄悄话”的智能助理,瑞声科技助力夸克AI眼镜S1开创 语音交互新范式

能讲“悄悄话”的智能助理,瑞声科技助力夸克AI眼镜S1开创 语音交互新范式

阿里巴巴推出夸克AI眼镜S1,采用瑞声科技5麦克风阵列+骨传导高精度拾音系统,实现轻声唤醒与精准语音交互。该方案通过硬件创新与算法结合,显著降低误唤醒率,提升私密性和可靠性,为智能眼镜行业带来全新交互范式,并拓展了在多场景下的应用潜力。

来源:量子位

19:24

退货率可达40%的AI眼镜,还是门好生意吗?

智能眼镜赛道在2025年末迎来激烈竞争,各大科技公司纷纷推出AI眼镜产品,价格持续下探至1500元左右。尽管销量增速显著,但高退货率反映了用户需求与技术瓶颈之间的差距。当前AI眼镜主要应用于便捷拍摄等场景,但在续航、AI功能实用性及网络连接稳定性方面存在不足。行业正经历残酷洗牌,企业需加速技术创新和生态建设以应对未来挑战。

来源:36氪

19:24

豆包的AI助手江湖

豆包的AI助手江湖

字节跳动推出搭载豆包AI助手的工程样机M153,标志着其在端侧多模态生成式AI应用上的重要进展。该手机助手通过高通骁龙8至尊版芯片支持,实现了自动语音识别、大语言模型交互等功能,展示了长文本处理、记忆及个性化服务等技术能力。与努比亚合作,豆包尝试了从工具到助理的角色转变,强调体验功能而非硬件性能的竞争。这表明,在AI助手领域,软件与硬件正在共同进化,以满足用户对于便捷交互的需求。

来源:36氪

19:24

SaaS已死?Anthropic和Cursor揭示了8个AI创业真相

人工智能正在重塑SaaS行业,带来新的商业路径。计算成本成为关键因素,毛利率普遍下降但增长速度加快。AI公司需重新定义健康增长,关注单位经济效益。定价模式从固定订阅转向基于使用量和结果的模式。销售策略更加灵活和技术导向。AI融入日常工作流程,推动团队更高效运作。专注特定领域和合作成为制胜之道。新的衡量指标关注使用情况、客户喜爱度和杠杆作用。

来源:36氪

18:40

小猿学练机荣获2025 IDEA国际设计奖,开创学习平板品类新高度

小猿学练机荣获2025 IDEA国际设计奖,开创学习平板品类新高度

小猿学练机凭借其创新的护眼设计和卓越的教育AI体验荣获2025 IDEA国际设计奖,标志着中国教育智能硬件从技术跟随向标准引领转变。该产品通过融合墨水屏与自研’猿力大模型’,实现精准的手写识别、自动批改及个性化学习方案生成,显著提升学生学习效率。同时,基于海量教育资源,小猿学练机在练习覆盖度、更新度和精准度上均领先行业,展现了AI技术在教育领域的巨大潜力。

来源:量子位

18:22

这下Altman急了,OpenAI紧急启动「红色警报」

这下Altman急了,OpenAI紧急启动「红色警报」

OpenAI 面临谷歌等竞争对手的强势复苏,宣布进入红色警报状态,将集中资源改进ChatGPT。尽管过去一年中OpenAI在多模态、智能体等领域进行了广泛探索,但产品后续发展乏力。为应对挑战,OpenAI计划发布新推理模型,优化图像生成能力,并加强个性化互动与模型行为,以提升用户体验和竞争力。

来源:36氪

18:22

数据中心,电力告急

数据中心,电力告急

随着AI算力需求激增,数据中心电力消耗问题日益突出。高盛报告指出,美国AI发展面临的主要障碍是电力供应。初创公司如PowerLattice和Empower正致力于研发高效电源管理芯片,旨在减少能耗并提升计算效率,预计未来几年内将实现千兆瓦级别的能源节省。同时,第三代半导体材料GaN与SiC的应用,以及800V高压直流架构的推广,将进一步推动AI基础设施向更高效、更环保的方向发展。

来源:36氪