AI新闻

已选标签:
模型突破
AI音频
12月 3日
18 条新闻
18:09

老外傻眼,明用英文提问,DeepSeek依然坚持中文思考

老外傻眼,明用英文提问,DeepSeek依然坚持中文思考

DeepSeek发布的新模型V3.2和V3.2-Speciale在推理能力上显著提升,尤其在长思考与定理证明方面表现优异。研究发现,使用中文等非英语语言进行推理可以有效减少Token消耗并保持准确性,这表明语言选择对模型效率有直接影响。实验还显示,虽然中文在某些场景下比英文更高效,但并非所有情况下都是最优选择。此现象可能与训练数据中语言分布有关,揭示了大模型内部处理机制的复杂性。

来源:36氪

18:09

AI for Science,走到哪一步了?

AI for Science,走到哪一步了?

谷歌DeepMind的AlphaFold等AI模型在蛋白质结构预测、药物设计等方面取得突破,推动了生命科学领域的快速发展。同时,AI技术也在气象学、材料科学等领域展现出巨大潜力,如WeatherNext 2模型超越传统天气预报系统。此外,AI正在从被动工具转变为科学家的主动合作者,通过人机协同和自主实验室模式加速科研进程。

来源:36氪

18:08

「原神之父」做了个毒舌 AI 猫娘,聊了两天的我被怼了八百回

「原神之父」做了个毒舌 AI 猫娘,聊了两天的我被怼了八百回

米哈游创始人蔡浩宇成立AI公司Anuttacon,推出主打情绪价值的聊天AI产品AnuNeko。该产品通过微调模型,提供两种风格鲜明的角色选项,强调共情模拟与用户互动体验。同时,Anuttacon还发布一款完全由AI驱动剧情的游戏《星之低语》,展示了AI在创造个性化情感体验及构建虚拟世界方面的潜力,为未来游戏开发提供了新方向。

来源:36氪

17:06

Claude Code 豪气收购一家0收入前端公司:押注一位高中辍学创始人

Claude Code 豪气收购一家0收入前端公司:押注一位高中辍学创始人

Anthropic 收购了热门开发者工具初创公司 Bun,旨在增强 Claude Code 等 AI 编程产品的性能和稳定性。Bun 以其高效的单文件可执行程序、快速启动速度及广泛的兼容性受到青睐,已成为 AI 编程工具的重要基础设施。此次收购体现了 Anthropic 在企业级 AI 领域的战略布局,以及对提升开发效率和构建强大 AI 编程工具的承诺。

来源:36氪

16:04

奥特曼怕了,GPT-5.5「大蒜」决战谷歌,红色警报紧急拉响

奥特曼怕了,GPT-5.5「大蒜」决战谷歌,红色警报紧急拉响

OpenAI正面临来自谷歌Gemini 3的严峻挑战,紧急启动了代号为’Garlic’的新一代预训练模型的研发。该模型在编码与推理任务上表现优异,预计明年初发布。同时,OpenAI调整战略重点,将资源集中于提升ChatGPT用户体验,包括增强个性化、图像生成能力及优化模型行为等,旨在巩固其市场地位并应对日益激烈的竞争。

来源:36氪

16:04

聊DeepSeek、聊AI硬件、聊竞争对手,OpenAI首席研究官专访信息密度有点大

OpenAI首席研究官Mark Chen接受专访,分享了公司追求AGI的独特哲学与短期路线图。面对Meta等竞争对手激烈的人才争夺战,OpenAI通过共同愿景而非高薪留住人才。公司内部同时推进约300个项目,优先级排序和资源分配机制确保探索性研究得到支持。强调预训练技术的重要性,并计划在两年半内实现AI端到端自主研究能力。此外,OpenAI正与乔尼·艾维合作开发下一代具备持续学习能力的AI硬件设备。

来源:36氪

12:57

千问再放大招,阿里最强学习模型上线,能讲题、会批改、懂专业,直接把老师“请回家”

千问再放大招,阿里最强学习模型上线,能讲题、会批改、懂专业,直接把老师“请回家”

阿里发布基于Qwen3训练的“最强”学习大模型Qwen3-Learning,覆盖全学段、全学科,提供拍题答疑与作业批改功能。该模型通过多模态理解、精准文字识别及5亿级资料库支持,实现高准确率解题和批改能力,适用于从小学到大学的学习场景。其综合能力展示了从通用到专业领域的转化潜力,在教育之外,未来有望应用于工业检测、医疗辅助等领域。

来源:36氪

12:56

奥特曼发红色警报,大模型走进死胡同了吗 ?

奥特曼发红色警报,大模型走进死胡同了吗 ?

OpenAI CEO奥特曼宣布公司进入“Code Red”紧急状态,面临训练成本飙升但性能提升有限的技术困境。斯坦福大学报告显示,2023年后,每增加10倍训练成本,模型性能仅提升10%-15%。同时,谷歌与Anthropic的模型在基准测试中超越或接近GPT-4,用户数据和市场份额也出现显著增长。预训练成为行业瓶颈,大语言模型遭遇不可约误差限制及高质量数据枯竭问题,导致模型迭代停滞不前。

来源:36氪

10:52

云计算一哥10分钟发了25个新品!Kimi和MiniMax首次上桌

云计算一哥10分钟发了25个新品!Kimi和MiniMax首次上桌

亚马逊云科技在re:Invent 2025上发布了近40款新品,重点围绕AI Agent、算力及模型。自研芯片Trainium4性能大幅提升,推出AI Factories实现私有数据中心部署。Amazon Bedrock平台新增多款大模型,包括中国Kimi和MiniMax,同时发布自家Nova 2系列,涵盖多模态与定制化需求。针对开发者,推出了Kiro编程助手的自主Agent、安全Agent和运维Agent,全面提升开发效率与安全性。

来源:量子位

10:50

亚马逊重磅发布,挑战谷歌英伟达

亚马逊重磅发布,挑战谷歌英伟达

亚马逊AWS在re:Invent大会上推出Trainium 3 AI芯片,性能较上一代提升4倍,能效提高40%,并预告了支持英伟达NVLink技术的Trainium 4开发计划。同时,发布了Nova 2系列AI模型与服务,包括多模态处理、对话式AI和代码生成等,以及首创的’开放式训练’服务Nova Forge和浏览器任务自动化服务Nova Act,旨在通过性价比优势吸引更多客户,挑战英伟达和谷歌的市场地位。

来源:36氪

10:50

AI也能换岗了,Anthropic教智能体交接班,不怕长任务断片

AI也能换岗了,Anthropic教智能体交接班,不怕长任务断片

Anthropic设计了一种双智能体架构,以解决AI在执行跨越多小时任务时因上下文窗口限制导致的‘失忆’问题。该架构包括初始化智能体和编码智能体两部分,通过功能列表、渐进式推进及测试机制,模仿人类工程师的工作习惯,有效管理项目状态与进度,显著提升了复杂Web应用开发等长时任务的成功率。

来源:36氪

10:50

全面战胜ReAct,斯坦福全新智能体推理框架,性能提升112.5%

全面战胜ReAct,斯坦福全新智能体推理框架,性能提升112.5%

斯坦福和MIT团队提出AI智能体推理新框架ReCAP,通过递归树结构及三大机制,在长上下文任务中显著超越现有主流框架ReAct,解决目标漂移、上下文断层与成本爆炸问题。尽管计算成本增加,但其在关键任务如Robotouieu上的性能提升(同步84.2%,异步112.5%)显示了巨大潜力。ReCAP不仅适用于具身推理和代码编辑,还为依赖复杂决策和长期记忆的任务提供了可能的解决方案。

来源:36氪

08:45

亚马逊杀疯了,连甩十大重磅发布,揭Agent大招、自研芯进展

亚马逊杀疯了,连甩十大重磅发布,揭Agent大招、自研芯进展

亚马逊云科技在AWS re:Invent上发布了一系列AI新品,包括最新AI芯片Trainium4、基于3nm AI芯片的Amazon EC2 Trainium3 UltraServers及第二代自研大模型Amazon Nova 2系列等。Nova 2 Pro在指令跟随、智能体工具使用榜单中超越了GPT-5 mini等多个前沿模型。此外,Amazon Bedrock新增18款全托管开源模型,含阿里Qwen3-NEXT等国内顶尖模型。这些更新展示了亚马逊在提升算力效率、优化模型性能和促进多模态推理方面的重要进展,为AI应用提供了更强大的支持。

来源:36氪

06:18

亚马逊预览三款AI代理,其中包括可连续多日自主编码的“Kiro”

亚马逊预览三款AI代理,其中包括可连续多日自主编码的“Kiro”

AWS 推出三款名为 Frontier 的 AI 代理,包括能够自主工作数天的 Kiro 自主代理。Kiro 基于 AWS 现有的 AI 编码工具开发,支持代码编写、安全审查及 DevOps 任务自动化等。通过‘规范驱动开发’,Kiro 可以学习团队的工作方式并持续优化理解,实现长时间独立运行。此外,AWS 还推出了专门的安全与 DevOps 代理,进一步提升编码效率和安全性。

来源:TechCrunch AI

03:00

Android 16新增AI通知摘要、更多自定义选项等功能

Android 16新增AI通知摘要、更多自定义选项等功能

Google发布Android 16更新,引入AI驱动的通知摘要功能,能够自动整理和简化消息内容。新增的“通知组织者”可智能分类并静默低优先级通知。此外,通过Circle to Search功能增强,用户可通过手势启动AI概览分析可疑信息。在无障碍方面,借助Gemini模型支持的智能听写功能,允许用户使用自然语言指令编辑文本,显著提升语音输入体验。

来源:TechCrunch AI

01:56

报告称,ChatGPT向零售商应用程序的推荐量同比增长了28%

报告称,ChatGPT向零售商应用程序的推荐量同比增长了28%

最新数据显示,ChatGPT 作为电商网站推荐来源的影响力持续增长,特别是在黑色星期五购物周末期间,零售商移动应用的推荐量同比增长28%。然而,这种增长主要集中在大型电商平台如亚马逊和沃尔玛,其市场份额分别增至54%和14.9%。尽管AI聊天机器人在电商推荐中的使用比例仍较小(今年为0.82%),但Adobe报告指出,AI流量在黑色星期五同比增长了805%,且通过AI聊天机器人进入零售网站的用户购买率提高了38%。

来源:TechCrunch AI

01:54

AWS推出新型Nova AI模型及一项赋予客户更多控制权的服务

AWS推出新型Nova AI模型及一项赋予客户更多控制权的服务

AWS 发布 Nova 2 系列 AI 模型,包括四款新模型:Nova 2 Lite、Nova 2 Pro、Nova 2 Sonic 和 Nova 2 Omni,覆盖文本生成、图像处理、语音识别及多模态推理等任务。同时推出 Nova Forge 服务,允许企业客户基于 AWS 预训练模型进行定制化开发,解决现有数据与预训练模型融合难题。

来源:TechCrunch AI

00:00

Simular的AI代理希望为您管理Mac和Windows电脑

Simular的AI代理希望为您管理Mac和Windows电脑

Simular,一家专注于为Mac OS和Windows构建AI代理的初创公司,已筹集2150万美元A轮融资。与控制浏览器不同,Simular直接控制PC,执行复杂任务如数据复制粘贴等。其技术结合了深度学习与神经符号计算,旨在解决LLM幻觉问题,通过用户修正锁定成功轨迹,使任务可重复且确定性高。创始人背景包括Google DeepMind,具备连续学习与强化学习专长。

来源:TechCrunch AI

12月 2日
2 条新闻
23:37

Mistral以新开放权重前沿和小型模型逼近大型AI竞争对手

Mistral以新开放权重前沿和小型模型逼近大型AI竞争对手

法国AI初创公司Mistral发布了其新系列的Mistral 3开放权重模型,包括一个具有多模态和多语言能力的大规模前沿模型及九个可离线运行、完全可定制的小型模型。这些模型旨在满足企业级应用需求,通过精细化调整实现更高效的任务处理。Mistral强调,在实际应用场景中,小型模型经过调优后可以匹敌甚至超越大型封闭源模型的表现,尤其在成本控制与性能优化方面展现出优势。

来源:TechCrunch AI

22:29

谷歌卷土重来:你大爷还是你大爷

谷歌卷土重来:你大爷还是你大爷

谷歌凭借自研TPU芯片及Gemini-3模型,在AI领域强势回归,挑战英伟达GPU的垄断地位。TPU作为专用ASIC芯片,在特定AI任务上展现出更高效率与成本优势,吸引Meta等大客户考虑转向。尽管如此,英伟达依靠其成熟的CUDA生态及其他防御性布局仍保持较强竞争力。此事件反映了AI产业中通用与专用芯片之争,以及对算力效率和成本控制的关注。

来源:36氪