AI新闻

已选标签:
多模态AI
AI训练
12月 3日
3 条新闻
01:54

AWS推出新型Nova AI模型及一项赋予客户更多控制权的服务

AWS推出新型Nova AI模型及一项赋予客户更多控制权的服务

AWS 发布 Nova 2 系列 AI 模型,包括四款新模型:Nova 2 Lite、Nova 2 Pro、Nova 2 Sonic 和 Nova 2 Omni,覆盖文本生成、图像处理、语音识别及多模态推理等任务。同时推出 Nova Forge 服务,允许企业客户基于 AWS 预训练模型进行定制化开发,解决现有数据与预训练模型融合难题。

来源:TechCrunch AI

00:00

Simular的AI代理希望为您管理Mac和Windows电脑

Simular的AI代理希望为您管理Mac和Windows电脑

Simular,一家专注于为Mac OS和Windows构建AI代理的初创公司,已筹集2150万美元A轮融资。与控制浏览器不同,Simular直接控制PC,执行复杂任务如数据复制粘贴等。其技术结合了深度学习与神经符号计算,旨在解决LLM幻觉问题,通过用户修正锁定成功轨迹,使任务可重复且确定性高。创始人背景包括Google DeepMind,具备连续学习与强化学习专长。

来源:TechCrunch AI

12月 2日
17 条新闻
23:37

Mistral以新开放权重前沿和小型模型逼近大型AI竞争对手

Mistral以新开放权重前沿和小型模型逼近大型AI竞争对手

法国AI初创公司Mistral发布了其新系列的Mistral 3开放权重模型,包括一个具有多模态和多语言能力的大规模前沿模型及九个可离线运行、完全可定制的小型模型。这些模型旨在满足企业级应用需求,通过精细化调整实现更高效的任务处理。Mistral强调,在实际应用场景中,小型模型经过调优后可以匹敌甚至超越大型封闭源模型的表现,尤其在成本控制与性能优化方面展现出优势。

来源:TechCrunch AI

22:29

谷歌卷土重来:你大爷还是你大爷

谷歌卷土重来:你大爷还是你大爷

谷歌凭借自研TPU芯片及Gemini-3模型,在AI领域强势回归,挑战英伟达GPU的垄断地位。TPU作为专用ASIC芯片,在特定AI任务上展现出更高效率与成本优势,吸引Meta等大客户考虑转向。尽管如此,英伟达依靠其成熟的CUDA生态及其他防御性布局仍保持较强竞争力。此事件反映了AI产业中通用与专用芯片之争,以及对算力效率和成本控制的关注。

来源:36氪

22:29

AI泡沫原罪:英伟达是AI戒不掉的“毒丸”?

AI泡沫原罪:英伟达是AI戒不掉的“毒丸”?

本文通过分析AI产业链核心公司的财务状况,揭示了AI投资热潮下的利润分配不均问题。在AI基建初期,云服务商面临高昂的前期投入与实际现金流紧张的矛盾;算力提供商如英伟达因垄断地位获利丰厚;而下游应用商如OpenAI则因收入增长速度不及成本增加速度而陷入亏损。文章指出,这种利润分配模式导致了整个AI产业生态链的不稳定,需要通过技术创新和商业模式优化来解决。

来源:36氪

19:24

退货率可达40%的AI眼镜,还是门好生意吗?

智能眼镜赛道在2025年末迎来激烈竞争,各大科技公司纷纷推出AI眼镜产品,价格持续下探至1500元左右。尽管销量增速显著,但高退货率反映了用户需求与技术瓶颈之间的差距。当前AI眼镜主要应用于便捷拍摄等场景,但在续航、AI功能实用性及网络连接稳定性方面存在不足。行业正经历残酷洗牌,企业需加速技术创新和生态建设以应对未来挑战。

来源:36氪

19:24

豆包的AI助手江湖

豆包的AI助手江湖

字节跳动推出搭载豆包AI助手的工程样机M153,标志着其在端侧多模态生成式AI应用上的重要进展。该手机助手通过高通骁龙8至尊版芯片支持,实现了自动语音识别、大语言模型交互等功能,展示了长文本处理、记忆及个性化服务等技术能力。与努比亚合作,豆包尝试了从工具到助理的角色转变,强调体验功能而非硬件性能的竞争。这表明,在AI助手领域,软件与硬件正在共同进化,以满足用户对于便捷交互的需求。

来源:36氪

18:22

这下Altman急了,OpenAI紧急启动「红色警报」

这下Altman急了,OpenAI紧急启动「红色警报」

OpenAI 面临谷歌等竞争对手的强势复苏,宣布进入红色警报状态,将集中资源改进ChatGPT。尽管过去一年中OpenAI在多模态、智能体等领域进行了广泛探索,但产品后续发展乏力。为应对挑战,OpenAI计划发布新推理模型,优化图像生成能力,并加强个性化互动与模型行为,以提升用户体验和竞争力。

来源:36氪

18:22

数据中心,电力告急

数据中心,电力告急

随着AI算力需求激增,数据中心电力消耗问题日益突出。高盛报告指出,美国AI发展面临的主要障碍是电力供应。初创公司如PowerLattice和Empower正致力于研发高效电源管理芯片,旨在减少能耗并提升计算效率,预计未来几年内将实现千兆瓦级别的能源节省。同时,第三代半导体材料GaN与SiC的应用,以及800V高压直流架构的推广,将进一步推动AI基础设施向更高效、更环保的方向发展。

来源:36氪

17:56

Runway Gen-4.5刷屏发布,把重量尘土和光影都做对了,网友:颠覆

Runway Gen-4.5刷屏发布,把重量尘土和光影都做对了,网友:颠覆

Runway Gen-4.5在文本转视频基准测试中以1247分超越所有现有模型,实现物理和视觉准确性突破。该模型擅长执行复杂序列式指令,生成的视频具有逼真的重量感与动量特征,适用于多种风格和场景。尽管存在因果推理等局限性,Gen-4.5展示了AI在多模态融合及内容生成领域的显著进步。

来源:量子位

16:52

商汤分拆了一家AI医疗公司,半年融资10亿,剑指“医疗世界模型”

商汤分拆了一家AI医疗公司,半年融资10亿,剑指“医疗世界模型”

商汤分拆的AI医疗公司半年内融资10亿,目标构建‘医疗世界模型’,以实现对医疗场景的全面感知与深度理解。其自研大语言模型‘大医®’在专业测试中表现优异,结合多模态基础模型群和双中台架构,形成数据-模型-场景-产业闭环。已在病理、影像等多个临床方向上线40余款AI模块,并与多家医院及企业合作,推动智慧医院建设。

来源:量子位

16:18

马斯克开「AI救国猛药」:3年解决美38万亿国债危机

马斯克开「AI救国猛药」:3年解决美38万亿国债危机

马斯克提出AI和机器人可在三年内解决美国债务危机,通过提高生产效率和降低劳动成本实现通缩。他强调旗下公司Tesla、SpaceX、xAI及Starlink正形成一个以AI为核心的技术体系,涵盖自动驾驶、真实世界AI、太空通信等。长期来看,AI与机器人将极大丰富物质供给,使货币失去意义,工作成为兴趣选择。此外,孙正义看好AI未来潜力,尽管抛售英伟达股票,但仍致力于投资AI领域。

来源:36氪

16:18

V3.2逼近Gemini 3,DeepSeek硬气喊话:接下来我要堆算力了

V3.2逼近Gemini 3,DeepSeek硬气喊话:接下来我要堆算力了

DeepSeek发布V3.2和V3.2-Speciale,证明了通过优化方法和数据而非单纯扩大模型规模来解决训练后瓶颈的可行性。V3.2引入稀疏注意力机制DSA,提高效率并融合思考与工具调用;Speciale则专注于深度推理,验证了过程监督可泛化至多个领域。两者共同展示了未来AI模型可能不再依赖人力堆砌,而是依靠自我博弈实现持续演进的趋势。

来源:36氪

16:18

五年,终于等来Transformers v5

五年,终于等来Transformers v5

Transformers v5 发布首个 RC 版本,标志着该 AI 基础设施库正式从 v4 升级至 v5。此次更新聚焦于极致简洁性、预训练支持、高性能推理引擎互操作性及量化提升为核心功能。Transformers 作为领先的模型定义库,通过持续演进保持其在人工智能领域的相关性与领先优势,进一步推动了多模态模型的发展,并加强了与各类推理引擎的兼容性,为未来AI技术的应用提供了坚实的基础。

来源:36氪

09:04

ChatGPT 三周年遭 DeepSeek 暴击,23 页技术报告藏着开源登顶的全部秘密

ChatGPT 三周年遭 DeepSeek 暴击,23 页技术报告藏着开源登顶的全部秘密

DeepSeek 发布了两款新模型 V3.2 和 V3.2-Speciale,分别在推理能力和工具调用方面取得突破。V3.2 引入稀疏注意力机制 DSA,显著提升了处理长文档的效率和性能;同时通过强化学习训练框架,实现了边思考边使用工具的能力,适用于日常问答、写作等场景。V3.2-Speciale 则面向高级任务,性能媲美 Gemini-3.0-Pro,但在成本和实用性上有所妥协。

来源:36氪

09:03

OpenAI危,DeepSeek放大招:追平谷歌最强,手撕GPT-5 High

OpenAI危,DeepSeek放大招:追平谷歌最强,手撕GPT-5 High

DeepSeek发布V3.2正式版,性能全面超越GPT-5 High,与谷歌Gemini-3.0 Pro持平。新模型凭借DSA稀疏注意力架构,在数学编程等多领域取得4项国际奥赛金牌级成绩,打破了速度、成本与智能的不可能三角。通过思维上下文管理和虚拟演练场训练,V3.2实现了高效推理与工具使用的无缝结合,展示了在有限算力下实现强智能的新路径。

来源:36氪