AI新闻

已选标签:
生成模型
多模态AI
12月 6日
17 条新闻
21:36

Ilya刚预言完,世界首个原生多模态架构NEO就来了:视觉和语言彻底被焊死

Ilya刚预言完,世界首个原生多模态架构NEO就来了:视觉和语言彻底被焊死

NEO,全球首个开源原生多模态架构,由商汤科技与南洋理工大学等联合研发。它通过三大创新技术——原生图块嵌入、三维旋转位置编码及多头注意力机制,实现了视觉与语言的深度融合,仅用十分之一训练数据即在多项评测中追平甚至超越GPT-4V等顶级模型。NEO展示了下一代AI竞争力的关键在于架构创新而非单纯规模扩大,并且其高效性能和较低成本使得强大的多模态能力可普及至边缘设备,如手机、机器人等。

来源:量子位

17:59

豆包手机助手否认可以直接查询银行卡余额

豆包手机助手发布声明称,网传“豆包手机助手可以直接查询银行卡余额,并跳过认证读取用户信息”为谣言。其仅在用户的要求与授权下帮助用户查询银行卡余额,其中涉及敏感操作,需用户手动确认。据介绍,豆包手机助手在用户授权操作的过程中,并不存在系统权限可以直接跳过密码、人脸识别等类似认证环节,查询过程中仍需用户手动完成符合银行App要求的真人检测、密码输入等。声明还提到,现阶段,银行、互联网支付等金融场景,直接关系用户的资金安全,即便相关敏感操作时手机助手都需用户授权,但审慎起见,豆包手机助手已下线操作这类APP的能力。(广角观察)

来源:钛媒体

14:10

英伟达巧用8B模型秒掉GPT-5,开源了

英伟达巧用8B模型秒掉GPT-5,开源了

英伟达与香港大学合作开源的Orchestrator-8B模型,通过创新的ToolOrchestra训练方法,在人类终极考试HLE中得分超越GPT-5,且成本更低、运行速度更快。该模型采用强化学习和定制数据集进行训练,能够精准协调使用各类工具,包括顶级大模型及专业数学工具等,实现高效的问题解决。这一成果表明,小模型结合工具编排可能是未来AI发展的新趋势,提供了低成本高智能的解决方案。

来源:量子位

11:47

OpenAI被曝最快将于下周二发布GPT-5.2

据报道,作为对谷歌与Anthropic加速竞争的首次“应急式”回应,OpenAI正准备推出其最新的GPT-5.2,当前内部计划的发布日期为12月9日,较原定的12月下旬计划明显提前。知情人士称,GPT-5.2应该能弥补谷歌上个月发布Gemini 3所拉开的差距。目前,Gemini 3在多项评测中名列前茅,并引起了Altman与马斯克的关注。本周早些时候,OpenAI首席执行官Sam Altman宣布公司进入“红色警报 (code red)”状态,以快速应对来自谷歌Gemini 3和Anthropic等竞争对手带来的日益增长的压力。随后,Altman在内部评估中表示,即将推出的GPT-5.2在推理能力上将“领先于谷歌的Gemini 3”。(广角观察)

来源:钛媒体

11:46

2年内AI生成世界90%知识!老黄2小时重磅访谈「剧透」未来

2年内AI生成世界90%知识!老黄2小时重磅访谈「剧透」未来

黄仁勋在访谈中强调了AI发展对能源的巨大需求,指出未来算力中心可能需要配套小型核反应堆。他预测2-3年内90%的知识将由AI生成,并提出了”通用高收入”概念,认为AI时代的工作将更侧重于体验和判断而非简单任务。此外,他还讨论了AI的安全性与意识问题,认为目前的AI更像是一个没有自我意识的“通用函数近似器”。

来源:36氪

11:39

14岁华人小孩,折个纸成美国天才少年

14岁华人小孩,折个纸成美国天才少年

14岁华裔少年Miles Wu通过创新折纸设计,斩获JIC青少年创新挑战赛最高奖。他提出的三浦折叠变体能够承受自身重量的10000倍,展示了在应急避难所等领域的应用潜力。此案例突显了AI技术在辅助设计、优化结构性能方面的可能性,以及未来在多模态融合与智能材料开发中的发展趋势。

来源:量子位

11:33

智能体A2A落地华为新旗舰,鸿蒙开发者新机遇来了

智能体A2A落地华为新旗舰,鸿蒙开发者新机遇来了

华为Mate80系列与MateX7搭载鸿蒙6系统,首次实现A2A(Agent to Agent)智能体协作商用落地,通过自然语言交互打破应用间壁垒,提升服务效率。HarmonyOS 6采用意图框架Intents Kit和统一通信协议,构建了高效协作机制,并提供HMAF框架简化智能体开发流程。此外,华为推出10亿人民币的“天工计划”支持AI生态创新,加速全行业向Agentic AI时代转型。

来源:量子位

10:55

《三体》“宇宙闪烁”成真!免佩戴裸眼3D屏登Nature

《三体》“宇宙闪烁”成真!免佩戴裸眼3D屏登Nature

最新Nature论文介绍了一种名为EyeReal的裸眼3D显示技术,由复旦大学26岁博士生领衔开发。该技术结合了计算光学与深度学习,通过动态空间-带宽积利用策略和全卷积神经网络实现了大视角、高分辨率的3D显示效果,解决了传统裸眼3D技术中存在的视角窄、画质差等问题。其创新性地使用了三层TFT-LCD面板加AI控制的相位调制方法来实现精准的光场重建,为未来虚拟现实及增强现实应用提供了新的解决方案。

来源:量子位

10:38

知名数学家辞职投身AI创业:老板是00后华人女生

知名数学家辞职投身AI创业:老板是00后华人女生

世界级数学家小野肯辞职加入AI初创公司Axiom,与学生洪乐潼共同推动AI在数学领域的应用。Axiom致力于开发能够解决复杂数学问题的AI模型,为量化和对冲基金提供支持。小野肯将负责指导模型优化及性能评估,利用其深厚的数学背景帮助AI系统更好地理解和解决数学难题,预示着AI技术在高阶数学推理方面的新突破。

来源:量子位

09:41

好莱坞的鱼头终于朝向了奈飞

好莱坞的鱼头终于朝向了奈飞

奈飞以827亿美元收购华纳兄弟,标志着流媒体巨头在内容产业中的话语权进一步集中。此次并购不仅涉及电影电视工作室和HBO Max等资产,还反映了AI技术在内容推荐、个性化定制及广告投放等方面的应用前景。未来,随着AI技术的不断进步,尤其是在多模态处理与自然语言理解方面的能力提升,预计将推动流媒体平台在用户互动体验上的创新,并对传统院线模式构成挑战。同时,也引发了关于数据安全、算法偏见以及行业垄断等问题的关注。

来源:36氪

08:39

开源和闭源模型的差距在拉大:这是DeepSeek论文揭示的残酷真相

开源和闭源模型的差距在拉大:这是DeepSeek论文揭示的残酷真相

DeepSeek 发布 V3.2 技术报告,指出开源大模型与闭源模型的性能差距在扩大。报告通过对比测试显示,开源模型在复杂任务上明显落后于闭源模型。论文分析了三个关键问题:传统注意力机制效率低、后训练资源投入不足、AI Agent 能力滞后,并提出相应解决方案,包括引入 DSA 机制、增加后训练预算和开发系统化任务合成流程,显著缩小了与闭源模型的差距。

来源:36氪

07:38

消息来源:AI合成研究初创公司Aaru以10亿美元的“头条”估值完成A轮融资

消息来源:AI合成研究初创公司Aaru以10亿美元的“头条”估值完成A轮融资

Aaru 利用AI模拟用户行为,提供即时客户研究服务,其A轮融资由Redpoint Ventures领投,采用多层级估值机制,部分股权以10亿美元估值成交。Aaru通过生成数千个AI代理模拟人类行为,取代传统市场调研方式,预测特定人群对事件的反应,已成功预测纽约民主党初选结果。Aaru与CulturePulse、Simile等社交模拟初创公司竞争,并在快速成长中。

来源:TechCrunch AI

05:02

Meta收购AI设备初创公司Limitless

Meta收购AI设备初创公司Limitless

Meta收购AI初创公司Limitless,后者曾推出AI驱动的可穿戴设备以记录对话。尽管Limitless将停止销售硬件并逐步减少服务,但其团队将助力Meta开发AI赋能的可穿戴设备,特别是AR/AI眼镜领域,加速实现个人超级智能愿景。此举反映了AI硬件市场竞争加剧及大型科技公司在该领域的布局趋势。

来源:TechCrunch AI

01:40

华为新架构砍了Transformer大动脉!任意模型推理能力原地飙升

华为新架构砍了Transformer大动脉!任意模型推理能力原地飙升

华为诺亚方舟实验室提出Nexus架构,通过高阶注意力机制有效解决了Transformer在复杂逻辑推理任务中的不足。该架构在不增加参数量的情况下,显著提升了模型的推理能力。实验显示,无论是小模型还是大模型,采用Nexus后,在数学和科学等需要多步推理的任务上均有明显性能提升,展示了其在提升AI推理能力方面的巨大潜力。

来源:量子位

12月 5日
3 条新闻
23:27

Meta与出版商签署商业AI数据协议,以在Meta AI平台上提供实时新闻

Meta与出版商签署商业AI数据协议,以在Meta AI平台上提供实时新闻

Meta与多家新闻出版商签署AI数据协议,通过其AI聊天机器人提供实时全球、娱乐和突发新闻。该举措旨在提升Meta AI的响应速度、准确性和平衡性,让用户从不同来源获取及时相关信息。此举也反映了Meta在面临竞争加剧时,希望通过增强AI聊天机器人的功能来吸引更多用户,并保持在AI领域的竞争力。

来源:TechCrunch AI

21:17

无情淘汰PPT选手,美国AI创业圈,PhD才是敲门砖

当前AI创业趋势显示,博士头衔正成为新的创业者‘敲门砖’,取代了过去的MBA学位。这些年轻(中位年龄29岁)且技术深厚的创始人,通常来自顶尖学府,如MIT、斯坦福大学等,他们领导的小而高效的团队,在成立初期就能迅速找到市场定位并实现收入规模化。报告还指出,与过去不同,如今的AI创业者更倾向于技术思维而非商业导向,这反映了‘技术本身就是产品’的趋势。

来源:36氪

20:14

深度复盘2025年C端卡位战:阿里猛攻,字节守擂,最焦虑的或是腾讯

字节跳动通过将豆包大模型融入手机操作系统,颠覆了AI助手的传统迭代模式。此举引发市场广泛关注,并对阿里等竞争对手造成压力,促使阿里加速推进其AI产品千问的研发与推广。腾讯元宝在经历短暂增长后面临用户活跃度下降的问题,正积极调整策略以增强其AI产品的竞争力。整体来看,2025年C端AI市场竞争激烈,各大厂商纷纷加大投入力度,在模型能力、应用场景及成本控制等方面寻求突破。

来源:36氪