AI新闻

已选标签:
AI智能体
多模态AI
12月 6日
1 条新闻
01:40

华为新架构砍了Transformer大动脉!任意模型推理能力原地飙升

华为新架构砍了Transformer大动脉!任意模型推理能力原地飙升

华为诺亚方舟实验室提出Nexus架构,通过高阶注意力机制有效解决了Transformer在复杂逻辑推理任务中的不足。该架构在不增加参数量的情况下,显著提升了模型的推理能力。实验显示,无论是小模型还是大模型,采用Nexus后,在数学和科学等需要多步推理的任务上均有明显性能提升,展示了其在提升AI推理能力方面的巨大潜力。

来源:量子位

12月 5日
19 条新闻
23:27

Meta与出版商签署商业AI数据协议,以在Meta AI平台上提供实时新闻

Meta与出版商签署商业AI数据协议,以在Meta AI平台上提供实时新闻

Meta与多家新闻出版商签署AI数据协议,通过其AI聊天机器人提供实时全球、娱乐和突发新闻。该举措旨在提升Meta AI的响应速度、准确性和平衡性,让用户从不同来源获取及时相关信息。此举也反映了Meta在面临竞争加剧时,希望通过增强AI聊天机器人的功能来吸引更多用户,并保持在AI领域的竞争力。

来源:TechCrunch AI

21:17

无情淘汰PPT选手,美国AI创业圈,PhD才是敲门砖

当前AI创业趋势显示,博士头衔正成为新的创业者‘敲门砖’,取代了过去的MBA学位。这些年轻(中位年龄29岁)且技术深厚的创始人,通常来自顶尖学府,如MIT、斯坦福大学等,他们领导的小而高效的团队,在成立初期就能迅速找到市场定位并实现收入规模化。报告还指出,与过去不同,如今的AI创业者更倾向于技术思维而非商业导向,这反映了‘技术本身就是产品’的趋势。

来源:36氪

20:14

65岁LeCun被卷回巴黎老家,与小扎一刀两断,曝光神秘AI初创

图灵奖得主Yann LeCun离职Meta,计划创业专注于高级机器智能,基于视觉等感官信息训练AI以理解物理世界。LeCun认为大语言模型虽强大但已触及天花板,缺乏对物理世界的理解和长期记忆能力,提出构建非生成式的联合嵌入预测架构(JEPA)作为未来方向。他强调真正的智能需要能够与环境互动并进行多步推理的世界模型。

来源:36氪

20:13

高途终于缓过来了

高途在AI转型中遭遇困境,尽管提出“All with AI”战略,但其将AI视为辅助工具而非教育核心引擎的定位,导致产品如“智能阿祖”、“AI提分宝”等未能满足市场需求。高途过度依赖传统营销与师资力量,忽视了AI技术在个性化学习和场景化解决方案中的潜力,研发投入不足,进一步加剧了其在AI教育领域的落后。

来源:36氪

19:10

保守的谷歌,激进的豆包

本文探讨了豆包手机助手在AI智能助手领域的激进方案及其面临的挑战。豆包通过GUI Agent技术直接操作用户界面,引发安全与合规问题。相比之下,谷歌、OPPO和支付宝等采取更为谨慎的合作方式,强调用户授权与数据安全。未来,AI技术的发展需在尊重用户隐私、数据安全及行业监管的前提下进行,以实现技术创新与商业落地的良性适配。

来源:36氪

19:10

当 AI 撞上移动互联网的旧城墙

豆包AI手机尝试通过大模型LUI技术和计算机视觉,实现意图识别取代APP图形界面的交互革命,展示了AI在智能助手领域的潜力。然而,该技术因触及数据安全、隐私边界及商业利益分配等问题而遭遇微信等平台封禁,揭示了AI应用在移动互联网生态中的复杂挑战。

来源:36氪

19:10

李斌可以造手机,李想为什么不能做AI眼镜?

理想汽车推出AI眼镜Livis,售价1999元起,具备语音控车、第一视角拍摄等功能。该产品基于自研VLA模型,强调与车辆的协同工作能力,定位为‘理想最好的人工智能附件’。李想视其为构建AI终端生态的第一步,目标是将‘理想同学’AI助手的能力从车内扩展至日常生活场景。尽管面临经营挑战,但理想汽车仍致力于成为具身智能领域的领导者。

来源:36氪

18:06

具身智能不要走那条自动驾驶的老路

文章探讨了具身智能领域内公关行为的粗放现象,指出企业间通过片面性能参数对比进行非对然竞争,忽视了技术本质。强调真正的行业地位来源于硬件自研能力和核心算法优异性而非社交媒体上的传播声量。呼吁行业内应减少无效竞争,回归技术创新与积累,以维护产业健康发展。

来源:36氪

18:06

400亿机器人、6万亿参数的Grok 5:马斯克访谈中的AI终局与人类意义

马斯克预测未来全球将有300-400亿台人形机器人,并首次通过Grok 5模型看到了实现通用人工智能(AGI)的可能,尽管概率仅为10%。特斯拉正在研发的AI5芯片目标是性能超越英伟达2到3倍且成本降低至十分之一,这将是Optimus人形机器人的核心。此外,马斯克还提出了一个“没有App”的未来世界愿景,其中手机将成为AI推理边缘节点,由AI处理所有交互,预计五年内实现。

来源:36氪

18:06

谷歌IMO金牌级Gemini 3深夜上线,华人大神挂帅,OpenAI无力反击

谷歌DeepMind发布Gemini 3 Deep Think,该模型在解决复杂数学、科学难题上表现出色,特别是在并行推理能力方面实现了突破。在多项基准测试中,如HLE和ARC-AGI-2上取得领先成绩。此外,Deep Think还展示了强大的3D场景创建与物理效果模拟能力。同时,谷歌宣布由华人科学家Yi Tay领导的新加坡团队将专注于高级推理及前沿模型研发,旨在推动AGI的发展。

来源:36氪

16:01

谷歌最强大模型付费上线,在DeepSeek开源后被吐槽太贵

谷歌发布Gemini 3 Deep Think,该模型在复杂推理、数学和科学问题解决方面显著提升。其多轮迭代推理能力支持更精细的代码生成与原型设计,在多项基准测试中取得SOTA成绩。然而,高昂的价格(Ultra会员月费249.9美元)及仅限特定用户群体使用引发了争议,反映出开源模型对封闭商业模型带来的挑战。

来源:36氪

16:01

Ilya刚预言完,世界首个原生多模态架构NEO就来了:视觉和语言彻底被焊死

NEO,全球首个开源原生多模态架构,由中国研究团队推出。与传统模块化多模态模型不同,NEO采用统一的视觉-语言一体化设计,通过原生图块嵌入、三维旋转位置编码和多头注意力机制等创新技术,实现高效训练及卓越性能。仅用十分之一的数据量,其在多项评测中超越了依赖大规模数据的传统大模型,尤其适合边缘计算场景,为未来多模态AI发展提供了新路径。

来源:36氪

16:00

五问百“镜”大战:手机就能干,为啥要买它?

2025年末,AI智能眼镜市场竞争激烈。理想、百度、阿里等企业纷纷推出新品,功能涵盖超高清拍照、AI翻译及导航等。当前各厂商主要聚焦硬件性能如拍摄能力与佩戴舒适度,AI功能尚未成为核心差异化因素。产品形态分为第一视角拍照与带显示的单绿双目光波导两种。未来,随着技术成本降低和用户体验优化,预计3-5年内AI/AR眼镜将进入消费主流。

来源:36氪

16:00

商汤科技贾安亚:企业AI要落地,业务目标与行业理解重于模型本身 | WISE2025商业之王大会

商汤科技贾安亚在WISE2025商业之王大会上指出,AI企业应用正从IT部门主导转向业务驱动模式,聚焦于供应链、人事等容错率较高且能产生显著价值的场景。随着多模态技术成熟及软硬结合带来的成本优化,AI将演变为深度融合企业数据流程的系统化解决方案,而不仅仅是孤立模型。

来源:36氪