AI新闻

已选标签:
多模态AI
自动驾驶
11月 28日
10 条新闻
18:50

小米狂吸机器人技术大牛,前特斯拉Optimus工程师也来了

小米狂吸机器人技术大牛,前特斯拉Optimus工程师也来了

小米机器人团队引入前特斯拉Optimus灵巧手核心成员卢泽宇,加速灵巧手技术工程化落地。此举显示了小米在提升机器人灵巧性上的雄心,旨在为未来人形机器人奠定基础。同时,小米开源了首个跨域具身大模型MiMo-Embodied,成功融合自动驾驶与具身智能任务,标志着其在多模态模型和应用场景创新上取得重要进展。

来源:36氪

18:49

谷歌CTO兼首席AI架构师揭秘:谷歌如何用两年半完成AI逆袭

谷歌CTO兼首席AI架构师揭秘:谷歌如何用两年半完成AI逆袭

Gemini 3聚焦于精准意图理解、全球化服务及工具化创造能力,强调AI技术的实际应用价值而非单纯追求基准测试分数。通过自然语言编程打破创意与实现壁垒,推动AGI需与现实世界持续交互。文本与视觉模型共享底层架构以增强人类直觉交互体验。谷歌从实验室思维转向战场思维,每六个月迭代更新,激活全球专家资源,实现端到端协同。

来源:36氪

17:47

“AI新王”强势崛起,2027年谷歌TPU外销量或达100万颗

谷歌通过对外销售自研AI芯片TPU,有望显著提升其销售额和盈利。摩根士丹利预测,若谷歌售出约50万颗TPU,2027年云收入将增加130亿美元,每股收益增长3%。此举标志着谷歌战略转变,从内部使用转向市场推广,尽管存在商业模式、定价策略及工作负载承载能力的不确定性。同时,谷歌大模型Gemini 3获得好评,进一步推动其在AI领域的竞争地位。

来源:36氪

17:28

视频理解霸榜!快手Keye-VL旗舰模型重磅开源,多模态视频感知领头羊

视频理解霸榜!快手Keye-VL旗舰模型重磅开源,多模态视频感知领头羊

快手发布Keye-VL-671B-A37B多模态大语言模型,显著提升视觉感知与复杂推理能力。该模型在图像语义理解、视频细节把握等方面表现出色,通过多阶段预训练和后训练策略,实现了对日常场景及高难任务的精准解析。开源版本已上线,未来将融合更多Agent能力,推动AI向更智能形态发展。

来源:量子位

16:44

不止硅谷十万大裁员,Hinton警告:AI正以最糟糕方式颠覆社会

不止硅谷十万大裁员,Hinton警告:AI正以最糟糕方式颠覆社会

AI技术快速发展,特别是大语言模型和多模态处理能力的提升,正引发社会深刻变革。专家Hinton警告称,AI可能导致大规模失业和社会解体,但同时也强调其在医疗、教育等领域的巨大潜力。亚马逊等科技巨头通过裁员为AI发展腾出空间,引发了对AI伦理和控制权的广泛讨论。

来源:36氪

14:39

AI 霸主谷歌的反击:为什么说 4 万亿市值只是一个开始?

AI 霸主谷歌的反击:为什么说 4 万亿市值只是一个开始?

谷歌凭借Gemini 3和Nano Banana Pro在AI领域取得重大进展,尤其通过TPU算力集群,在推理成本控制上占据优势。Gemini 3展示了强大的多模态处理能力,适用于复杂任务如代码理解和视频分析。Nano Banana Pro则优化了移动设备上的AI应用。这些技术突破结合谷歌庞大的用户基础,为其在AI时代的全栈主权提供了坚实支持。

来源:36氪

14:39

80后诺奖得主:AlphaFold下一步融合大模型

80后诺奖得主:AlphaFold下一步融合大模型

AlphaFold在问世五周年之际,设计者John Jumper提出其下一步将与大模型融合,以提升科学文献数据处理和推理能力。自2020年推出以来,AlphaFold已帮助全球超过300万研究人员预测数亿种蛋白质的三维结构,推动了从心血管疾病到蜜蜂抗病性等多个领域的突破。未来,AlphaFold计划结合更广泛的AI技术,不仅限于结构预测,还将涉及假设生成、实验设计等复杂任务,进一步深化AI在生命科学中的应用。

来源:36氪

11:33

刚刚,DeepSeek开源新模型,拿下奥数证明题冠军

刚刚,DeepSeek开源新模型,拿下奥数证明题冠军

DeepSeek开源了具备强大定理证明能力的模型DeepSeekMath-V2,该模型在多项国际数学竞赛中取得金牌水平的成绩。通过强化学习和自我验证机制,DeepSeekMath-V2不仅能够生成证明还能进行自我评估与修正,标志着AI向解决研究级数学问题迈进了一大步。此研究展示了基于大语言模型开发可自我验证的数学推理系统是可行的方向,为未来复杂推理任务提供了新的思路。

来源:36氪

10:31

图灵奖得主 Yann LeCun:大模型是“死胡同”,下一步押在哪一条路?

图灵奖得主Yann LeCun宣布离开Meta,创立新公司专注于Advanced Machine Intelligence(AMI),特别是世界模型的研究。LeCun认为大语言模型在理解和推理物理世界上存在局限性,提出JEPA架构作为替代方案,强调AI需具备对物理世界的理解与行动能力。同时,OpenAI前首席科学家Ilya Sutskever也表达了类似观点,但更关注AI的安全性和可控性。这标志着后LLM时代正逐渐形成,预示着从单纯追求模型规模转向架构创新与安全控制的新趋势。

来源:36氪

09:29

阿里入“镜”,夸克叩门

阿里入“镜”,夸克叩门

阿里夸克发布6款AI眼镜,涵盖S1和G1两大系列,旨在成为AI入口,整合千问大模型及阿里生态核心场景。产品定位为全天候智能终端,具备24小时续航能力,并支持支付宝、高德地图等应用。此举措标志着阿里在智能硬件领域的新尝试,通过轻量级载体推动AI能力从手机向物理世界延伸,争夺下一代人机交互主导权。

来源:36氪

11月 27日
10 条新闻
22:16

10000个代码文件,我打几把游戏的功夫就搞成Wiki了!

10000个代码文件,我打几把游戏的功夫就搞成Wiki了!

Qoder AI编程工具通过强大的多模态模型与专项自研模型结合,实现了对复杂代码工程的高效理解与处理。其Repo Wiki功能能够自动将大型项目转化为结构清晰的Wiki文档,极大提升了代码审查效率及团队协作能力。支持IDE、CLI和JetBrains插件三种形态,满足不同开发者需求。特别在真实软件研发领域展现出卓越性能,包括快速检索大量代码文件、智能问答、由自然语言驱动的任务执行等,为AI辅助编程树立了新标杆。

来源:量子位

22:13

DeepSeek发布可自验证数学模型DeepSeekMath-V2

DeepSeek推出新型数学推理模型DeepSeekMath-V2,采用可自我验证的训练框架。该模型基于DeepSeek-V3.2-Exp-Base构建,通过LLM验证器自动审查生成的数学证明,并利用高难度样本持续优化性能。在IMO 2025和CMO 2024中均达到金牌水平,Putnam 2024获118/120分。团队表示,该成果验证了自验证推理路径的可行性,为构建可靠数学智能系统提供新方向。模型代码与权重已开源,发布于Hugging Face及GitHub平台。(广角观察)

来源:钛媒体

21:10

美国宣战,AI曼哈顿计划打响第一枪,“AI科学家”成最新核武器

美国宣战,AI曼哈顿计划打响第一枪,“AI科学家”成最新核武器

美国启动”创世纪计划”,旨在通过AI加速科研创新,将其深度嵌入科学假设提出、实验设计及数据分析等环节。该计划强调AI需生成可验证的结果,并与传统物理模型结合以提升预测准确性。同时,神经符号AI的融合被视为迈向人类级智能的关键路径之一。此战略不仅促进科研生产力跃升,还推动了跨学科协作和数据标准化,为实现通用人工智能(AGI)奠定基础。

来源:36氪

20:08

女频化、抽卡师、全面出海:AI漫剧的十大趋势

女频化、抽卡师、全面出海:AI漫剧的十大趋势

AI技术正在重塑动漫行业,通过深度学习和计算机视觉等技术,AI漫剧以低成本、高效率的方式颠覆了传统动画制作模式。各大平台如抖音、快手、B站等纷纷推出扶持计划,促进内容创新与人才挖掘。AI漫剧不仅在题材上实现了多元化尝试,还探索了新的付费模式,并开始布局海外市场。此外,随着AI技术的进步,新型职业如’抽卡师’应运而生,进一步提高了生产效率。

来源:36氪

19:07

靠「指指点点」做完整套海报,第一次觉得做设计不难了

靠「指指点点」做完整套海报,第一次觉得做设计不难了

新兴AI设计工具Lovart凭借自然语言操作、风格统一的设计能力和高效修改体验,迅速成为Canva和Figma等传统设计工具的替代者。其接入的‘地表最强’图像模型Nano Banana进一步提升了生成图像的质量与一致性。通过创新的ChatCanvas交互模式,用户可直接在画布上进行精准修改,极大提高了设计效率。此外,Lovart还支持多模态任务如视频生成,展示了AI在创意产业中的广泛应用潜力。

来源:36氪

19:06

谷歌重启AI眼镜:富士康代工,三星设计,或2026Q4发布丨智能涌现独家

谷歌重启AI眼镜:富士康代工,三星设计,或2026Q4发布丨智能涌现独家

谷歌正推进两个AI眼镜项目,预计2026年Q4发布。项目采用富士康代工、三星参考设计及高通芯片,并计划配备波导片光学方案与摄像头。基于Gemini AI模型,整合自然语言理解、多模态推理等能力,将应用于物流、医疗培训等领域。谷歌在操作系统、内容生态和AI大模型方面布局完善,成为AI眼镜领域强有力的竞争对手。

来源:36氪

18:05

中信建投:对AI带动的算力需求以及应用非常乐观

中信建投证券近日发布研报称,目前世界正处于AI产业革命中,类比工业革命,影响深远,不能简单对比近几年的云计算、新能源等,需要以更长期的视角、更高的视野去观察。中信建投表示,对AI带动的算力需求以及应用非常乐观。其中,AI算力板块涉及先进制程、GPU/ASIC、光模块、PCB、服务器、交换机、光器件、铜连接、IDC及其配套(液冷、电源、电力、综合布线等)等,市值仍有空间。此外,AI大模型及应用也应高度关注。中信建投认为,AI算力大投入的背后需要大模型实现商业变现和闭环,建议要关注核心大模型公司。(广角观察)

来源:钛媒体

18:04

Gemini 3两小时淘汰ChatGPT,硅谷大佬倒戈:我回不去了

Gemini 3两小时淘汰ChatGPT,硅谷大佬倒戈:我回不去了

谷歌发布Gemini 3大模型,引发硅谷AI大佬集体赞誉。该模型在推理、速度及多模态处理方面表现出色,被视为谷歌强势回归AI领域的标志。Gemini 3不仅能够编写代码、设计界面,还能自主完成复杂任务如原创研究,标志着从聊天机器人向全能智能体的转变。其成功整合进搜索业务,推动了Alphabet市值接近4万亿美元,显示了商业落地的巨大潜力。

来源:36氪

18:04

你还在晒AI图,有人已经在靠“提示词”收款了

你还在晒AI图,有人已经在靠“提示词”收款了

即梦4.0通过多模态统一架构、一致性算法和4K高清生成等技术,显著提升了AI生成图片的真实感与细腻度,特别是在人物眼神和表情的处理上达到了前所未有的水平。该工具不仅降低了用户创作高质量图像的门槛,还催生了提示词交易这一新兴市场。这标志着我们正步入一个“所想即所得”的时代,AI技术正在改变人们记录生活的方式,并逐渐成为一种新的社交货币。

来源:36氪

18:04

扎克伯格聊新款Ray-Ban:眼镜会成下一代计算平台?Neural Band才是真的「疯狂」

扎克伯格聊新款Ray-Ban:眼镜会成下一代计算平台?Neural Band才是真的「疯狂」

在Meta Connect 2025大会上,扎克伯格发布了Ray-Ban Display智能眼镜与Meta Neural Band神经腕带,展示了AI助手在地图导航、实时翻译等场景的应用潜力。尽管现场演示出现技术故障,但业界仍对其持积极态度。扎克伯格强调,眼镜作为AI的理想载体,能够实现全天候互动,并预测未来AI将更自然地融入日常生活,提供无缝多任务处理能力。

来源:36氪