AI新闻

已选标签:
多模态AI
AI视频
11月 29日
2 条新闻
13:19

阿里夸克、理想、谷歌押下重注,AI眼镜进入“巨头收割”新阶段

阿里夸克、理想、谷歌押下重注,AI眼镜进入“巨头收割”新阶段

多家企业竞相布局AI眼镜市场,将其视为下一代人机交互的关键入口。理想、阿里、谷歌等公司纷纷推出或重启相关项目,试图通过集成自家的大语言模型和其他AI技术,提供从导航到翻译等多功能服务。尽管当前产品在轻量化、续航等方面面临挑战,但各企业正努力优化用户体验,争夺特定场景下的用户黏性。预计未来几年内,该领域将经历从百花齐放到巨头主导的过程,最终胜出者将是那些能够深刻理解并满足特定应用场景需求的企业。

来源:36氪

09:40

万卡集群要上天?中国硬核企业打造太空超算!

万卡集群要上天?中国硬核企业打造太空超算!

中国科研机构与商业航天企业正积极推动太空超算发展,通过部署高性能计算集群和AI大模型,在轨实现数据处理与智能决策。中科天算的“天算计划”旨在构建10EOPS级天基万卡超级智能体集群,采用模块化设计应对极端环境挑战。这一创新将促进太空互联网应用生态的形成,并为远洋渔业等场景提供即时决策支持,标志着算力基础设施的重大变革。

来源:量子位

11月 28日
15 条新闻
20:54

Gemini立功,谷歌AI再次伟大,百度阿里们可以抄作业了?

Gemini立功,谷歌AI再次伟大,百度阿里们可以抄作业了?

Google发布新一代大模型Gemini 3,展现其在多模态处理和生成图像方面的强大能力,同时自研TPU成为英伟达算力霸权的最大变量。尽管曾因Bard失败而受质疑,但Google坚持AI优先战略,通过整合DeepMind与Google Brain、优化全栈式AI路线,在搜索、移动端等产品上实现显著提升,并推动了NotebookLM和Nano Banana等原生AI应用的发展。

来源:36氪

20:54

1688想用AI智能体“出海”

1688想用AI智能体“出海”

1688推出电商AI智能体‘遨虾’,利用多模态技术与阿里云算力支持,解决中小企业出海痛点,包括语言障碍、运营能力等。该系统通过分析市场、匹配工厂、生成素材及自动询价等功能,优化跨境电商业务链路,旨在构建更高效的企业出海解决方案。

来源:36氪

20:54

Gemini立功了,谷歌AI再次伟大,百度阿里们可以抄作业了?

Gemini立功了,谷歌AI再次伟大,百度阿里们可以抄作业了?

Google 发布了新一代大模型 Gemini 3,展示了其在多模态处理、视觉生成等方面的显著进步。基于自研 TPU 的强大算力支持,Gemini 3 在多个应用场景中表现出色,如医疗影像分析和建筑设计审查等。同时,Google 的全栈式 AI 路线也逐渐显现出优势,包括云基础设施、搜索数据资源以及移动端生态的整合,为未来AI技术的发展提供了坚实的基础。

来源:36氪

20:54

“文科生”微博,搞出一个数学学霸大模型

“文科生”微博,搞出一个数学学霸大模型

微博发布首个开源模型VibeThinker,以15亿参数和7800美元低成本在国际顶级数学测试中取得高分,挑战了“规模即智能”的行业共识。通过GRPO强化学习算法与频谱到信号原理(SSP)方法,VibeThinker在AIME2024、AIME2025及HMMT2025测试集中表现出色,尤其在数学推理能力上刷新了小模型的智能极限。这一成就不仅证明了小型模型也能解决复杂问题,还展示了成本控制与技术优化的新路径,可能重新定义AI领域的游戏规则。

来源:36氪

19:52

国产最强多模态宝座又易主?671B参数练就“火眼金睛”,基于DeepSeek打造

国产最强多模态宝座又易主?671B参数练就“火眼金睛”,基于DeepSeek打造

快手开源了新一代多模态大模型Keye-VL-671B-A37B,基于DeepSeek-V3-Terminus打造,拥有6710亿参数。该模型在图像和视频理解、跨模态对齐及复杂推理方面表现出色,超越了多个前沿VL模型。通过三阶段预训练策略和多阶段后训练优化,实现了高效的视觉理解和推理能力提升。未来,快手计划进一步融合多模态Agent能力,增强模型的工具调用与复杂问题解决能力。

来源:36氪

18:50

小米狂吸机器人技术大牛,前特斯拉Optimus工程师也来了

小米狂吸机器人技术大牛,前特斯拉Optimus工程师也来了

小米机器人团队引入前特斯拉Optimus灵巧手核心成员卢泽宇,加速灵巧手技术工程化落地。此举显示了小米在提升机器人灵巧性上的雄心,旨在为未来人形机器人奠定基础。同时,小米开源了首个跨域具身大模型MiMo-Embodied,成功融合自动驾驶与具身智能任务,标志着其在多模态模型和应用场景创新上取得重要进展。

来源:36氪

18:49

谷歌CTO兼首席AI架构师揭秘:谷歌如何用两年半完成AI逆袭

谷歌CTO兼首席AI架构师揭秘:谷歌如何用两年半完成AI逆袭

Gemini 3聚焦于精准意图理解、全球化服务及工具化创造能力,强调AI技术的实际应用价值而非单纯追求基准测试分数。通过自然语言编程打破创意与实现壁垒,推动AGI需与现实世界持续交互。文本与视觉模型共享底层架构以增强人类直觉交互体验。谷歌从实验室思维转向战场思维,每六个月迭代更新,激活全球专家资源,实现端到端协同。

来源:36氪

17:47

“AI新王”强势崛起,2027年谷歌TPU外销量或达100万颗

谷歌通过对外销售自研AI芯片TPU,有望显著提升其销售额和盈利。摩根士丹利预测,若谷歌售出约50万颗TPU,2027年云收入将增加130亿美元,每股收益增长3%。此举标志着谷歌战略转变,从内部使用转向市场推广,尽管存在商业模式、定价策略及工作负载承载能力的不确定性。同时,谷歌大模型Gemini 3获得好评,进一步推动其在AI领域的竞争地位。

来源:36氪

17:28

视频理解霸榜!快手Keye-VL旗舰模型重磅开源,多模态视频感知领头羊

视频理解霸榜!快手Keye-VL旗舰模型重磅开源,多模态视频感知领头羊

快手发布Keye-VL-671B-A37B多模态大语言模型,显著提升视觉感知与复杂推理能力。该模型在图像语义理解、视频细节把握等方面表现出色,通过多阶段预训练和后训练策略,实现了对日常场景及高难任务的精准解析。开源版本已上线,未来将融合更多Agent能力,推动AI向更智能形态发展。

来源:量子位

16:44

不止硅谷十万大裁员,Hinton警告:AI正以最糟糕方式颠覆社会

不止硅谷十万大裁员,Hinton警告:AI正以最糟糕方式颠覆社会

AI技术快速发展,特别是大语言模型和多模态处理能力的提升,正引发社会深刻变革。专家Hinton警告称,AI可能导致大规模失业和社会解体,但同时也强调其在医疗、教育等领域的巨大潜力。亚马逊等科技巨头通过裁员为AI发展腾出空间,引发了对AI伦理和控制权的广泛讨论。

来源:36氪

14:39

AI 霸主谷歌的反击:为什么说 4 万亿市值只是一个开始?

AI 霸主谷歌的反击:为什么说 4 万亿市值只是一个开始?

谷歌凭借Gemini 3和Nano Banana Pro在AI领域取得重大进展,尤其通过TPU算力集群,在推理成本控制上占据优势。Gemini 3展示了强大的多模态处理能力,适用于复杂任务如代码理解和视频分析。Nano Banana Pro则优化了移动设备上的AI应用。这些技术突破结合谷歌庞大的用户基础,为其在AI时代的全栈主权提供了坚实支持。

来源:36氪

14:39

80后诺奖得主:AlphaFold下一步融合大模型

80后诺奖得主:AlphaFold下一步融合大模型

AlphaFold在问世五周年之际,设计者John Jumper提出其下一步将与大模型融合,以提升科学文献数据处理和推理能力。自2020年推出以来,AlphaFold已帮助全球超过300万研究人员预测数亿种蛋白质的三维结构,推动了从心血管疾病到蜜蜂抗病性等多个领域的突破。未来,AlphaFold计划结合更广泛的AI技术,不仅限于结构预测,还将涉及假设生成、实验设计等复杂任务,进一步深化AI在生命科学中的应用。

来源:36氪

11:33

刚刚,DeepSeek开源新模型,拿下奥数证明题冠军

刚刚,DeepSeek开源新模型,拿下奥数证明题冠军

DeepSeek开源了具备强大定理证明能力的模型DeepSeekMath-V2,该模型在多项国际数学竞赛中取得金牌水平的成绩。通过强化学习和自我验证机制,DeepSeekMath-V2不仅能够生成证明还能进行自我评估与修正,标志着AI向解决研究级数学问题迈进了一大步。此研究展示了基于大语言模型开发可自我验证的数学推理系统是可行的方向,为未来复杂推理任务提供了新的思路。

来源:36氪

10:31

图灵奖得主 Yann LeCun:大模型是“死胡同”,下一步押在哪一条路?

图灵奖得主Yann LeCun宣布离开Meta,创立新公司专注于Advanced Machine Intelligence(AMI),特别是世界模型的研究。LeCun认为大语言模型在理解和推理物理世界上存在局限性,提出JEPA架构作为替代方案,强调AI需具备对物理世界的理解与行动能力。同时,OpenAI前首席科学家Ilya Sutskever也表达了类似观点,但更关注AI的安全性和可控性。这标志着后LLM时代正逐渐形成,预示着从单纯追求模型规模转向架构创新与安全控制的新趋势。

来源:36氪

09:29

阿里入“镜”,夸克叩门

阿里入“镜”,夸克叩门

阿里夸克发布6款AI眼镜,涵盖S1和G1两大系列,旨在成为AI入口,整合千问大模型及阿里生态核心场景。产品定位为全天候智能终端,具备24小时续航能力,并支持支付宝、高德地图等应用。此举措标志着阿里在智能硬件领域的新尝试,通过轻量级载体推动AI能力从手机向物理世界延伸,争夺下一代人机交互主导权。

来源:36氪

11月 27日
3 条新闻
22:16

10000个代码文件,我打几把游戏的功夫就搞成Wiki了!

10000个代码文件,我打几把游戏的功夫就搞成Wiki了!

Qoder AI编程工具通过强大的多模态模型与专项自研模型结合,实现了对复杂代码工程的高效理解与处理。其Repo Wiki功能能够自动将大型项目转化为结构清晰的Wiki文档,极大提升了代码审查效率及团队协作能力。支持IDE、CLI和JetBrains插件三种形态,满足不同开发者需求。特别在真实软件研发领域展现出卓越性能,包括快速检索大量代码文件、智能问答、由自然语言驱动的任务执行等,为AI辅助编程树立了新标杆。

来源:量子位

22:13

DeepSeek发布可自验证数学模型DeepSeekMath-V2

DeepSeek推出新型数学推理模型DeepSeekMath-V2,采用可自我验证的训练框架。该模型基于DeepSeek-V3.2-Exp-Base构建,通过LLM验证器自动审查生成的数学证明,并利用高难度样本持续优化性能。在IMO 2025和CMO 2024中均达到金牌水平,Putnam 2024获118/120分。团队表示,该成果验证了自验证推理路径的可行性,为构建可靠数学智能系统提供新方向。模型代码与权重已开源,发布于Hugging Face及GitHub平台。(广角观察)

来源:钛媒体

21:10

美国宣战,AI曼哈顿计划打响第一枪,“AI科学家”成最新核武器

美国宣战,AI曼哈顿计划打响第一枪,“AI科学家”成最新核武器

美国启动”创世纪计划”,旨在通过AI加速科研创新,将其深度嵌入科学假设提出、实验设计及数据分析等环节。该计划强调AI需生成可验证的结果,并与传统物理模型结合以提升预测准确性。同时,神经符号AI的融合被视为迈向人类级智能的关键路径之一。此战略不仅促进科研生产力跃升,还推动了跨学科协作和数据标准化,为实现通用人工智能(AGI)奠定基础。

来源:36氪