AI新闻

已选标签:
模型突破
自动驾驶
11月 28日
18 条新闻
20:54

“文科生”微博,搞出一个数学学霸大模型

“文科生”微博,搞出一个数学学霸大模型

微博发布首个开源模型VibeThinker,以15亿参数和7800美元低成本在国际顶级数学测试中取得高分,挑战了“规模即智能”的行业共识。通过GRPO强化学习算法与频谱到信号原理(SSP)方法,VibeThinker在AIME2024、AIME2025及HMMT2025测试集中表现出色,尤其在数学推理能力上刷新了小模型的智能极限。这一成就不仅证明了小型模型也能解决复杂问题,还展示了成本控制与技术优化的新路径,可能重新定义AI领域的游戏规则。

来源:36氪

19:52

国产最强多模态宝座又易主?671B参数练就“火眼金睛”,基于DeepSeek打造

国产最强多模态宝座又易主?671B参数练就“火眼金睛”,基于DeepSeek打造

快手开源了新一代多模态大模型Keye-VL-671B-A37B,基于DeepSeek-V3-Terminus打造,拥有6710亿参数。该模型在图像和视频理解、跨模态对齐及复杂推理方面表现出色,超越了多个前沿VL模型。通过三阶段预训练策略和多阶段后训练优化,实现了高效的视觉理解和推理能力提升。未来,快手计划进一步融合多模态Agent能力,增强模型的工具调用与复杂问题解决能力。

来源:36氪

19:52

苹果AI论文太坑了,用GPT写的GT,导致北京程序员通宵加班

苹果AI论文太坑了,用GPT写的GT,导致北京程序员通宵加班

苹果发布的一篇关于视觉推理任务诊断benchmark的论文存在严重问题,包括官方代码bug和高达30%的GT错误率。阶跃星辰研究员Lei Yang在适配该benchmark过程中发现这些问题,并通过公开评论促使论文撤稿。此事件反映了大模型时代数据质量控制的重要性及学术界对研究成果审核的不足。

来源:36氪

18:50

MIT:AI已取代约12%美国劳动力

MIT:AI已取代约12%美国劳动力

麻省理工学院与橡树岭国家实验室合作开发的“冰山指数”研究表明,AI已能替代美国11.7%的劳动力市场,影响领域包括金融、医疗保健及专业服务等,总价值约1.2万亿美元。该工具通过模拟全美劳动者间互动方式及其受AI影响程度,为政策制定者提供了一个评估AI对就业市场潜在冲击的框架,并强调了内陆与农村地区同样面临AI转型挑战。

来源:36氪

18:50

小米狂吸机器人技术大牛,前特斯拉Optimus工程师也来了

小米狂吸机器人技术大牛,前特斯拉Optimus工程师也来了

小米机器人团队引入前特斯拉Optimus灵巧手核心成员卢泽宇,加速灵巧手技术工程化落地。此举显示了小米在提升机器人灵巧性上的雄心,旨在为未来人形机器人奠定基础。同时,小米开源了首个跨域具身大模型MiMo-Embodied,成功融合自动驾驶与具身智能任务,标志着其在多模态模型和应用场景创新上取得重要进展。

来源:36氪

18:49

谷歌CTO兼首席AI架构师揭秘:谷歌如何用两年半完成AI逆袭

谷歌CTO兼首席AI架构师揭秘:谷歌如何用两年半完成AI逆袭

Gemini 3聚焦于精准意图理解、全球化服务及工具化创造能力,强调AI技术的实际应用价值而非单纯追求基准测试分数。通过自然语言编程打破创意与实现壁垒,推动AGI需与现实世界持续交互。文本与视觉模型共享底层架构以增强人类直觉交互体验。谷歌从实验室思维转向战场思维,每六个月迭代更新,激活全球专家资源,实现端到端协同。

来源:36氪

18:49

AI歌手开始霸榜了

AI歌手开始霸榜了

AI生成音乐在Spotify和Billboard榜单上取得显著成绩,展示了其在创作效率与市场接受度方面的突破。尽管存在资本炒作的质疑,但AI音乐正逐渐成为行业不可忽视的力量。技术层面,AI通过深度学习等手段实现了对音乐结构和旋律的有效模仿,引发关于版权、伦理及未来音乐产业生态的广泛讨论。

来源:36氪

18:49

甲骨文等再贷380亿美元,“OpenAI链”数据中心圈子累计负债已达1000亿美元

OpenAI通过合作伙伴举债数百亿美元,形成庞大的“OpenAI链”负债网络,以支撑其在数据中心和算力上的需求。尽管累计债务逼近1000亿美元,但OpenAI自身几乎无债,巧妙地将财务风险转移至外部。这一策略不仅推动了AI基础设施的大规模建设,也体现了OpenAI对于实现超越人类能力的通用人工智能(AGI)愿景的决心与创新融资模式。

来源:36氪

18:04

对话韩旭:双重上市后,英才校招300万起步

对话韩旭:双重上市后,英才校招300万起步

文远知行CEO韩旭强调,自动驾驶仍是前沿且最具挑战性的领域。公司推出英才校招计划,提供300万至500万年薪吸引顶尖人才,以解决无人驾驶中的复杂问题。韩旭认为,真正的创新在于持续追求革命性技术的价值,而非追逐热点。随着自动驾驶技术逐渐成熟,其商业价值和社会影响将愈发显著,为AI在交通领域的应用开辟新前景。

来源:量子位

17:47

“AI新王”强势崛起,2027年谷歌TPU外销量或达100万颗

谷歌通过对外销售自研AI芯片TPU,有望显著提升其销售额和盈利。摩根士丹利预测,若谷歌售出约50万颗TPU,2027年云收入将增加130亿美元,每股收益增长3%。此举标志着谷歌战略转变,从内部使用转向市场推广,尽管存在商业模式、定价策略及工作负载承载能力的不确定性。同时,谷歌大模型Gemini 3获得好评,进一步推动其在AI领域的竞争地位。

来源:36氪

17:28

视频理解霸榜!快手Keye-VL旗舰模型重磅开源,多模态视频感知领头羊

视频理解霸榜!快手Keye-VL旗舰模型重磅开源,多模态视频感知领头羊

快手发布Keye-VL-671B-A37B多模态大语言模型,显著提升视觉感知与复杂推理能力。该模型在图像语义理解、视频细节把握等方面表现出色,通过多阶段预训练和后训练策略,实现了对日常场景及高难任务的精准解析。开源版本已上线,未来将融合更多Agent能力,推动AI向更智能形态发展。

来源:量子位

15:41

GEO爆火,谁在给AI投喂“垃圾”?

GEO爆火,谁在给AI投喂“垃圾”?

GEO(生成式引擎优化)作为一种新兴的AI营销手段,通过向大模型‘投喂’特定内容以提升品牌曝光度。2025年Q2中国GEO市场规模同比增长215%,预示着其商业潜力巨大。然而,GEO实践中存在“黑帽”与“白帽”之分,前者通过大量低质内容铺设影响AI信息源,后者则注重于监测和理解AI平台上的品牌表现。随着AI技术的发展,未来GEO可能演变为GEM(生成式引擎营销),使大模型成为用户的采购代理。当前行业正在探索如何建立健康生态,确保优质内容得到优先推荐。

来源:36氪

14:39

AI 霸主谷歌的反击:为什么说 4 万亿市值只是一个开始?

AI 霸主谷歌的反击:为什么说 4 万亿市值只是一个开始?

谷歌凭借Gemini 3和Nano Banana Pro在AI领域取得重大进展,尤其通过TPU算力集群,在推理成本控制上占据优势。Gemini 3展示了强大的多模态处理能力,适用于复杂任务如代码理解和视频分析。Nano Banana Pro则优化了移动设备上的AI应用。这些技术突破结合谷歌庞大的用户基础,为其在AI时代的全栈主权提供了坚实支持。

来源:36氪

14:39

80后诺奖得主:AlphaFold下一步融合大模型

80后诺奖得主:AlphaFold下一步融合大模型

AlphaFold在问世五周年之际,设计者John Jumper提出其下一步将与大模型融合,以提升科学文献数据处理和推理能力。自2020年推出以来,AlphaFold已帮助全球超过300万研究人员预测数亿种蛋白质的三维结构,推动了从心血管疾病到蜜蜂抗病性等多个领域的突破。未来,AlphaFold计划结合更广泛的AI技术,不仅限于结构预测,还将涉及假设生成、实验设计等复杂任务,进一步深化AI在生命科学中的应用。

来源:36氪

11:33

刚刚,DeepSeek开源新模型,拿下奥数证明题冠军

刚刚,DeepSeek开源新模型,拿下奥数证明题冠军

DeepSeek开源了具备强大定理证明能力的模型DeepSeekMath-V2,该模型在多项国际数学竞赛中取得金牌水平的成绩。通过强化学习和自我验证机制,DeepSeekMath-V2不仅能够生成证明还能进行自我评估与修正,标志着AI向解决研究级数学问题迈进了一大步。此研究展示了基于大语言模型开发可自我验证的数学推理系统是可行的方向,为未来复杂推理任务提供了新的思路。

来源:36氪

10:31

图灵奖得主 Yann LeCun:大模型是“死胡同”,下一步押在哪一条路?

图灵奖得主Yann LeCun宣布离开Meta,创立新公司专注于Advanced Machine Intelligence(AMI),特别是世界模型的研究。LeCun认为大语言模型在理解和推理物理世界上存在局限性,提出JEPA架构作为替代方案,强调AI需具备对物理世界的理解与行动能力。同时,OpenAI前首席科学家Ilya Sutskever也表达了类似观点,但更关注AI的安全性和可控性。这标志着后LLM时代正逐渐形成,预示着从单纯追求模型规模转向架构创新与安全控制的新趋势。

来源:36氪

09:29

阿里入“镜”,夸克叩门

阿里入“镜”,夸克叩门

阿里夸克发布6款AI眼镜,涵盖S1和G1两大系列,旨在成为AI入口,整合千问大模型及阿里生态核心场景。产品定位为全天候智能终端,具备24小时续航能力,并支持支付宝、高德地图等应用。此举措标志着阿里在智能硬件领域的新尝试,通过轻量级载体推动AI能力从手机向物理世界延伸,争夺下一代人机交互主导权。

来源:36氪

03:32

今年感恩节的真正焦点可能是迈克尔·伯里与英伟达之间的较量

今年感恩节的真正焦点可能是迈克尔·伯里与英伟达之间的较量

知名投资者Michael Burry对Nvidia及其AI业务发起猛烈质疑,认为其估值过高且存在财务问题。Burry的言论引发了市场关于AI泡沫的讨论,他指出Nvidia通过股票补偿损害了股东利益,并质疑AI客户的真实需求。尽管Nvidia对此进行了反驳,但这场争论凸显了当前AI产业面临的商业落地、成本控制及数据安全等挑战。

来源:TechCrunch AI

11月 27日
2 条新闻
22:16

10000个代码文件,我打几把游戏的功夫就搞成Wiki了!

10000个代码文件,我打几把游戏的功夫就搞成Wiki了!

Qoder AI编程工具通过强大的多模态模型与专项自研模型结合,实现了对复杂代码工程的高效理解与处理。其Repo Wiki功能能够自动将大型项目转化为结构清晰的Wiki文档,极大提升了代码审查效率及团队协作能力。支持IDE、CLI和JetBrains插件三种形态,满足不同开发者需求。特别在真实软件研发领域展现出卓越性能,包括快速检索大量代码文件、智能问答、由自然语言驱动的任务执行等,为AI辅助编程树立了新标杆。

来源:量子位

22:13

DeepSeek发布可自验证数学模型DeepSeekMath-V2

DeepSeek推出新型数学推理模型DeepSeekMath-V2,采用可自我验证的训练框架。该模型基于DeepSeek-V3.2-Exp-Base构建,通过LLM验证器自动审查生成的数学证明,并利用高难度样本持续优化性能。在IMO 2025和CMO 2024中均达到金牌水平,Putnam 2024获118/120分。团队表示,该成果验证了自验证推理路径的可行性,为构建可靠数学智能系统提供新方向。模型代码与权重已开源,发布于Hugging Face及GitHub平台。(广角观察)

来源:钛媒体