AI新闻

已选标签:
生成模型
AI音频
11月 28日
10 条新闻
20:54

“文科生”微博,搞出一个数学学霸大模型

“文科生”微博,搞出一个数学学霸大模型

微博发布首个开源模型VibeThinker,以15亿参数和7800美元低成本在国际顶级数学测试中取得高分,挑战了“规模即智能”的行业共识。通过GRPO强化学习算法与频谱到信号原理(SSP)方法,VibeThinker在AIME2024、AIME2025及HMMT2025测试集中表现出色,尤其在数学推理能力上刷新了小模型的智能极限。这一成就不仅证明了小型模型也能解决复杂问题,还展示了成本控制与技术优化的新路径,可能重新定义AI领域的游戏规则。

来源:36氪

19:52

苹果AI论文太坑了,用GPT写的GT,导致北京程序员通宵加班

苹果AI论文太坑了,用GPT写的GT,导致北京程序员通宵加班

苹果发布的一篇关于视觉推理任务诊断benchmark的论文存在严重问题,包括官方代码bug和高达30%的GT错误率。阶跃星辰研究员Lei Yang在适配该benchmark过程中发现这些问题,并通过公开评论促使论文撤稿。此事件反映了大模型时代数据质量控制的重要性及学术界对研究成果审核的不足。

来源:36氪

18:50

MIT:AI已取代约12%美国劳动力

MIT:AI已取代约12%美国劳动力

麻省理工学院与橡树岭国家实验室合作开发的“冰山指数”研究表明,AI已能替代美国11.7%的劳动力市场,影响领域包括金融、医疗保健及专业服务等,总价值约1.2万亿美元。该工具通过模拟全美劳动者间互动方式及其受AI影响程度,为政策制定者提供了一个评估AI对就业市场潜在冲击的框架,并强调了内陆与农村地区同样面临AI转型挑战。

来源:36氪

18:49

AI歌手开始霸榜了

AI歌手开始霸榜了

AI生成音乐在Spotify和Billboard榜单上取得显著成绩,展示了其在创作效率与市场接受度方面的突破。尽管存在资本炒作的质疑,但AI音乐正逐渐成为行业不可忽视的力量。技术层面,AI通过深度学习等手段实现了对音乐结构和旋律的有效模仿,引发关于版权、伦理及未来音乐产业生态的广泛讨论。

来源:36氪

18:49

甲骨文等再贷380亿美元,“OpenAI链”数据中心圈子累计负债已达1000亿美元

OpenAI通过合作伙伴举债数百亿美元,形成庞大的“OpenAI链”负债网络,以支撑其在数据中心和算力上的需求。尽管累计债务逼近1000亿美元,但OpenAI自身几乎无债,巧妙地将财务风险转移至外部。这一策略不仅推动了AI基础设施的大规模建设,也体现了OpenAI对于实现超越人类能力的通用人工智能(AGI)愿景的决心与创新融资模式。

来源:36氪

18:04

对话韩旭:双重上市后,英才校招300万起步

对话韩旭:双重上市后,英才校招300万起步

文远知行CEO韩旭强调,自动驾驶仍是前沿且最具挑战性的领域。公司推出英才校招计划,提供300万至500万年薪吸引顶尖人才,以解决无人驾驶中的复杂问题。韩旭认为,真正的创新在于持续追求革命性技术的价值,而非追逐热点。随着自动驾驶技术逐渐成熟,其商业价值和社会影响将愈发显著,为AI在交通领域的应用开辟新前景。

来源:量子位

17:28

视频理解霸榜!快手Keye-VL旗舰模型重磅开源,多模态视频感知领头羊

视频理解霸榜!快手Keye-VL旗舰模型重磅开源,多模态视频感知领头羊

快手发布Keye-VL-671B-A37B多模态大语言模型,显著提升视觉感知与复杂推理能力。该模型在图像语义理解、视频细节把握等方面表现出色,通过多阶段预训练和后训练策略,实现了对日常场景及高难任务的精准解析。开源版本已上线,未来将融合更多Agent能力,推动AI向更智能形态发展。

来源:量子位

15:41

GEO爆火,谁在给AI投喂“垃圾”?

GEO爆火,谁在给AI投喂“垃圾”?

GEO(生成式引擎优化)作为一种新兴的AI营销手段,通过向大模型‘投喂’特定内容以提升品牌曝光度。2025年Q2中国GEO市场规模同比增长215%,预示着其商业潜力巨大。然而,GEO实践中存在“黑帽”与“白帽”之分,前者通过大量低质内容铺设影响AI信息源,后者则注重于监测和理解AI平台上的品牌表现。随着AI技术的发展,未来GEO可能演变为GEM(生成式引擎营销),使大模型成为用户的采购代理。当前行业正在探索如何建立健康生态,确保优质内容得到优先推荐。

来源:36氪

11:33

刚刚,DeepSeek开源新模型,拿下奥数证明题冠军

刚刚,DeepSeek开源新模型,拿下奥数证明题冠军

DeepSeek开源了具备强大定理证明能力的模型DeepSeekMath-V2,该模型在多项国际数学竞赛中取得金牌水平的成绩。通过强化学习和自我验证机制,DeepSeekMath-V2不仅能够生成证明还能进行自我评估与修正,标志着AI向解决研究级数学问题迈进了一大步。此研究展示了基于大语言模型开发可自我验证的数学推理系统是可行的方向,为未来复杂推理任务提供了新的思路。

来源:36氪

03:32

今年感恩节的真正焦点可能是迈克尔·伯里与英伟达之间的较量

今年感恩节的真正焦点可能是迈克尔·伯里与英伟达之间的较量

知名投资者Michael Burry对Nvidia及其AI业务发起猛烈质疑,认为其估值过高且存在财务问题。Burry的言论引发了市场关于AI泡沫的讨论,他指出Nvidia通过股票补偿损害了股东利益,并质疑AI客户的真实需求。尽管Nvidia对此进行了反驳,但这场争论凸显了当前AI产业面临的商业落地、成本控制及数据安全等挑战。

来源:TechCrunch AI

11月 27日
10 条新闻
22:13

DeepSeek发布可自验证数学模型DeepSeekMath-V2

DeepSeek推出新型数学推理模型DeepSeekMath-V2,采用可自我验证的训练框架。该模型基于DeepSeek-V3.2-Exp-Base构建,通过LLM验证器自动审查生成的数学证明,并利用高难度样本持续优化性能。在IMO 2025和CMO 2024中均达到金牌水平,Putnam 2024获118/120分。团队表示,该成果验证了自验证推理路径的可行性,为构建可靠数学智能系统提供新方向。模型代码与权重已开源,发布于Hugging Face及GitHub平台。(广角观察)

来源:钛媒体

21:10

行业先驱变“先烈”,AI硬件为何如此难做

行业先驱变“先烈”,AI硬件为何如此难做

Rabbit公司推出的AI原生硬件Rabbit R1,尽管在CES上大放异彩并迅速吸引大量预订,但因供应链整合与AI模型调校能力不足,导致实际体验远低于预期,最终陷入财务困境。此案例揭示了当前AI硬件领域面临的挑战,包括技术成熟度、用户体验及市场定位等问题,同时也反映了AI硬件商业落地的复杂性。

来源:36氪

20:08

女频化、抽卡师、全面出海:AI漫剧的十大趋势

女频化、抽卡师、全面出海:AI漫剧的十大趋势

AI技术正在重塑动漫行业,通过深度学习和计算机视觉等技术,AI漫剧以低成本、高效率的方式颠覆了传统动画制作模式。各大平台如抖音、快手、B站等纷纷推出扶持计划,促进内容创新与人才挖掘。AI漫剧不仅在题材上实现了多元化尝试,还探索了新的付费模式,并开始布局海外市场。此外,随着AI技术的进步,新型职业如’抽卡师’应运而生,进一步提高了生产效率。

来源:36氪

19:07

卡卡卡卡卡……马卡龙是真的卡,但态度也是真的好

卡卡卡卡卡……马卡龙是真的卡,但态度也是真的好

马卡龙(Macaron),一款被定义为Personal Agent的应用,强调通过深入了解用户需求来提供个性化服务。它利用强化学习驱动的深度记忆技术,以实现长期且连贯的记忆功能,旨在成为用户的智能伙伴。尽管在生成小程序时存在效率与质量上的问题,但其主动挖掘并满足用户潜在需求的能力展示了AI助手向更人性化、陪伴式方向发展的趋势。

来源:36氪

19:06

压垮铂爵旅拍的最后一根稻草是AI?

压垮铂爵旅拍的最后一根稻草是AI?

随着AI拍图修图技术的不断进步,传统旅拍行业面临巨大挑战。以铂爵旅拍为例,其因无法适应市场变化及消费者偏好转向个性化、低成本的服务而陷入困境。AI技术通过提供更便捷、经济且高质量的图像生成与编辑解决方案,在个人摄影师和自动化工具的推动下正逐渐成为主流选择,促使实体旅拍企业必须重新思考其价值定位和服务模式。

来源:36氪

19:06

吃瓜、开会、追热点,我靠AI稳坐信息高地

吃瓜、开会、追热点,我靠AI稳坐信息高地

ListenHub是一款利用AI技术将长文转为播客的工具,支持多种输入方式包括链接、文件等,并能根据用户需求生成不同长度的播客。它采用了先进的自然语言处理技术和文本到语音转换技术,能够高效提炼文章核心内容并以对话形式呈现。此外,ListenHub还推出了FlowSpeech功能,允许用户使用自定义音色制作更加个性化的播客,满足了从普通听众到专业创作者的不同需求。

来源:36氪

18:04

「AI界淘宝」MuleRun:上线10天涌入21万用户,要做全球最大劳动力外包公司

「AI界淘宝」MuleRun:上线10天涌入21万用户,要做全球最大劳动力外包公司

MuleRun作为全球首个AI Agent交易市场,通过结合80%的SOP和20%的大模型能力,为用户提供解决特定场景下重复、琐碎任务的Agent。平台不仅促进了AI技术在实际问题中的应用,还为创作者提供了变现机会。该模式有望推动AI劳动力外包的发展,加速AI技术在各行业的普及与商业化进程。

来源:36氪

18:04

你还在晒AI图,有人已经在靠“提示词”收款了

你还在晒AI图,有人已经在靠“提示词”收款了

即梦4.0通过多模态统一架构、一致性算法和4K高清生成等技术,显著提升了AI生成图片的真实感与细腻度,特别是在人物眼神和表情的处理上达到了前所未有的水平。该工具不仅降低了用户创作高质量图像的门槛,还催生了提示词交易这一新兴市场。这标志着我们正步入一个“所想即所得”的时代,AI技术正在改变人们记录生活的方式,并逐渐成为一种新的社交货币。

来源:36氪