AI新闻

已选标签:
生成模型
具身智能
11月 28日
2 条新闻
11:33

刚刚,DeepSeek开源新模型,拿下奥数证明题冠军

刚刚,DeepSeek开源新模型,拿下奥数证明题冠军

DeepSeek开源了具备强大定理证明能力的模型DeepSeekMath-V2,该模型在多项国际数学竞赛中取得金牌水平的成绩。通过强化学习和自我验证机制,DeepSeekMath-V2不仅能够生成证明还能进行自我评估与修正,标志着AI向解决研究级数学问题迈进了一大步。此研究展示了基于大语言模型开发可自我验证的数学推理系统是可行的方向,为未来复杂推理任务提供了新的思路。

来源:36氪

03:32

今年感恩节的真正焦点可能是迈克尔·伯里与英伟达之间的较量

今年感恩节的真正焦点可能是迈克尔·伯里与英伟达之间的较量

知名投资者Michael Burry对Nvidia及其AI业务发起猛烈质疑,认为其估值过高且存在财务问题。Burry的言论引发了市场关于AI泡沫的讨论,他指出Nvidia通过股票补偿损害了股东利益,并质疑AI客户的真实需求。尽管Nvidia对此进行了反驳,但这场争论凸显了当前AI产业面临的商业落地、成本控制及数据安全等挑战。

来源:TechCrunch AI

11月 27日
18 条新闻
22:13

DeepSeek发布可自验证数学模型DeepSeekMath-V2

DeepSeek推出新型数学推理模型DeepSeekMath-V2,采用可自我验证的训练框架。该模型基于DeepSeek-V3.2-Exp-Base构建,通过LLM验证器自动审查生成的数学证明,并利用高难度样本持续优化性能。在IMO 2025和CMO 2024中均达到金牌水平,Putnam 2024获118/120分。团队表示,该成果验证了自验证推理路径的可行性,为构建可靠数学智能系统提供新方向。模型代码与权重已开源,发布于Hugging Face及GitHub平台。(广角观察)

来源:钛媒体

21:10

行业先驱变“先烈”,AI硬件为何如此难做

行业先驱变“先烈”,AI硬件为何如此难做

Rabbit公司推出的AI原生硬件Rabbit R1,尽管在CES上大放异彩并迅速吸引大量预订,但因供应链整合与AI模型调校能力不足,导致实际体验远低于预期,最终陷入财务困境。此案例揭示了当前AI硬件领域面临的挑战,包括技术成熟度、用户体验及市场定位等问题,同时也反映了AI硬件商业落地的复杂性。

来源:36氪

20:08

女频化、抽卡师、全面出海:AI漫剧的十大趋势

女频化、抽卡师、全面出海:AI漫剧的十大趋势

AI技术正在重塑动漫行业,通过深度学习和计算机视觉等技术,AI漫剧以低成本、高效率的方式颠覆了传统动画制作模式。各大平台如抖音、快手、B站等纷纷推出扶持计划,促进内容创新与人才挖掘。AI漫剧不仅在题材上实现了多元化尝试,还探索了新的付费模式,并开始布局海外市场。此外,随着AI技术的进步,新型职业如’抽卡师’应运而生,进一步提高了生产效率。

来源:36氪

19:07

卡卡卡卡卡……马卡龙是真的卡,但态度也是真的好

卡卡卡卡卡……马卡龙是真的卡,但态度也是真的好

马卡龙(Macaron),一款被定义为Personal Agent的应用,强调通过深入了解用户需求来提供个性化服务。它利用强化学习驱动的深度记忆技术,以实现长期且连贯的记忆功能,旨在成为用户的智能伙伴。尽管在生成小程序时存在效率与质量上的问题,但其主动挖掘并满足用户潜在需求的能力展示了AI助手向更人性化、陪伴式方向发展的趋势。

来源:36氪

19:06

压垮铂爵旅拍的最后一根稻草是AI?

压垮铂爵旅拍的最后一根稻草是AI?

随着AI拍图修图技术的不断进步,传统旅拍行业面临巨大挑战。以铂爵旅拍为例,其因无法适应市场变化及消费者偏好转向个性化、低成本的服务而陷入困境。AI技术通过提供更便捷、经济且高质量的图像生成与编辑解决方案,在个人摄影师和自动化工具的推动下正逐渐成为主流选择,促使实体旅拍企业必须重新思考其价值定位和服务模式。

来源:36氪

19:06

吃瓜、开会、追热点,我靠AI稳坐信息高地

吃瓜、开会、追热点,我靠AI稳坐信息高地

ListenHub是一款利用AI技术将长文转为播客的工具,支持多种输入方式包括链接、文件等,并能根据用户需求生成不同长度的播客。它采用了先进的自然语言处理技术和文本到语音转换技术,能够高效提炼文章核心内容并以对话形式呈现。此外,ListenHub还推出了FlowSpeech功能,允许用户使用自定义音色制作更加个性化的播客,满足了从普通听众到专业创作者的不同需求。

来源:36氪

18:04

「AI界淘宝」MuleRun:上线10天涌入21万用户,要做全球最大劳动力外包公司

「AI界淘宝」MuleRun:上线10天涌入21万用户,要做全球最大劳动力外包公司

MuleRun作为全球首个AI Agent交易市场,通过结合80%的SOP和20%的大模型能力,为用户提供解决特定场景下重复、琐碎任务的Agent。平台不仅促进了AI技术在实际问题中的应用,还为创作者提供了变现机会。该模式有望推动AI劳动力外包的发展,加速AI技术在各行业的普及与商业化进程。

来源:36氪

18:04

你还在晒AI图,有人已经在靠“提示词”收款了

你还在晒AI图,有人已经在靠“提示词”收款了

即梦4.0通过多模态统一架构、一致性算法和4K高清生成等技术,显著提升了AI生成图片的真实感与细腻度,特别是在人物眼神和表情的处理上达到了前所未有的水平。该工具不仅降低了用户创作高质量图像的门槛,还催生了提示词交易这一新兴市场。这标志着我们正步入一个“所想即所得”的时代,AI技术正在改变人们记录生活的方式,并逐渐成为一种新的社交货币。

来源:36氪

18:04

我不会画画,却用手机做出了一套四格漫画

我不会画画,却用手机做出了一套四格漫画

文章探讨了AI在四格漫画生成领域的应用,对比分析了KomikoAI、Dashtoon等工具。KomikoAI支持角色定制与编辑灵活度高,但需英文界面;Dashtoon则更专注于“爽漫”创作流程化,操作简便且有社区展示平台。尽管这些工具在人物一致性上表现良好,但在故事叙述能力上仍有待提升。这表明AI技术正逐步降低漫画创作门槛,为非专业人士提供了更多表达方式。

来源:36氪

18:04

3800亿,还是不够阿里的AI大计?

3800亿,还是不够阿里的AI大计?

阿里巴巴坚定投入AI领域,尽管短期业绩波动,但其在即时零售、用户体验升级及前沿科技研发上持续重金投入。阿里云AI服务器需求旺盛,未来可能进一步加大3800亿元的投资额度。同时,阿里推出多款C端AI助手如千问、夸克和灵光,虽然功能存在一定的同质化,但通过内部赛马机制促进差异化发展。阿里正致力于构建AI生态协同,实现从信息检索到服务对接的全流程智能化。

来源:36氪

16:25

大模型首次拥有“脖子”!纽大团队实现360度类人视觉搜索

大模型首次拥有“脖子”!纽大团队实现360度类人视觉搜索

纽约大学团队提出类人视觉搜索任务,让大模型具备360度主动视觉搜索能力。通过定义新数据集H*和基准测试H*Bench,研究展示了大模型在真实复杂环境中的高效搜索性能。采用监督微调与多轮强化学习策略,Qwen2.5-VL-3B-Instruct模型在目标与路径搜索上取得显著提升。此研究推动了从被动到主动的视觉空间推理范式转变。

来源:量子位

16:07

月之暗面公开RL训练加速方法:训练速度暴涨97%,长尾延迟狂降93%

月之暗面公开RL训练加速方法:训练速度暴涨97%,长尾延迟狂降93%

月之暗面联合清华大学提出全新加速引擎Seer,显著提升LLM强化学习训练速度,在不改变核心算法前提下,实现Rollout效率提升74%~97%,长尾延迟减少75%~93%。Seer通过三大模块(推理引擎池、请求缓冲区、上下文管理器)和三项关键技术(分段生成、上下文感知调度、自适应分组推测解码),从内存、调度、推理三个维度优化rollout效率。实验验证表明,Seer在不同工作负载中均实现性能突破,吞吐量提升显著,且大幅降低长尾延迟。

来源:量子位

15:58

NeurIPS 2025最佳论文开奖,何恺明、孙剑等十年经典之作夺奖

NeurIPS 2025最佳论文开奖,何恺明、孙剑等十年经典之作夺奖

NeurIPS 2025揭晓最佳论文,华人学者占据半壁江山。研究涵盖扩散模型、自监督RL、注意力机制等领域。阿里千问团队提出门控注意力机制,显著提升大语言模型性能;普林斯顿大学等机构展示了深度网络在自监督强化学习中的突破性进展;巴黎PSL大学等解析了扩散模型避免记忆效应的内在机制。

来源:36氪

14:55

我用AI生成流浪汉骗我爸,结果他摇来了特警

我用AI生成流浪汉骗我爸,结果他摇来了特警

新闻报道了TikTok等社交平台上流行的‘AI流浪汉进家门’恶作剧现象,青少年利用Snapchat、Nano banana等AI图像生成工具制作逼真的恶搞图片,引发家人恐慌。尽管最初被视为无害的玩笑,但随着事件发酵,已导致警方不必要的出动,甚至造成实际的社会问题。此外,还讨论了AI生成内容在其他领域的滥用情况,如德勤因使用AI工具编写政府报告而被发现掺杂虚假信息。这些案例凸显了AI技术在娱乐和商业应用中面临的伦理挑战与安全隐患。

来源:36氪

12:52

「ChatGPT说我在浪费生命,但它错了」,WhatsApp前产品掌门人的清醒反击

「ChatGPT说我在浪费生命,但它错了」,WhatsApp前产品掌门人的清醒反击

Ami Vora,曾任WhatsApp产品负责人及Meta社交与商业产品整合策略负责人,现为Fair首席产品官。她分享了AI在日常生活中的应用实例,如辅助创作和人际交往准备,并强调了简单性作为产品设计的核心竞争力。Ami还讨论了AI反馈的局限性和未来交互方式的发展趋势,认为执行力比战略更重要,尤其是在快速迭代的AI时代。

来源:36氪