AI新闻

已选标签:
AI训练
生成模型
11月 27日
20 条新闻
21:10

谷歌AI往事:隐秘的二十年,与狂奔的365天

谷歌凭借Gemini 3与Nano Banana Pro等模型,在AI生图精度和想象力上取得显著进展,月活跃用户大幅增长。其成功源于长期投资和技术积累,包括早期的‘猫论文’、大规模神经网络训练及DeepMind收购等关键节点。这些举措不仅推动了无监督学习、推荐系统等技术的发展,还促进了整个AI产业的繁荣。

来源:36氪

21:10

行业先驱变“先烈”,AI硬件为何如此难做

行业先驱变“先烈”,AI硬件为何如此难做

Rabbit公司推出的AI原生硬件Rabbit R1,尽管在CES上大放异彩并迅速吸引大量预订,但因供应链整合与AI模型调校能力不足,导致实际体验远低于预期,最终陷入财务困境。此案例揭示了当前AI硬件领域面临的挑战,包括技术成熟度、用户体验及市场定位等问题,同时也反映了AI硬件商业落地的复杂性。

来源:36氪

20:08

女频化、抽卡师、全面出海:AI漫剧的十大趋势

女频化、抽卡师、全面出海:AI漫剧的十大趋势

AI技术正在重塑动漫行业,通过深度学习和计算机视觉等技术,AI漫剧以低成本、高效率的方式颠覆了传统动画制作模式。各大平台如抖音、快手、B站等纷纷推出扶持计划,促进内容创新与人才挖掘。AI漫剧不仅在题材上实现了多元化尝试,还探索了新的付费模式,并开始布局海外市场。此外,随着AI技术的进步,新型职业如’抽卡师’应运而生,进一步提高了生产效率。

来源:36氪

19:07

卡卡卡卡卡……马卡龙是真的卡,但态度也是真的好

卡卡卡卡卡……马卡龙是真的卡,但态度也是真的好

马卡龙(Macaron),一款被定义为Personal Agent的应用,强调通过深入了解用户需求来提供个性化服务。它利用强化学习驱动的深度记忆技术,以实现长期且连贯的记忆功能,旨在成为用户的智能伙伴。尽管在生成小程序时存在效率与质量上的问题,但其主动挖掘并满足用户潜在需求的能力展示了AI助手向更人性化、陪伴式方向发展的趋势。

来源:36氪

19:06

压垮铂爵旅拍的最后一根稻草是AI?

压垮铂爵旅拍的最后一根稻草是AI?

随着AI拍图修图技术的不断进步,传统旅拍行业面临巨大挑战。以铂爵旅拍为例,其因无法适应市场变化及消费者偏好转向个性化、低成本的服务而陷入困境。AI技术通过提供更便捷、经济且高质量的图像生成与编辑解决方案,在个人摄影师和自动化工具的推动下正逐渐成为主流选择,促使实体旅拍企业必须重新思考其价值定位和服务模式。

来源:36氪

19:06

吃瓜、开会、追热点,我靠AI稳坐信息高地

吃瓜、开会、追热点,我靠AI稳坐信息高地

ListenHub是一款利用AI技术将长文转为播客的工具,支持多种输入方式包括链接、文件等,并能根据用户需求生成不同长度的播客。它采用了先进的自然语言处理技术和文本到语音转换技术,能够高效提炼文章核心内容并以对话形式呈现。此外,ListenHub还推出了FlowSpeech功能,允许用户使用自定义音色制作更加个性化的播客,满足了从普通听众到专业创作者的不同需求。

来源:36氪

18:04

「AI界淘宝」MuleRun:上线10天涌入21万用户,要做全球最大劳动力外包公司

「AI界淘宝」MuleRun:上线10天涌入21万用户,要做全球最大劳动力外包公司

MuleRun作为全球首个AI Agent交易市场,通过结合80%的SOP和20%的大模型能力,为用户提供解决特定场景下重复、琐碎任务的Agent。平台不仅促进了AI技术在实际问题中的应用,还为创作者提供了变现机会。该模式有望推动AI劳动力外包的发展,加速AI技术在各行业的普及与商业化进程。

来源:36氪

18:04

你还在晒AI图,有人已经在靠“提示词”收款了

你还在晒AI图,有人已经在靠“提示词”收款了

即梦4.0通过多模态统一架构、一致性算法和4K高清生成等技术,显著提升了AI生成图片的真实感与细腻度,特别是在人物眼神和表情的处理上达到了前所未有的水平。该工具不仅降低了用户创作高质量图像的门槛,还催生了提示词交易这一新兴市场。这标志着我们正步入一个“所想即所得”的时代,AI技术正在改变人们记录生活的方式,并逐渐成为一种新的社交货币。

来源:36氪

18:04

我不会画画,却用手机做出了一套四格漫画

我不会画画,却用手机做出了一套四格漫画

文章探讨了AI在四格漫画生成领域的应用,对比分析了KomikoAI、Dashtoon等工具。KomikoAI支持角色定制与编辑灵活度高,但需英文界面;Dashtoon则更专注于“爽漫”创作流程化,操作简便且有社区展示平台。尽管这些工具在人物一致性上表现良好,但在故事叙述能力上仍有待提升。这表明AI技术正逐步降低漫画创作门槛,为非专业人士提供了更多表达方式。

来源:36氪

18:04

3800亿,还是不够阿里的AI大计?

3800亿,还是不够阿里的AI大计?

阿里巴巴坚定投入AI领域,尽管短期业绩波动,但其在即时零售、用户体验升级及前沿科技研发上持续重金投入。阿里云AI服务器需求旺盛,未来可能进一步加大3800亿元的投资额度。同时,阿里推出多款C端AI助手如千问、夸克和灵光,虽然功能存在一定的同质化,但通过内部赛马机制促进差异化发展。阿里正致力于构建AI生态协同,实现从信息检索到服务对接的全流程智能化。

来源:36氪

16:25

大模型首次拥有“脖子”!纽大团队实现360度类人视觉搜索

大模型首次拥有“脖子”!纽大团队实现360度类人视觉搜索

纽约大学团队提出类人视觉搜索任务,让大模型具备360度主动视觉搜索能力。通过定义新数据集H*和基准测试H*Bench,研究展示了大模型在真实复杂环境中的高效搜索性能。采用监督微调与多轮强化学习策略,Qwen2.5-VL-3B-Instruct模型在目标与路径搜索上取得显著提升。此研究推动了从被动到主动的视觉空间推理范式转变。

来源:量子位

16:14

5亿热钱砸向清华AI Infra明星:最大化算力效能筑造智能体基建

5亿热钱砸向清华AI Infra明星:最大化算力效能筑造智能体基建

无问芯穹完成近5亿元A+轮融资,累计融资近15亿。公司凭借软硬协同、多元异构的技术优势,在AI基础设施领域实现差异化发展。资金将用于扩大技术领先优势、推动AI云与终端方案规模化拓展及加大智能体基础设施研发投入。其“智能体基础设施×(AI云+终端智能)”战略精准把握了智能体时代的核心需求,展示了在云端大算力、终端大模型推理等方面的体系化能力。

来源:量子位

16:07

月之暗面公开RL训练加速方法:训练速度暴涨97%,长尾延迟狂降93%

月之暗面公开RL训练加速方法:训练速度暴涨97%,长尾延迟狂降93%

月之暗面联合清华大学提出全新加速引擎Seer,显著提升LLM强化学习训练速度,在不改变核心算法前提下,实现Rollout效率提升74%~97%,长尾延迟减少75%~93%。Seer通过三大模块(推理引擎池、请求缓冲区、上下文管理器)和三项关键技术(分段生成、上下文感知调度、自适应分组推测解码),从内存、调度、推理三个维度优化rollout效率。实验验证表明,Seer在不同工作负载中均实现性能突破,吞吐量提升显著,且大幅降低长尾延迟。

来源:量子位

15:58

NeurIPS 2025最佳论文开奖,何恺明、孙剑等十年经典之作夺奖

NeurIPS 2025最佳论文开奖,何恺明、孙剑等十年经典之作夺奖

NeurIPS 2025揭晓最佳论文,华人学者占据半壁江山。研究涵盖扩散模型、自监督RL、注意力机制等领域。阿里千问团队提出门控注意力机制,显著提升大语言模型性能;普林斯顿大学等机构展示了深度网络在自监督强化学习中的突破性进展;巴黎PSL大学等解析了扩散模型避免记忆效应的内在机制。

来源:36氪

15:58

谷歌 Ironwood TPU 突袭,英伟达 GPU 迎来挑战者?

谷歌 Ironwood TPU 突袭,英伟达 GPU 迎来挑战者?

谷歌发布第七代TPU Ironwood,性能提升显著,与ARM架构AxionVM共同构建全方位AI基础设施体系,提供“AI超级计算机即服务”模式。此方案对大模型训练、推理及服务场景友好,大幅降低AI落地门槛和运维成本。英伟达强调其在通用性、兼容性和生态方面的优势,但市场格局正面临挑战。未来AI芯片市场将呈现多样化共存态势,投资逻辑转向全栈服务能力。

来源:36氪

14:55

我用AI生成流浪汉骗我爸,结果他摇来了特警

我用AI生成流浪汉骗我爸,结果他摇来了特警

新闻报道了TikTok等社交平台上流行的‘AI流浪汉进家门’恶作剧现象,青少年利用Snapchat、Nano banana等AI图像生成工具制作逼真的恶搞图片,引发家人恐慌。尽管最初被视为无害的玩笑,但随着事件发酵,已导致警方不必要的出动,甚至造成实际的社会问题。此外,还讨论了AI生成内容在其他领域的滥用情况,如德勤因使用AI工具编写政府报告而被发现掺杂虚假信息。这些案例凸显了AI技术在娱乐和商业应用中面临的伦理挑战与安全隐患。

来源:36氪

12:52

「ChatGPT说我在浪费生命,但它错了」,WhatsApp前产品掌门人的清醒反击

「ChatGPT说我在浪费生命,但它错了」,WhatsApp前产品掌门人的清醒反击

Ami Vora,曾任WhatsApp产品负责人及Meta社交与商业产品整合策略负责人,现为Fair首席产品官。她分享了AI在日常生活中的应用实例,如辅助创作和人际交往准备,并强调了简单性作为产品设计的核心竞争力。Ami还讨论了AI反馈的局限性和未来交互方式的发展趋势,认为执行力比战略更重要,尤其是在快速迭代的AI时代。

来源:36氪