12:11 阿里发布Qwen-Image模型新版本,千问APP首发接入 阿里巴巴发布了图片生成及编辑模型Qwen-Image的更新。新模型在图像编辑中维持了更高的一致性,并在多视角转换、多图像融合、多模态推理等方面取得突破进展。目前,新版本Qwen-Image已首发接入千问APP,用户可无限次免费使用。(广角观察) 来源:钛媒体
22:50 黑森林实验室以32.5亿美元估值筹集3亿美元资金 德国AI实验室Black Forest Labs完成3亿美元B轮融资,估值达32.5亿美元。该公司专注于开发生成和编辑图像的基础AI模型,其最新版本Flux 2支持高达4K分辨率的图像生成,并能参考多达10张图片保持风格一致性。该技术已被Adobe、ElevenLabs等多家公司采用。 来源:TechCrunch AI
18:15 免费国产Banana真香!我想把PS给卸载了 Vidu Q2在AI生图领域展示了卓越的一致性和细节控制能力,不仅能够精准复刻多元素融合的图像,还提供了文生图和图像编辑功能。其图像编辑功能甚至可与PS媲美,通过自然语言指令即可实现复杂编辑。Vidu构建了一站式从参考生图到参考生视频的工作流,极大降低了内容创作的技术门槛和成本。这一进展体现了AI技术在创意工具领域的深入应用及其向更便捷、高效方向发展的趋势。 来源:量子位
16:59 6B文生图模型,上线即登顶抱抱脸 阿里通义推出6B参数的Z-Image文生图模型,上线即登顶HuggingFace榜单。该模型在图像生成、文本渲染及语义理解方面表现优异,采用S3-DiT架构和蒸馏技术优化,实现高效推理与高质量输出。Z-Image-Turbo版本已开源,支持写实风格图像生成和复杂文本渲染,适用于旅游攻略设计、科普漫画创作等场景,为图像生成领域带来新的突破。 来源:量子位
10:15 华尔街尬捧TPU学术界懵了:何恺明5年前就是TPU编程高手,多新鲜 新闻指出,尽管市场对谷歌TPU的突然追捧导致英伟达股价下跌,但Meta、xAI等大公司及学术界早已广泛使用TPU进行AI模型训练。技术上,谷歌与英伟达均未形成绝对优势;成本方面,基于Llama 3.3的评测显示,H100相比TPU v6e在性价比上有显著优势。分析认为,谷歌通过TPU销售更多是为了保障产能而非直接竞争。 来源:量子位
21:10 谷歌AI往事:隐秘的二十年,与狂奔的365天 谷歌凭借Gemini 3与Nano Banana Pro等模型,在AI生图精度和想象力上取得显著进展,月活跃用户大幅增长。其成功源于长期投资和技术积累,包括早期的‘猫论文’、大规模神经网络训练及DeepMind收购等关键节点。这些举措不仅推动了无监督学习、推荐系统等技术的发展,还促进了整个AI产业的繁荣。 来源:36氪
20:09 汇丰:预计OpenAI到2030年仍难以盈利 汇丰分析师预计,到2030年底,OpenAI的用户基础将增长到占全球成年人口的44%左右(2025年为10%),但是仍然无法实现盈利。除此之外,OpenAI还需要至少再投资2070亿美元用于提高算力,才能跟上其增长计划。(广角观察) 来源:钛媒体
19:06 压垮铂爵旅拍的最后一根稻草是AI? 随着AI拍图修图技术的不断进步,传统旅拍行业面临巨大挑战。以铂爵旅拍为例,其因无法适应市场变化及消费者偏好转向个性化、低成本的服务而陷入困境。AI技术通过提供更便捷、经济且高质量的图像生成与编辑解决方案,在个人摄影师和自动化工具的推动下正逐渐成为主流选择,促使实体旅拍企业必须重新思考其价值定位和服务模式。 来源:36氪
18:04 你还在晒AI图,有人已经在靠“提示词”收款了 即梦4.0通过多模态统一架构、一致性算法和4K高清生成等技术,显著提升了AI生成图片的真实感与细腻度,特别是在人物眼神和表情的处理上达到了前所未有的水平。该工具不仅降低了用户创作高质量图像的门槛,还催生了提示词交易这一新兴市场。这标志着我们正步入一个“所想即所得”的时代,AI技术正在改变人们记录生活的方式,并逐渐成为一种新的社交货币。 来源:36氪
18:04 我不会画画,却用手机做出了一套四格漫画 文章探讨了AI在四格漫画生成领域的应用,对比分析了KomikoAI、Dashtoon等工具。KomikoAI支持角色定制与编辑灵活度高,但需英文界面;Dashtoon则更专注于“爽漫”创作流程化,操作简便且有社区展示平台。尽管这些工具在人物一致性上表现良好,但在故事叙述能力上仍有待提升。这表明AI技术正逐步降低漫画创作门槛,为非专业人士提供了更多表达方式。 来源:36氪
18:03 从手办到试穿,最适合普通人的Nano Banana玩法 Google推出的Gemini 2.5 Flash Image(Nano Banana)图像生成与编辑模型,以其出色的SOTA图像生成能力、角色一致性及快速处理速度受到广泛关注。该模型不仅在手办生成、虚拟试衣等创意领域展现出巨大潜力,还具备识别和推理真实世界的能力,为旅行、网购等日常生活场景提供了创新解决方案。尽管存在一些技术局限性,但其低门槛的用户友好性和广泛的应用场景使其成为AI图像处理领域的全能选手。 来源:36氪
16:14 5亿热钱砸向清华AI Infra明星:最大化算力效能筑造智能体基建 无问芯穹完成近5亿元A+轮融资,累计融资近15亿。公司凭借软硬协同、多元异构的技术优势,在AI基础设施领域实现差异化发展。资金将用于扩大技术领先优势、推动AI云与终端方案规模化拓展及加大智能体基础设施研发投入。其“智能体基础设施×(AI云+终端智能)”战略精准把握了智能体时代的核心需求,展示了在云端大算力、终端大模型推理等方面的体系化能力。 来源:量子位
16:07 月之暗面公开RL训练加速方法:训练速度暴涨97%,长尾延迟狂降93% 月之暗面联合清华大学提出全新加速引擎Seer,显著提升LLM强化学习训练速度,在不改变核心算法前提下,实现Rollout效率提升74%~97%,长尾延迟减少75%~93%。Seer通过三大模块(推理引擎池、请求缓冲区、上下文管理器)和三项关键技术(分段生成、上下文感知调度、自适应分组推测解码),从内存、调度、推理三个维度优化rollout效率。实验验证表明,Seer在不同工作负载中均实现性能突破,吞吐量提升显著,且大幅降低长尾延迟。 来源:量子位
15:58 谷歌 Ironwood TPU 突袭,英伟达 GPU 迎来挑战者? 谷歌发布第七代TPU Ironwood,性能提升显著,与ARM架构AxionVM共同构建全方位AI基础设施体系,提供“AI超级计算机即服务”模式。此方案对大模型训练、推理及服务场景友好,大幅降低AI落地门槛和运维成本。英伟达强调其在通用性、兼容性和生态方面的优势,但市场格局正面临挑战。未来AI芯片市场将呈现多样化共存态势,投资逻辑转向全栈服务能力。 来源:36氪
14:55 我用AI生成流浪汉骗我爸,结果他摇来了特警 新闻报道了TikTok等社交平台上流行的‘AI流浪汉进家门’恶作剧现象,青少年利用Snapchat、Nano banana等AI图像生成工具制作逼真的恶搞图片,引发家人恐慌。尽管最初被视为无害的玩笑,但随着事件发酵,已导致警方不必要的出动,甚至造成实际的社会问题。此外,还讨论了AI生成内容在其他领域的滥用情况,如德勤因使用AI工具编写政府报告而被发现掺杂虚假信息。这些案例凸显了AI技术在娱乐和商业应用中面临的伦理挑战与安全隐患。 来源:36氪
11:50 1000个AI王子围攻我:今年最阴间的Steam礼物 本文介绍了使用AI工具如Midjourney、ChatGPT等制作的乙女游戏《1000王子:生而为爱你》,尽管画质粗糙且剧情离谱,但展现了AI在游戏创作领域的潜力和平权作用。Steam平台对AI辅助制作游戏持开放态度,促进了个人创作者利用AI技术进行内容创新的可能性。 来源:36氪
17:28 开源模型叫板Nano Banana Pro!Stable Diffusion原班人马杀回来了 Flux.2,由Stable Diffusion原班人马打造的开源AI生图模型,提供多种版本选择,生图质量媲美谷歌Nano Banana Pro但成本更低。该模型在精细控制、多参考图像融合及高分辨率图像编辑方面表现出色,支持高达4MP分辨率的图像处理。Flux.2强调性价比,适用于创意设计与日常实用场景,为用户提供更经济高效的AI绘图解决方案。 来源:量子位
12:06 腾讯混元3D创作引擎上线国际站 腾讯混元3D创作引擎国际站正式上线。从现在起,海外用户无需下载或配置任何开发环境,只需注册登录,就能直接用文字、图片或草图生成3D作品。同时,混元3D模型API也已在腾讯云国际站同步开放。(广角观察) 来源:钛媒体
20:37 谷歌训出Gemini 3的TPU,已成老黄心腹大患,Meta已倒戈 谷歌启动TPU@Premises计划,直接向Meta等巨头提供算力,挑战英伟达在高端AI芯片市场的垄断。最新TPU v7在算力与显存上追平英伟达B200,通过拥抱PyTorch拆解CUDA壁垒,实现私有化部署和同级性能,显著提升训练效率和资源利用率。 来源:36氪
20:36 AI芯片开启第二战场 谷歌TPU芯片成为AI硬件焦点,与博通合作开发TPU v7p预计2026年推出。Meta计划租用并部署谷歌TPU,交易规模或达数十亿美元。谷歌TPU在大规模、低功耗推理上展现优势,支持Gemini 3等模型训练。市场对ASIC芯片兴趣重燃,预计2026-2027年各大CSP的ASIC数量将迎来爆发式增长。 来源:36氪