AI新闻

已选标签:
AI训练
AI绘画
12月 2日
1 条新闻
12月 1日
3 条新闻
18:15

免费国产Banana真香!我想把PS给卸载了

免费国产Banana真香!我想把PS给卸载了

Vidu Q2在AI生图领域展示了卓越的一致性和细节控制能力,不仅能够精准复刻多元素融合的图像,还提供了文生图和图像编辑功能。其图像编辑功能甚至可与PS媲美,通过自然语言指令即可实现复杂编辑。Vidu构建了一站式从参考生图到参考生视频的工作流,极大降低了内容创作的技术门槛和成本。这一进展体现了AI技术在创意工具领域的深入应用及其向更便捷、高效方向发展的趋势。

来源:量子位

16:59

6B文生图模型,上线即登顶抱抱脸

6B文生图模型,上线即登顶抱抱脸

阿里通义推出6B参数的Z-Image文生图模型,上线即登顶HuggingFace榜单。该模型在图像生成、文本渲染及语义理解方面表现优异,采用S3-DiT架构和蒸馏技术优化,实现高效推理与高质量输出。Z-Image-Turbo版本已开源,支持写实风格图像生成和复杂文本渲染,适用于旅游攻略设计、科普漫画创作等场景,为图像生成领域带来新的突破。

来源:量子位

11月 30日
1 条新闻
10:15

华尔街尬捧TPU学术界懵了:何恺明5年前就是TPU编程高手,多新鲜

华尔街尬捧TPU学术界懵了:何恺明5年前就是TPU编程高手,多新鲜

新闻指出,尽管市场对谷歌TPU的突然追捧导致英伟达股价下跌,但Meta、xAI等大公司及学术界早已广泛使用TPU进行AI模型训练。技术上,谷歌与英伟达均未形成绝对优势;成本方面,基于Llama 3.3的评测显示,H100相比TPU v6e在性价比上有显著优势。分析认为,谷歌通过TPU销售更多是为了保障产能而非直接竞争。

来源:量子位

11月 27日
11 条新闻
21:10

谷歌AI往事:隐秘的二十年,与狂奔的365天

谷歌凭借Gemini 3与Nano Banana Pro等模型,在AI生图精度和想象力上取得显著进展,月活跃用户大幅增长。其成功源于长期投资和技术积累,包括早期的‘猫论文’、大规模神经网络训练及DeepMind收购等关键节点。这些举措不仅推动了无监督学习、推荐系统等技术的发展,还促进了整个AI产业的繁荣。

来源:36氪

19:06

压垮铂爵旅拍的最后一根稻草是AI?

压垮铂爵旅拍的最后一根稻草是AI?

随着AI拍图修图技术的不断进步,传统旅拍行业面临巨大挑战。以铂爵旅拍为例,其因无法适应市场变化及消费者偏好转向个性化、低成本的服务而陷入困境。AI技术通过提供更便捷、经济且高质量的图像生成与编辑解决方案,在个人摄影师和自动化工具的推动下正逐渐成为主流选择,促使实体旅拍企业必须重新思考其价值定位和服务模式。

来源:36氪

18:04

你还在晒AI图,有人已经在靠“提示词”收款了

你还在晒AI图,有人已经在靠“提示词”收款了

即梦4.0通过多模态统一架构、一致性算法和4K高清生成等技术,显著提升了AI生成图片的真实感与细腻度,特别是在人物眼神和表情的处理上达到了前所未有的水平。该工具不仅降低了用户创作高质量图像的门槛,还催生了提示词交易这一新兴市场。这标志着我们正步入一个“所想即所得”的时代,AI技术正在改变人们记录生活的方式,并逐渐成为一种新的社交货币。

来源:36氪

18:04

我不会画画,却用手机做出了一套四格漫画

我不会画画,却用手机做出了一套四格漫画

文章探讨了AI在四格漫画生成领域的应用,对比分析了KomikoAI、Dashtoon等工具。KomikoAI支持角色定制与编辑灵活度高,但需英文界面;Dashtoon则更专注于“爽漫”创作流程化,操作简便且有社区展示平台。尽管这些工具在人物一致性上表现良好,但在故事叙述能力上仍有待提升。这表明AI技术正逐步降低漫画创作门槛,为非专业人士提供了更多表达方式。

来源:36氪

18:03

从手办到试穿,最适合普通人的Nano Banana玩法

从手办到试穿,最适合普通人的Nano Banana玩法

Google推出的Gemini 2.5 Flash Image(Nano Banana)图像生成与编辑模型,以其出色的SOTA图像生成能力、角色一致性及快速处理速度受到广泛关注。该模型不仅在手办生成、虚拟试衣等创意领域展现出巨大潜力,还具备识别和推理真实世界的能力,为旅行、网购等日常生活场景提供了创新解决方案。尽管存在一些技术局限性,但其低门槛的用户友好性和广泛的应用场景使其成为AI图像处理领域的全能选手。

来源:36氪

16:14

5亿热钱砸向清华AI Infra明星:最大化算力效能筑造智能体基建

5亿热钱砸向清华AI Infra明星:最大化算力效能筑造智能体基建

无问芯穹完成近5亿元A+轮融资,累计融资近15亿。公司凭借软硬协同、多元异构的技术优势,在AI基础设施领域实现差异化发展。资金将用于扩大技术领先优势、推动AI云与终端方案规模化拓展及加大智能体基础设施研发投入。其“智能体基础设施×(AI云+终端智能)”战略精准把握了智能体时代的核心需求,展示了在云端大算力、终端大模型推理等方面的体系化能力。

来源:量子位

16:07

月之暗面公开RL训练加速方法:训练速度暴涨97%,长尾延迟狂降93%

月之暗面公开RL训练加速方法:训练速度暴涨97%,长尾延迟狂降93%

月之暗面联合清华大学提出全新加速引擎Seer,显著提升LLM强化学习训练速度,在不改变核心算法前提下,实现Rollout效率提升74%~97%,长尾延迟减少75%~93%。Seer通过三大模块(推理引擎池、请求缓冲区、上下文管理器)和三项关键技术(分段生成、上下文感知调度、自适应分组推测解码),从内存、调度、推理三个维度优化rollout效率。实验验证表明,Seer在不同工作负载中均实现性能突破,吞吐量提升显著,且大幅降低长尾延迟。

来源:量子位

15:58

谷歌 Ironwood TPU 突袭,英伟达 GPU 迎来挑战者?

谷歌 Ironwood TPU 突袭,英伟达 GPU 迎来挑战者?

谷歌发布第七代TPU Ironwood,性能提升显著,与ARM架构AxionVM共同构建全方位AI基础设施体系,提供“AI超级计算机即服务”模式。此方案对大模型训练、推理及服务场景友好,大幅降低AI落地门槛和运维成本。英伟达强调其在通用性、兼容性和生态方面的优势,但市场格局正面临挑战。未来AI芯片市场将呈现多样化共存态势,投资逻辑转向全栈服务能力。

来源:36氪

14:55

我用AI生成流浪汉骗我爸,结果他摇来了特警

我用AI生成流浪汉骗我爸,结果他摇来了特警

新闻报道了TikTok等社交平台上流行的‘AI流浪汉进家门’恶作剧现象,青少年利用Snapchat、Nano banana等AI图像生成工具制作逼真的恶搞图片,引发家人恐慌。尽管最初被视为无害的玩笑,但随着事件发酵,已导致警方不必要的出动,甚至造成实际的社会问题。此外,还讨论了AI生成内容在其他领域的滥用情况,如德勤因使用AI工具编写政府报告而被发现掺杂虚假信息。这些案例凸显了AI技术在娱乐和商业应用中面临的伦理挑战与安全隐患。

来源:36氪

11月 26日
2 条新闻
17:28

开源模型叫板Nano Banana Pro!Stable Diffusion原班人马杀回来了

开源模型叫板Nano Banana Pro!Stable Diffusion原班人马杀回来了

Flux.2,由Stable Diffusion原班人马打造的开源AI生图模型,提供多种版本选择,生图质量媲美谷歌Nano Banana Pro但成本更低。该模型在精细控制、多参考图像融合及高分辨率图像编辑方面表现出色,支持高达4MP分辨率的图像处理。Flux.2强调性价比,适用于创意设计与日常实用场景,为用户提供更经济高效的AI绘图解决方案。

来源:量子位

11月 25日
2 条新闻
20:36

AI芯片开启第二战场

AI芯片开启第二战场

谷歌TPU芯片成为AI硬件焦点,与博通合作开发TPU v7p预计2026年推出。Meta计划租用并部署谷歌TPU,交易规模或达数十亿美元。谷歌TPU在大规模、低功耗推理上展现优势,支持Gemini 3等模型训练。市场对ASIC芯片兴趣重燃,预计2026-2027年各大CSP的ASIC数量将迎来爆发式增长。

来源:36氪