AI新闻

已选标签:
多模态AI
AI绘画
11月 27日
19 条新闻
19:07

靠「指指点点」做完整套海报,第一次觉得做设计不难了

靠「指指点点」做完整套海报,第一次觉得做设计不难了

新兴AI设计工具Lovart凭借自然语言操作、风格统一的设计能力和高效修改体验,迅速成为Canva和Figma等传统设计工具的替代者。其接入的‘地表最强’图像模型Nano Banana进一步提升了生成图像的质量与一致性。通过创新的ChatCanvas交互模式,用户可直接在画布上进行精准修改,极大提高了设计效率。此外,Lovart还支持多模态任务如视频生成,展示了AI在创意产业中的广泛应用潜力。

来源:36氪

19:06

压垮铂爵旅拍的最后一根稻草是AI?

压垮铂爵旅拍的最后一根稻草是AI?

随着AI拍图修图技术的不断进步,传统旅拍行业面临巨大挑战。以铂爵旅拍为例,其因无法适应市场变化及消费者偏好转向个性化、低成本的服务而陷入困境。AI技术通过提供更便捷、经济且高质量的图像生成与编辑解决方案,在个人摄影师和自动化工具的推动下正逐渐成为主流选择,促使实体旅拍企业必须重新思考其价值定位和服务模式。

来源:36氪

19:06

谷歌重启AI眼镜:富士康代工,三星设计,或2026Q4发布丨智能涌现独家

谷歌重启AI眼镜:富士康代工,三星设计,或2026Q4发布丨智能涌现独家

谷歌正推进两个AI眼镜项目,预计2026年Q4发布。项目采用富士康代工、三星参考设计及高通芯片,并计划配备波导片光学方案与摄像头。基于Gemini AI模型,整合自然语言理解、多模态推理等能力,将应用于物流、医疗培训等领域。谷歌在操作系统、内容生态和AI大模型方面布局完善,成为AI眼镜领域强有力的竞争对手。

来源:36氪

18:05

中信建投:对AI带动的算力需求以及应用非常乐观

中信建投证券近日发布研报称,目前世界正处于AI产业革命中,类比工业革命,影响深远,不能简单对比近几年的云计算、新能源等,需要以更长期的视角、更高的视野去观察。中信建投表示,对AI带动的算力需求以及应用非常乐观。其中,AI算力板块涉及先进制程、GPU/ASIC、光模块、PCB、服务器、交换机、光器件、铜连接、IDC及其配套(液冷、电源、电力、综合布线等)等,市值仍有空间。此外,AI大模型及应用也应高度关注。中信建投认为,AI算力大投入的背后需要大模型实现商业变现和闭环,建议要关注核心大模型公司。(广角观察)

来源:钛媒体

18:04

Gemini 3两小时淘汰ChatGPT,硅谷大佬倒戈:我回不去了

Gemini 3两小时淘汰ChatGPT,硅谷大佬倒戈:我回不去了

谷歌发布Gemini 3大模型,引发硅谷AI大佬集体赞誉。该模型在推理、速度及多模态处理方面表现出色,被视为谷歌强势回归AI领域的标志。Gemini 3不仅能够编写代码、设计界面,还能自主完成复杂任务如原创研究,标志着从聊天机器人向全能智能体的转变。其成功整合进搜索业务,推动了Alphabet市值接近4万亿美元,显示了商业落地的巨大潜力。

来源:36氪

18:04

你还在晒AI图,有人已经在靠“提示词”收款了

你还在晒AI图,有人已经在靠“提示词”收款了

即梦4.0通过多模态统一架构、一致性算法和4K高清生成等技术,显著提升了AI生成图片的真实感与细腻度,特别是在人物眼神和表情的处理上达到了前所未有的水平。该工具不仅降低了用户创作高质量图像的门槛,还催生了提示词交易这一新兴市场。这标志着我们正步入一个“所想即所得”的时代,AI技术正在改变人们记录生活的方式,并逐渐成为一种新的社交货币。

来源:36氪

18:04

扎克伯格聊新款Ray-Ban:眼镜会成下一代计算平台?Neural Band才是真的「疯狂」

扎克伯格聊新款Ray-Ban:眼镜会成下一代计算平台?Neural Band才是真的「疯狂」

在Meta Connect 2025大会上,扎克伯格发布了Ray-Ban Display智能眼镜与Meta Neural Band神经腕带,展示了AI助手在地图导航、实时翻译等场景的应用潜力。尽管现场演示出现技术故障,但业界仍对其持积极态度。扎克伯格强调,眼镜作为AI的理想载体,能够实现全天候互动,并预测未来AI将更自然地融入日常生活,提供无缝多任务处理能力。

来源:36氪

18:04

我不会画画,却用手机做出了一套四格漫画

我不会画画,却用手机做出了一套四格漫画

文章探讨了AI在四格漫画生成领域的应用,对比分析了KomikoAI、Dashtoon等工具。KomikoAI支持角色定制与编辑灵活度高,但需英文界面;Dashtoon则更专注于“爽漫”创作流程化,操作简便且有社区展示平台。尽管这些工具在人物一致性上表现良好,但在故事叙述能力上仍有待提升。这表明AI技术正逐步降低漫画创作门槛,为非专业人士提供了更多表达方式。

来源:36氪

18:03

从手办到试穿,最适合普通人的Nano Banana玩法

从手办到试穿,最适合普通人的Nano Banana玩法

Google推出的Gemini 2.5 Flash Image(Nano Banana)图像生成与编辑模型,以其出色的SOTA图像生成能力、角色一致性及快速处理速度受到广泛关注。该模型不仅在手办生成、虚拟试衣等创意领域展现出巨大潜力,还具备识别和推理真实世界的能力,为旅行、网购等日常生活场景提供了创新解决方案。尽管存在一些技术局限性,但其低门槛的用户友好性和广泛的应用场景使其成为AI图像处理领域的全能选手。

来源:36氪

17:00

Figma股价暴涨30%背后:CEO首次透露与OpenAI的「无谈判合作」

Figma股价暴涨30%背后:CEO首次透露与OpenAI的「无谈判合作」

OpenAI与设计软件Figma合作,将后者集成到ChatGPT中,允许用户在聊天过程中生成和编辑图表。同时,OpenAI推出了一种新的应用程序架构,使用户能够在对话中无缝互动多款应用,包括Booking、Canva等,以提升工作效率。这次合作不仅提升了用户体验,还展示了AI在跨模态处理及辅助设计方面的新潜力。

来源:36氪

16:25

大模型首次拥有“脖子”!纽大团队实现360度类人视觉搜索

大模型首次拥有“脖子”!纽大团队实现360度类人视觉搜索

纽约大学团队提出类人视觉搜索任务,让大模型具备360度主动视觉搜索能力。通过定义新数据集H*和基准测试H*Bench,研究展示了大模型在真实复杂环境中的高效搜索性能。采用监督微调与多轮强化学习策略,Qwen2.5-VL-3B-Instruct模型在目标与路径搜索上取得显著提升。此研究推动了从被动到主动的视觉空间推理范式转变。

来源:量子位

15:58

NeurIPS 2025最佳论文开奖,何恺明、孙剑等十年经典之作夺奖

NeurIPS 2025最佳论文开奖,何恺明、孙剑等十年经典之作夺奖

NeurIPS 2025揭晓最佳论文,华人学者占据半壁江山。研究涵盖扩散模型、自监督RL、注意力机制等领域。阿里千问团队提出门控注意力机制,显著提升大语言模型性能;普林斯顿大学等机构展示了深度网络在自监督强化学习中的突破性进展;巴黎PSL大学等解析了扩散模型避免记忆效应的内在机制。

来源:36氪

15:58

谷歌AI封神五年,AlphaFold狂揽诺奖,2亿蛋白结构全预测

谷歌AI封神五年,AlphaFold狂揽诺奖,2亿蛋白结构全预测

AlphaFold利用深度学习技术在几分钟内解决了50年的蛋白质结构预测难题,被全球330万研究者使用。它不仅加速了科研进程,还降低了实验成本,使得更多人能够参与复杂蛋白质结构的研究。从药物设计到生物育种,AlphaFold的应用范围广泛,推动了生命科学领域从验证区走向探索区,标志着AI正成为科研生产力工具的重要组成部分。

来源:36氪

15:58

谷歌 Ironwood TPU 突袭,英伟达 GPU 迎来挑战者?

谷歌 Ironwood TPU 突袭,英伟达 GPU 迎来挑战者?

谷歌发布第七代TPU Ironwood,性能提升显著,与ARM架构AxionVM共同构建全方位AI基础设施体系,提供“AI超级计算机即服务”模式。此方案对大模型训练、推理及服务场景友好,大幅降低AI落地门槛和运维成本。英伟达强调其在通用性、兼容性和生态方面的优势,但市场格局正面临挑战。未来AI芯片市场将呈现多样化共存态势,投资逻辑转向全栈服务能力。

来源:36氪

14:55

我用AI生成流浪汉骗我爸,结果他摇来了特警

我用AI生成流浪汉骗我爸,结果他摇来了特警

新闻报道了TikTok等社交平台上流行的‘AI流浪汉进家门’恶作剧现象,青少年利用Snapchat、Nano banana等AI图像生成工具制作逼真的恶搞图片,引发家人恐慌。尽管最初被视为无害的玩笑,但随着事件发酵,已导致警方不必要的出动,甚至造成实际的社会问题。此外,还讨论了AI生成内容在其他领域的滥用情况,如德勤因使用AI工具编写政府报告而被发现掺杂虚假信息。这些案例凸显了AI技术在娱乐和商业应用中面临的伦理挑战与安全隐患。

来源:36氪

14:08

未来将在帕洛阿尔托为您揭晓

未来将在帕洛阿尔托为您揭晓

本次TechCrunch活动汇聚了多位AI领域专家,探讨了从半导体制造到脑机接口等前沿技术。Mina Fahmi展示了一款能将低声话语转化为文本的智能戒指,而Max Hodak则分享了其在生物混合脑机接口上的进展,旨在帮助瘫痪患者通过思维控制设备。此外,Chi-Hua Chien和Elizabeth Weil两位VC投资人认为当前对AI的投资过于集中在企业级应用上,忽视了更广泛的创新机会。

来源:TechCrunch AI

12:52

木头姐重磅发声:AI根本不是泡沫,未来十年最大财富机会才刚开始

木头姐重磅发声:AI根本不是泡沫,未来十年最大财富机会才刚开始

方舟投资预测,到2030年全球AI用户将增至40亿至50亿,AI基础模型公司收入有望从当前的300亿美元增长至1.5万亿美元。芯片与电力短缺限制了AI基础设施扩张,但市场需求强劲。AI被视为加速其他创新平台如机器人技术、能源存储等的关键催化剂,预计推动实际GDP增长至7%-8%。当前AI发展阶段类似于1995年的互联网初期,具有巨大潜力而非泡沫。

来源:36氪

11:15

NeurIPS 2025放榜:阿里Qwen门控注意力获最佳论文,何恺明Faster R-CNN获时间检验奖

NeurIPS 2025放榜:阿里Qwen门控注意力获最佳论文,何恺明Faster R-CNN获时间检验奖

NeurIPS 2025最佳论文奖揭晓,阿里Qwen门控注意力机制获最佳论文,其创新在于通过引入特定于注意力头的sigmoid门控,显著提升了大语言模型性能及训练稳定性。何恺明等人提出的Faster R-CNN因极大提升目标检测速度而获得时间检验奖。此外,研究还揭示了扩散模型防止过拟合的内在机制以及深度扩展对自监督强化学习的重要影响。

来源:量子位

11月 26日
1 条新闻
19:24

谷歌用Gemini 3同时革了OpenAI和英伟达两家的命

谷歌用Gemini 3同时革了OpenAI和英伟达两家的命

谷歌发布Gemini 3,展示了其在多模态处理和原生思考方面的重大突破,挑战了OpenAI的模型优势与英伟达的算力垄断。Gemini 3不仅实现了更自然的多感官交互,还通过自研TPU大幅降低了训练成本,提高了效率。这标志着AI技术从单一依赖向软硬件一体化方向发展的重要转折点,预示着未来AI产业将更加注重全栈能力与生态构建。

来源:36氪