09:29 阿里入“镜”,夸克叩门 阿里夸克发布6款AI眼镜,涵盖S1和G1两大系列,旨在成为AI入口,整合千问大模型及阿里生态核心场景。产品定位为全天候智能终端,具备24小时续航能力,并支持支付宝、高德地图等应用。此举措标志着阿里在智能硬件领域的新尝试,通过轻量级载体推动AI能力从手机向物理世界延伸,争夺下一代人机交互主导权。 来源:36氪
22:16 10000个代码文件,我打几把游戏的功夫就搞成Wiki了! Qoder AI编程工具通过强大的多模态模型与专项自研模型结合,实现了对复杂代码工程的高效理解与处理。其Repo Wiki功能能够自动将大型项目转化为结构清晰的Wiki文档,极大提升了代码审查效率及团队协作能力。支持IDE、CLI和JetBrains插件三种形态,满足不同开发者需求。特别在真实软件研发领域展现出卓越性能,包括快速检索大量代码文件、智能问答、由自然语言驱动的任务执行等,为AI辅助编程树立了新标杆。 来源:量子位
22:13 DeepSeek发布可自验证数学模型DeepSeekMath-V2 DeepSeek推出新型数学推理模型DeepSeekMath-V2,采用可自我验证的训练框架。该模型基于DeepSeek-V3.2-Exp-Base构建,通过LLM验证器自动审查生成的数学证明,并利用高难度样本持续优化性能。在IMO 2025和CMO 2024中均达到金牌水平,Putnam 2024获118/120分。团队表示,该成果验证了自验证推理路径的可行性,为构建可靠数学智能系统提供新方向。模型代码与权重已开源,发布于Hugging Face及GitHub平台。(广角观察) 来源:钛媒体
21:10 美国宣战,AI曼哈顿计划打响第一枪,“AI科学家”成最新核武器 美国启动”创世纪计划”,旨在通过AI加速科研创新,将其深度嵌入科学假设提出、实验设计及数据分析等环节。该计划强调AI需生成可验证的结果,并与传统物理模型结合以提升预测准确性。同时,神经符号AI的融合被视为迈向人类级智能的关键路径之一。此战略不仅促进科研生产力跃升,还推动了跨学科协作和数据标准化,为实现通用人工智能(AGI)奠定基础。 来源:36氪
20:08 女频化、抽卡师、全面出海:AI漫剧的十大趋势 AI技术正在重塑动漫行业,通过深度学习和计算机视觉等技术,AI漫剧以低成本、高效率的方式颠覆了传统动画制作模式。各大平台如抖音、快手、B站等纷纷推出扶持计划,促进内容创新与人才挖掘。AI漫剧不仅在题材上实现了多元化尝试,还探索了新的付费模式,并开始布局海外市场。此外,随着AI技术的进步,新型职业如’抽卡师’应运而生,进一步提高了生产效率。 来源:36氪
19:07 靠「指指点点」做完整套海报,第一次觉得做设计不难了 新兴AI设计工具Lovart凭借自然语言操作、风格统一的设计能力和高效修改体验,迅速成为Canva和Figma等传统设计工具的替代者。其接入的‘地表最强’图像模型Nano Banana进一步提升了生成图像的质量与一致性。通过创新的ChatCanvas交互模式,用户可直接在画布上进行精准修改,极大提高了设计效率。此外,Lovart还支持多模态任务如视频生成,展示了AI在创意产业中的广泛应用潜力。 来源:36氪
19:07 卡卡卡卡卡……马卡龙是真的卡,但态度也是真的好 马卡龙(Macaron),一款被定义为Personal Agent的应用,强调通过深入了解用户需求来提供个性化服务。它利用强化学习驱动的深度记忆技术,以实现长期且连贯的记忆功能,旨在成为用户的智能伙伴。尽管在生成小程序时存在效率与质量上的问题,但其主动挖掘并满足用户潜在需求的能力展示了AI助手向更人性化、陪伴式方向发展的趋势。 来源:36氪
19:06 英伟达内部有人要求“少用AI”,黄仁勋当场发飙:“你疯了吗?” 英伟达CEO黄仁勋强调AI自动化的重要性,要求所有可自动化的任务必须使用AI,并鼓励员工拥抱AI以提升竞争力。公司内部已广泛采用如Cursor等AI编码助手,显示了工程体系向AI原生转变的趋势。黄仁勋个人也积极使用多种AI工具,从ChatGPT到Perplexity,覆盖日常工作各方面。他坚信AI不会替代人类工作,而是改变工作内容,促进生产力提升而不致失业。 来源:36氪
19:06 阿里下场硬刚字节,争夺AI超级入口 阿里发布新版AI助手“千问”,定位为C端生活入口,搭载自家最强Qwen3-Max大模型,旨在打造中国版ChatGPT。面对字节豆包等强劲对手,阿里在AI to C领域加速布局,试图通过构建超级应用入口解决长期的流量焦虑问题。同时,阿里计划在未来三年投入3800亿元建设云和AI基础设施,以期在AI时代重新获取流量优势。 来源:36氪
19:06 吃瓜、开会、追热点,我靠AI稳坐信息高地 ListenHub是一款利用AI技术将长文转为播客的工具,支持多种输入方式包括链接、文件等,并能根据用户需求生成不同长度的播客。它采用了先进的自然语言处理技术和文本到语音转换技术,能够高效提炼文章核心内容并以对话形式呈现。此外,ListenHub还推出了FlowSpeech功能,允许用户使用自定义音色制作更加个性化的播客,满足了从普通听众到专业创作者的不同需求。 来源:36氪
19:06 谷歌重启AI眼镜:富士康代工,三星设计,或2026Q4发布丨智能涌现独家 谷歌正推进两个AI眼镜项目,预计2026年Q4发布。项目采用富士康代工、三星参考设计及高通芯片,并计划配备波导片光学方案与摄像头。基于Gemini AI模型,整合自然语言理解、多模态推理等能力,将应用于物流、医疗培训等领域。谷歌在操作系统、内容生态和AI大模型方面布局完善,成为AI眼镜领域强有力的竞争对手。 来源:36氪
18:05 中信建投:对AI带动的算力需求以及应用非常乐观 中信建投证券近日发布研报称,目前世界正处于AI产业革命中,类比工业革命,影响深远,不能简单对比近几年的云计算、新能源等,需要以更长期的视角、更高的视野去观察。中信建投表示,对AI带动的算力需求以及应用非常乐观。其中,AI算力板块涉及先进制程、GPU/ASIC、光模块、PCB、服务器、交换机、光器件、铜连接、IDC及其配套(液冷、电源、电力、综合布线等)等,市值仍有空间。此外,AI大模型及应用也应高度关注。中信建投认为,AI算力大投入的背后需要大模型实现商业变现和闭环,建议要关注核心大模型公司。(广角观察) 来源:钛媒体
18:04 「AI界淘宝」MuleRun:上线10天涌入21万用户,要做全球最大劳动力外包公司 MuleRun作为全球首个AI Agent交易市场,通过结合80%的SOP和20%的大模型能力,为用户提供解决特定场景下重复、琐碎任务的Agent。平台不仅促进了AI技术在实际问题中的应用,还为创作者提供了变现机会。该模式有望推动AI劳动力外包的发展,加速AI技术在各行业的普及与商业化进程。 来源:36氪
18:04 Gemini 3两小时淘汰ChatGPT,硅谷大佬倒戈:我回不去了 谷歌发布Gemini 3大模型,引发硅谷AI大佬集体赞誉。该模型在推理、速度及多模态处理方面表现出色,被视为谷歌强势回归AI领域的标志。Gemini 3不仅能够编写代码、设计界面,还能自主完成复杂任务如原创研究,标志着从聊天机器人向全能智能体的转变。其成功整合进搜索业务,推动了Alphabet市值接近4万亿美元,显示了商业落地的巨大潜力。 来源:36氪
18:04 你还在晒AI图,有人已经在靠“提示词”收款了 即梦4.0通过多模态统一架构、一致性算法和4K高清生成等技术,显著提升了AI生成图片的真实感与细腻度,特别是在人物眼神和表情的处理上达到了前所未有的水平。该工具不仅降低了用户创作高质量图像的门槛,还催生了提示词交易这一新兴市场。这标志着我们正步入一个“所想即所得”的时代,AI技术正在改变人们记录生活的方式,并逐渐成为一种新的社交货币。 来源:36氪
18:04 扎克伯格聊新款Ray-Ban:眼镜会成下一代计算平台?Neural Band才是真的「疯狂」 在Meta Connect 2025大会上,扎克伯格发布了Ray-Ban Display智能眼镜与Meta Neural Band神经腕带,展示了AI助手在地图导航、实时翻译等场景的应用潜力。尽管现场演示出现技术故障,但业界仍对其持积极态度。扎克伯格强调,眼镜作为AI的理想载体,能够实现全天候互动,并预测未来AI将更自然地融入日常生活,提供无缝多任务处理能力。 来源:36氪
18:04 我不会画画,却用手机做出了一套四格漫画 文章探讨了AI在四格漫画生成领域的应用,对比分析了KomikoAI、Dashtoon等工具。KomikoAI支持角色定制与编辑灵活度高,但需英文界面;Dashtoon则更专注于“爽漫”创作流程化,操作简便且有社区展示平台。尽管这些工具在人物一致性上表现良好,但在故事叙述能力上仍有待提升。这表明AI技术正逐步降低漫画创作门槛,为非专业人士提供了更多表达方式。 来源:36氪
18:03 从手办到试穿,最适合普通人的Nano Banana玩法 Google推出的Gemini 2.5 Flash Image(Nano Banana)图像生成与编辑模型,以其出色的SOTA图像生成能力、角色一致性及快速处理速度受到广泛关注。该模型不仅在手办生成、虚拟试衣等创意领域展现出巨大潜力,还具备识别和推理真实世界的能力,为旅行、网购等日常生活场景提供了创新解决方案。尽管存在一些技术局限性,但其低门槛的用户友好性和广泛的应用场景使其成为AI图像处理领域的全能选手。 来源:36氪
17:00 Figma股价暴涨30%背后:CEO首次透露与OpenAI的「无谈判合作」 OpenAI与设计软件Figma合作,将后者集成到ChatGPT中,允许用户在聊天过程中生成和编辑图表。同时,OpenAI推出了一种新的应用程序架构,使用户能够在对话中无缝互动多款应用,包括Booking、Canva等,以提升工作效率。这次合作不仅提升了用户体验,还展示了AI在跨模态处理及辅助设计方面的新潜力。 来源:36氪
16:25 大模型首次拥有“脖子”!纽大团队实现360度类人视觉搜索 纽约大学团队提出类人视觉搜索任务,让大模型具备360度主动视觉搜索能力。通过定义新数据集H*和基准测试H*Bench,研究展示了大模型在真实复杂环境中的高效搜索性能。采用监督微调与多轮强化学习策略,Qwen2.5-VL-3B-Instruct模型在目标与路径搜索上取得显著提升。此研究推动了从被动到主动的视觉空间推理范式转变。 来源:量子位