AI新闻

已选标签:
AI对话
多模态AI
11月 25日
8 条新闻
12:19

千问、灵光、夸克,阿里AI疯狂“补课”

阿里近期推出千问APP和灵光APP两款C端AI产品,依托Qwen3-Max等大模型技术,在推理、编程及中文语境理解上展现优势。然而,在多模态与生态整合方面仍存短板,尤其是Agent能力需进一步提升。尽管入局较晚,但凭借算力、数据、人才及开源策略的优势,千问仍有反超竞品的潜力。未来能否成为超级入口,关键在于突破核心技术瓶颈,实现更深层次的生态联动。

来源:36氪

12:19

Claude Opus 4.5来了,单次生成打造《我的世界》,还破解高难度Agent测评

Claude Opus 4.5来了,单次生成打造《我的世界》,还破解高难度Agent测评

Anthropic发布Claude Opus 4.5,全球最强编程模型之一,在SWE-bench Verified测试中得分超80%,面试表现超越人类。该模型在前端开发、复杂项目处理(如《我的世界》克隆版)及多语言编程上表现出色,同时提升了安全性与上下文管理能力。新增思考强度控制和上下文压缩功能,显著降低了使用成本,每百万tokens定价降至5美元(输入)/25美元(输出)。Claude Opus 4.5代表了AI从代码补全向端到端开发伙伴演进的重要里程碑。

来源:36氪

11:30

Nano Banana新玩法无限套娃!“GPT-5都不会处理这种级别的递归”

Nano Banana新玩法无限套娃!“GPT-5都不会处理这种级别的递归”

Nano Banana Pro展示了强大的多模态处理能力,通过复杂的递归图像生成任务,如1998年的艺术家绘制递归场景,赢得了包括Google DeepMind提示工程师Riley Goodside在内的专业人士赞赏。其创新的图像理解和生成技术推动了AI在艺术创作领域的应用边界。同时,Gemini 3发布后市场份额显著提升,显示了用户对更智能、多功能AI模型的偏好趋势。

来源:量子位

09:14

Gemini 3 之后,谷歌首席科学家 Jeff Dean 说清 AI 的 3 个关键信号

Jeff Dean 在斯坦福演讲中回顾了 15 年 AI 演进,重点介绍了 Gemini 3 的独特能力。Gemini 3 采用 Pathways 架构,通过 MoE 技术实现高效推理,仅激活所需模块。此外,Gemini 3 展现了从回答到行动的转变,通过强化学习和工具调用完成复杂任务。Jeff Dean 强调,AI 的普及需兼顾效率与成本,TPU 和蒸馏技术使得模型在现实约束下落地成为可能。

来源:36氪

09:13

漫剧启示录:互联网最差的生意,可能是AI最好的生意

漫剧启示录:互联网最差的生意,可能是AI最好的生意

AI技术在内容产业中展现出巨大潜力,特别是在漫剧制作领域。通过深度学习等技术,AI已将漫剧制作成本降至每分钟1000-2500元,周期缩短至10-13天,显著提高了生产效率和降低了成本。此外,AIGC(AI Generated Content)正逐步改变内容创作方式,从辅助工具向主导者转变,不仅在图像、视频生成上取得突破,还促进了跨模态内容的融合与创新,预计未来市场空间可达千亿级别。

来源:36氪

08:10

被Meta裁掉的硅谷AI大佬田渊栋:AI时代,所有人终将失业?

Meta裁员事件引发AI行业关注,AI科学家田渊栋离职后受到多家科技巨头青睐。他指出,随着自动化程度提高,未来将有更多工作被AI取代,但人类独有的洞察力与知识仍不可替代。田渊栋强调,在AI时代,人们需寻找个人‘独一无二’的价值所在,尤其是在创造性劳动方面。此外,他还提到当前大模型的学习效率仍不及人类,但在重复性任务上表现出色。

来源:36氪

03:08

Anthropic发布Opus 4.5,新增Chrome和Excel集成功能

Anthropic发布Opus 4.5,新增Chrome和Excel集成功能

Anthropic发布Opus 4.5,其最新旗舰模型在编码基准、工具使用及问题解决方面表现卓越,特别是在SWE-Bench上得分超过80%。新版本增强了长期上下文处理能力,支持“无尽聊天”功能,并优化了内存管理。此外,Claude for Chrome和Excel产品将更广泛地推出,旨在提升AI在编程辅助与办公自动化中的应用效率。

来源:TechCrunch AI

02:29

顶流设计Agent能用Nano Banana Pro了!一句话BlackPink变东北翠花

顶流设计Agent能用Nano Banana Pro了!一句话BlackPink变东北翠花

Lovart设计Agent接入Nano Banana Pro,实现多模态处理能力的显著提升。通过自然语言指令即可完成复杂设计任务,如图像合成、视频生成等,展现出强大的跨模态推理与编辑功能。其独特的Touch Edit特性支持直观的细节调整,极大提高了设计效率和用户体验。该组合在专业设计领域实现了突破性应用,展示了AI技术在创意产业中的巨大潜力。

来源:量子位

11月 24日
12 条新闻
23:15

前MrBeast内容策略师正在开发一款面向创作者灵感激发与数据分析的人工智能工具

前MrBeast内容策略师正在开发一款面向创作者灵感激发与数据分析的人工智能工具

Palo 是一款面向内容创作者的 AI 平台,结合了大语言模型和数据分析技术,旨在通过分析短视频表现提供创作建议。该平台利用混合模型提取视频数据树,涵盖观众情感、兴趣话题等关键指标,并通过语义检索构建创作者画像。此外,Palo 还提供了基于对话的AI策划工具,支持剧本生成与故事板设计,帮助创作者优化内容策略。

来源:TechCrunch AI

19:50

6天狂飙200万,这个AI应用为何全网爆火?

6天狂飙200万,这个AI应用为何全网爆火?

蚂蚁集团发布的全模态通用AI助手“灵光”在上线六天内下载量突破200万,其核心功能“闪应用”允许用户无需编程即可创建实用小程序,降低了技术门槛。灵光采用多模态交付方式,提升了信息呈现的直观性和美观度。这一趋势表明,AI产品正从强调模型能力转向注重用户体验和实用性,预示着未来AI将更加融入日常生活,并推动软件开发向去中心化、个性化方向发展。

来源:36氪

19:50

00后谈恋爱,用AI当「僚机」

新闻探讨了AI在恋爱场景中的应用,从一键生成高情商回复的恋爱键盘到提供策略的’AI军师’,这些产品正迅速吸引年轻用户。然而,尽管部分产品如Lovekey键盘取得商业成功,但更全面的AI恋爱助手却面临商业化困境,包括高昂的成本、有限的付费意愿等挑战。情感计算专家指出,仅靠文本分析无法完全理解人类情感复杂性,未来需结合多模态数据(如语音、面部表情)以实现更准确的情感识别与分析。

来源:36氪

19:49

奥特曼承认谷歌威胁到OpenAI,即将推出新模型“Shallotpeat”

奥特曼承认谷歌威胁到OpenAI,即将推出新模型“Shallotpeat”

谷歌Gemini 3 Pro和Nano Banana Pro的发布,对OpenAI构成了显著竞争压力。预训练技术成为谷歌弯道超车的关键,尤其是在编程等核心领域展现优势。面对财务和技术挑战,OpenAI正尝试通过优化模型追赶。此转变揭示了AI竞赛从单一模型突破向全栈体系对抗的趋势,谷歌凭借其在算力、数据及产品生态上的全栈优势,在这场竞争中占据了有利位置。

来源:36氪

19:15

睿尔曼开源全球首个高质量、模态数量最多的真机数据集

睿尔曼开源全球首个高质量、模态数量最多的真机数据集

睿尔曼开源全球首个高质量、多模态真机数据集,涵盖图像、关节位置等多模态数据,具备时空硬同步、超低丢帧率等六大技术优势。该数据集基于十大真实场景采集,旨在解决机器人训练数据瓶颈,提升泛化能力与产业化落地速度。项目致力于构建开放共享的机器人开源生态,推动智能机器人算法创新及应用拓展。

来源:量子位

18:47

豆包输入法正式上线

豆包输入法正式上线,提供语音输入及键盘输入两种方式。基于豆包App同款语音模型,豆包输入法在语音识别和语义理解方面进一步提升,支持多种方言、英语及中英混合输入,并具备自动纠错功能;键盘输入也支持自动纠错和文字、符号、emoji表情等多种智能联想。在方言支持方面,豆包输入法目前已支持粤语、四川话、陕西话、江淮方言、冀鲁方言、兰银方言、晋语等多种方言输入。(广角观察)

来源:钛媒体

18:46

阿里AI猛补课,蚂蚁的“灵光”灵不灵?

阿里AI猛补课,蚂蚁的“灵光”灵不灵?

蚂蚁集团推出全新AI助手“灵光”,具备全代码生成多模态内容能力,支持生成图文、3D模型等。其“闪应用”功能可在30秒内根据自然语言指令生成可交互的小应用。该产品定位为效率工具,强调信息展现形式的创新与移动端交互体验,旨在提升信息传递效率。技术上,灵光优化了模型架构和工程实现以应对高膨胀率挑战,展示了在多模态处理和代码生成方面的突破。

来源:36氪

18:46

自动驾驶教父Thrun预言,纯视觉路线决胜2026,空中机器人将成新蓝海

自动驾驶教父Thrun预言,纯视觉路线决胜2026,空中机器人将成新蓝海

Sebastian Thrun在摩根士丹利亚太峰会上深入探讨了自动驾驶技术路线,特别是纯视觉方案与多传感器融合方案的优劣。他强调特斯拉的纯视觉FSD测试将是行业转折点,指出纯视觉方案在成本上有显著优势,但面临恶劣天气下的可靠性挑战。Waymo等公司正加速扩展无人驾驶服务,标志着自动驾驶进入规模化阶段。Thrun还分享了Waymo早期发展历程及团队建设哲学,并预测未来3-5年是自动驾驶商业化黄金期。

来源:36氪

18:46

产业精炼:AI应用终结泡沫论,谷歌阿里系持续暴涨

产业精炼:AI应用终结泡沫论,谷歌阿里系持续暴涨

当前AI泡沫争议的核心在于投入与产出失衡,但随着谷歌Gemini 3 Pro和阿里千问APP等应用的推出,AI正从基建竞赛转向实际落地。谷歌通过生态闭环提升用户体验并增加广告收入;阿里则开源Qwen系列模型,并通过千问APP整合多场景服务。未来1-2年,真正实现商业落地、产生现金流的AI应用将成为行业龙头。

来源:36氪

18:45

美国AI版“四万亿”,能给中国民间投资带来什么启示?

美国头部企业在AI领域的投资显著增长,特别是数据中心和相关设备领域,推动了宏观经济的发展。这些投资主要来自科技巨头,如苹果、微软等,预计2025年全年将达到5000亿美元。然而,这种大规模的投资也带来了金融风险的担忧。面对此情况,中国正通过政策调整鼓励民间资本进入AI等新兴领域,以促进技术创新和经济增长。

来源:36氪