AI新闻

已选标签:
AI训练
多模态AI
11月 25日
9 条新闻
16:28

新加坡国家AI计划放弃Meta模型,转向阿里千问

新加坡国家人工智能计划(AISG)正在进行一次重大战略调整,在其最新的东南亚语言大模型项目中,放弃了Meta模型,转向阿里巴巴的通义千问Qwen开源架构,标志着中国开源AI模型在全球影响力版图中的一次关键扩张。据悉,AISG于11月25日宣布推出的“Qwen-SEA-LION-v4”模型,在一项衡量东南亚语言能力的开源榜单上迅速占据首位。这一转变旨在解决一个长期痛点:此前以Meta的Llama系列为代表的开源模型,在处理印尼语、泰语和马来语等区域性语言时表现不佳,严重制约了本地化AI应用的开发效率与性能。 (上证报)

来源:钛媒体

14:42

波士顿动力前CTO加盟DeepMind,Gemini要做机器人界的安卓

波士顿动力前CTO加盟DeepMind,Gemini要做机器人界的安卓

谷歌聘请前波士顿动力CTO Aaron Saunders加盟DeepMind,出任硬件工程副总裁,旨在基于Gemini打造一个类似安卓的通用机器人操作系统。Gemini 3发布后,谷歌计划构建一个几乎能够即插即用、适用于任何身体配置的AI系统,涵盖人形与非人形机器人。此举标志着谷歌在机器人领域的战略布局从初步探索转向全面冲刺,通过软硬件协同创新推动多模态融合及具身推理技术的发展。

来源:量子位

11:30

Nano Banana新玩法无限套娃!“GPT-5都不会处理这种级别的递归”

Nano Banana新玩法无限套娃!“GPT-5都不会处理这种级别的递归”

Nano Banana Pro展示了强大的多模态处理能力,通过复杂的递归图像生成任务,如1998年的艺术家绘制递归场景,赢得了包括Google DeepMind提示工程师Riley Goodside在内的专业人士赞赏。其创新的图像理解和生成技术推动了AI在艺术创作领域的应用边界。同时,Gemini 3发布后市场份额显著提升,显示了用户对更智能、多功能AI模型的偏好趋势。

来源:量子位

09:14

Gemini 3 之后,谷歌首席科学家 Jeff Dean 说清 AI 的 3 个关键信号

Jeff Dean 在斯坦福演讲中回顾了 15 年 AI 演进,重点介绍了 Gemini 3 的独特能力。Gemini 3 采用 Pathways 架构,通过 MoE 技术实现高效推理,仅激活所需模块。此外,Gemini 3 展现了从回答到行动的转变,通过强化学习和工具调用完成复杂任务。Jeff Dean 强调,AI 的普及需兼顾效率与成本,TPU 和蒸馏技术使得模型在现实约束下落地成为可能。

来源:36氪

09:13

漫剧启示录:互联网最差的生意,可能是AI最好的生意

漫剧启示录:互联网最差的生意,可能是AI最好的生意

AI技术在内容产业中展现出巨大潜力,特别是在漫剧制作领域。通过深度学习等技术,AI已将漫剧制作成本降至每分钟1000-2500元,周期缩短至10-13天,显著提高了生产效率和降低了成本。此外,AIGC(AI Generated Content)正逐步改变内容创作方式,从辅助工具向主导者转变,不仅在图像、视频生成上取得突破,还促进了跨模态内容的融合与创新,预计未来市场空间可达千亿级别。

来源:36氪

02:29

顶流设计Agent能用Nano Banana Pro了!一句话BlackPink变东北翠花

顶流设计Agent能用Nano Banana Pro了!一句话BlackPink变东北翠花

Lovart设计Agent接入Nano Banana Pro,实现多模态处理能力的显著提升。通过自然语言指令即可完成复杂设计任务,如图像合成、视频生成等,展现出强大的跨模态推理与编辑功能。其独特的Touch Edit特性支持直观的细节调整,极大提高了设计效率和用户体验。该组合在专业设计领域实现了突破性应用,展示了AI技术在创意产业中的巨大潜力。

来源:量子位

11月 24日
11 条新闻
23:15

前MrBeast内容策略师正在开发一款面向创作者灵感激发与数据分析的人工智能工具

前MrBeast内容策略师正在开发一款面向创作者灵感激发与数据分析的人工智能工具

Palo 是一款面向内容创作者的 AI 平台,结合了大语言模型和数据分析技术,旨在通过分析短视频表现提供创作建议。该平台利用混合模型提取视频数据树,涵盖观众情感、兴趣话题等关键指标,并通过语义检索构建创作者画像。此外,Palo 还提供了基于对话的AI策划工具,支持剧本生成与故事板设计,帮助创作者优化内容策略。

来源:TechCrunch AI

19:50

6天狂飙200万,这个AI应用为何全网爆火?

6天狂飙200万,这个AI应用为何全网爆火?

蚂蚁集团发布的全模态通用AI助手“灵光”在上线六天内下载量突破200万,其核心功能“闪应用”允许用户无需编程即可创建实用小程序,降低了技术门槛。灵光采用多模态交付方式,提升了信息呈现的直观性和美观度。这一趋势表明,AI产品正从强调模型能力转向注重用户体验和实用性,预示着未来AI将更加融入日常生活,并推动软件开发向去中心化、个性化方向发展。

来源:36氪

19:50

00后谈恋爱,用AI当「僚机」

新闻探讨了AI在恋爱场景中的应用,从一键生成高情商回复的恋爱键盘到提供策略的’AI军师’,这些产品正迅速吸引年轻用户。然而,尽管部分产品如Lovekey键盘取得商业成功,但更全面的AI恋爱助手却面临商业化困境,包括高昂的成本、有限的付费意愿等挑战。情感计算专家指出,仅靠文本分析无法完全理解人类情感复杂性,未来需结合多模态数据(如语音、面部表情)以实现更准确的情感识别与分析。

来源:36氪

19:49

奥特曼承认谷歌威胁到OpenAI,即将推出新模型“Shallotpeat”

奥特曼承认谷歌威胁到OpenAI,即将推出新模型“Shallotpeat”

谷歌Gemini 3 Pro和Nano Banana Pro的发布,对OpenAI构成了显著竞争压力。预训练技术成为谷歌弯道超车的关键,尤其是在编程等核心领域展现优势。面对财务和技术挑战,OpenAI正尝试通过优化模型追赶。此转变揭示了AI竞赛从单一模型突破向全栈体系对抗的趋势,谷歌凭借其在算力、数据及产品生态上的全栈优势,在这场竞争中占据了有利位置。

来源:36氪

19:15

睿尔曼开源全球首个高质量、模态数量最多的真机数据集

睿尔曼开源全球首个高质量、模态数量最多的真机数据集

睿尔曼开源全球首个高质量、多模态真机数据集,涵盖图像、关节位置等多模态数据,具备时空硬同步、超低丢帧率等六大技术优势。该数据集基于十大真实场景采集,旨在解决机器人训练数据瓶颈,提升泛化能力与产业化落地速度。项目致力于构建开放共享的机器人开源生态,推动智能机器人算法创新及应用拓展。

来源:量子位

18:46

阿里AI猛补课,蚂蚁的“灵光”灵不灵?

阿里AI猛补课,蚂蚁的“灵光”灵不灵?

蚂蚁集团推出全新AI助手“灵光”,具备全代码生成多模态内容能力,支持生成图文、3D模型等。其“闪应用”功能可在30秒内根据自然语言指令生成可交互的小应用。该产品定位为效率工具,强调信息展现形式的创新与移动端交互体验,旨在提升信息传递效率。技术上,灵光优化了模型架构和工程实现以应对高膨胀率挑战,展示了在多模态处理和代码生成方面的突破。

来源:36氪

18:46

自动驾驶教父Thrun预言,纯视觉路线决胜2026,空中机器人将成新蓝海

自动驾驶教父Thrun预言,纯视觉路线决胜2026,空中机器人将成新蓝海

Sebastian Thrun在摩根士丹利亚太峰会上深入探讨了自动驾驶技术路线,特别是纯视觉方案与多传感器融合方案的优劣。他强调特斯拉的纯视觉FSD测试将是行业转折点,指出纯视觉方案在成本上有显著优势,但面临恶劣天气下的可靠性挑战。Waymo等公司正加速扩展无人驾驶服务,标志着自动驾驶进入规模化阶段。Thrun还分享了Waymo早期发展历程及团队建设哲学,并预测未来3-5年是自动驾驶商业化黄金期。

来源:36氪

18:45

美国AI版“四万亿”,能给中国民间投资带来什么启示?

美国头部企业在AI领域的投资显著增长,特别是数据中心和相关设备领域,推动了宏观经济的发展。这些投资主要来自科技巨头,如苹果、微软等,预计2025年全年将达到5000亿美元。然而,这种大规模的投资也带来了金融风险的担忧。面对此情况,中国正通过政策调整鼓励民间资本进入AI等新兴领域,以促进技术创新和经济增长。

来源:36氪

17:44

互联网大厂下注,给具身智能机器人带来了哪些舞台?

互联网巨头如京东、美团、阿里等正积极投资具身智能机器人赛道,旨在通过财务回报、业务协同及服务场景渗透获得竞争优势。这些企业利用自身资源为机器人企业提供真实应用场景和数据支持,加速其技术迭代与商业化进程。未来,随着AI能力提升,机器人在仓储物流、零售、医疗保健等领域的应用将更加广泛,推动多模态融合、边缘计算等技术发展,形成降本增效的解决方案。

来源:36氪

17:44

Nano Banana,OpenAI 你学不会

Nano Banana,OpenAI 你学不会

谷歌的Nano Banana Pro通过引入思维链机制,实现了基于物理逻辑的图像生成,打破了传统AI依赖文本描述和统计学相关性的局限。其原生多模态架构直接处理语义、空间及物理属性,显著提升了生成图像的准确性和细节表现力。与之相比,OpenAI的GPT-4o在视觉理解和物理模拟方面存在不足,但其快速生成能力和审美直觉仍具优势。两者差异源于各自公司对AI技术路径的不同选择:谷歌强调统一模型下的多模态融合;而OpenAI则侧重于模块化拼接与专业分工。

来源:36氪

17:44

美国AI算力新基建是“泡沫”吗?

美国AI算力新基建是“泡沫”吗?

美国正进行大规模算力投资,以支持通用人工智能的发展,预计吸引超2.5万亿美元投资。尽管存在泡沫风险,但大模型企业如OpenAI和Anthropic的高速增长收入及各行业对AI应用的需求,为这一投资提供了合理性。同时,AI技术推动了云计算行业的显著增长,增加了对芯片和数据中心的需求。然而,需关注潜在的技术迭代减缓、产业链循环投资等风险。

来源:36氪