AI新闻

已选标签:
多模态AI
具身智能
12月 8日
8 条新闻
12:20

AI连路都走不明白,别意淫了

本次会议揭示了AI在物理世界应用中的挑战,强调了AI技术从数字世界向现实世界迁移的重要性。专家们认为,未来的AI发展将更加注重实际操作能力,如机器人、自动驾驶等领域的应用,并提出通过视频学习来提升AI理解物理世界的能力。同时,讨论了大模型的局限性和成本问题,指出未来趋势是开发更小、更密集的模型以适应边缘计算需求。此外,还探讨了AI在To B领域的商业价值,特别是在高危、高能耗行业中的应用潜力。

来源:36氪

11:17

Google DeepMind CEO:AGI 还差 1–2 个突破?

Demis Hassabis 在 Axios AI+ 峰会上表示,实现 AGI 仅需一到两个 AlphaGo 级别的技术突破,预测 5-10 年内达成。Gemini 模型已展示多模态理解、判断及创造能力,但缺乏持续学习、长期规划和稳定记忆等关键特性。Hassabis 强调,通向 AGI 的关键在于世界建模与智能体系统的技术创新,并指出科学方法是 DeepMind 的核心优势。

来源:36氪

11:17

寻找产业新风向,与院士、企业家共话AI落地

寻找产业新风向,与院士、企业家共话AI落地

2025年,中国AI产业从大规模模型转向深度应用,聚焦商业可行性与垂直领域精耕。随着政策支持,AI在低空经济、工业制造等具体场景中寻求突破,但面临算力成本高昂及行业壁垒问题。12月12日,在杭州举办的长三角人工智能产业融合共生发展大会旨在打破信息孤岛,促进AI技术与实体经济深度融合,加速推动中国算力产业发展。

来源:36氪

09:13

AI眼镜取代不了手机,它想“干掉”传统眼镜

AI眼镜取代不了手机,它想“干掉”传统眼镜

当前AI眼镜市场正快速发展,众多厂商如百度、阿里等纷纷入局。这些AI眼镜主要目标是通过智能化功能替代传统眼镜而非手机,聚焦于提升用户体验。目前,AI眼镜在导航、翻译等功能上有所突破,并结合大模型能力实现更多应用场景。然而,产品仍面临重量、续航及隐私保护等挑战。未来,随着技术进步,AI眼镜有望成为主流可穿戴设备,特别是在垂直领域解决特定需求方面展现出巨大潜力。

来源:36氪

09:13

谷歌祭出Transformer杀手,8年首次大突破,掌门人划出AGI死线

谷歌祭出Transformer杀手,8年首次大突破,掌门人划出AGI死线

谷歌DeepMind CEO Hassabis预测2030年将实现AGI,指出还需1-2个类似Transformer的突破。NeurIPS 2025上发布的Titans架构融合了RNN与Transformer优势,在多模态处理、类人视觉智能等方面展现强大性能。Hassabis强调,当前AI系统需在持续学习、在线学习等关键能力上取得进展以接近AGI标准。

来源:36氪

09:13

做豆包AI手机前,张一鸣也应该跟马化腾聊一聊

做豆包AI手机前,张一鸣也应该跟马化腾聊一聊

豆包AI手机凭借高权限Agent实现系统级AI能力,通过语音指令完成复杂操作,如多平台比价下单、计算红包等。其火爆验证了AI交互替代屏幕交互的趋势,并引发对互联网大厂APP生态的挑战。然而,由于软硬件一体化开发经验不足及与现有生态的利益冲突,短期内难以颠覆传统手机市场。未来,AI手机的发展需平衡技术创新与行业生态建设。

来源:36氪

08:11

Hinton最新预言刷屏:谷歌必赢,而且“早该赢了”

Hinton最新预言刷屏:谷歌必赢,而且“早该赢了”

Google凭借Gemini 3、自研芯片及强大数据与研究团队,在多模态处理、视觉理解等方面取得突破,实现从’看见’到’理解’的跨越。Gemini 3 Pro在文档、空间、屏幕和视频理解上表现卓越,特别是在复杂视觉推理基准上刷新纪录。此外,Nano Banana Pro图像模型也受到市场欢迎。这些进展推动了谷歌市值逼近4万亿美元大关,并在用户活跃度和下载增速方面超越ChatGPT。

来源:36氪

01:00

自动驾驶汽车的发展正在全速推进

自动驾驶汽车的发展正在全速推进

自动驾驶技术正在加速发展,Waymo、Uber 和 Avride 等公司在多个城市推出或测试无人驾驶出租车服务。然而,随着技术的普及,也面临着安全和伦理挑战,如Waymo车辆在校园区域违规行驶及事故事件。同时,监管机构也在调整政策以适应这一变化,例如加州DMV发布的新规允许企业测试自动驾驶卡车。这些进展反映了AI在自动驾驶领域的应用不断深化,但也突显了技术落地过程中必须解决的安全与合规问题。

来源:TechCrunch AI

12月 7日
6 条新闻
12:50

跨境电商的疑难杂症,被1688这个AI全包了…

跨境电商的疑难杂症,被1688这个AI全包了…

1688推出跨境电商AI智能体——遨虾,通过大模型技术优化选品、采购和上架流程。AI在几秒内完成商品筛选与市场分析,提供量化选品建议;图片识别匹配合适供应商,并批量询盘;多模态生成能力实现多语言、多平台内容适配,大幅降低运营成本。实测显示,客户月利润增长显著。

来源:量子位

10:30

广西“十五五”规划建议:高标准建设中国—东盟国家人工智能应用合作中心

中国共产党广西壮族自治区委员会关于制定国民经济和社会发展第十五个五年规划的建议发布。其中提出,高标准建设中国—东盟国家人工智能应用合作中心。以“广西集成”为主要抓手,以南宁为核心节点,建强连接中国和东盟两个板块的人工智能产业纽带,与东盟国家共建应用合作中心,在国内其他重要城市有序落地分中心,打造中国人工智能企业走向东盟的枢纽节点、中国与东盟人工智能资源要素汇聚的重要前沿。推进中国—东盟人工智能安全示范中心和配套园区建设,共同发展人工智能安全产业。合作建设中国—东盟语料库、基础大模型及多语种人工智能大模型训练平台。探索建设跨境算力调度枢纽和交易平台。高水平举办AI赋能千行百业超级联赛。(广西日报)

来源:钛媒体

10:30

清华系具身智能公司获数亿元Pre-A轮融资,拿下三菱等头部客户订单|硬氪首发

清华系具身智能公司获数亿元Pre-A轮融资,拿下三菱等头部客户订单|硬氪首发

鹿明机器人完成数亿元融资,专注于具身智能机器人的研发与商业化。公司构建了从数据采集到硬件设计的全栈能力闭环,推出高效数据采集系统FastUMI和高性能模块化机器人平台,实现真机训练效率提升三倍、成本降低至五分之一。其核心技术支持物流、制造等多领域应用,并与多家头部企业达成合作,推动具身智能技术规模化落地。

来源:36氪

08:26

AI作图+仅退款,正在围猎电商卖家

AI作图+仅退款,正在围猎电商卖家

随着AI技术的发展,尤其是图像生成与处理能力的提升,电商领域遭遇了新的挑战。羊毛党利用AI伪造商品瑕疵图片和视频申请退款,导致商家损失严重。虽然已有相关法规出台并有平台开始构建多模态AI假图识别系统以应对这一问题,但整体机制仍需进一步完善。此现象不仅损害了商家的利益,也破坏了消费者对电商平台的信任。未来,电商平台需加强AIGC内容识别能力,并从规则设计、技术防控到申诉机制等多方面协同治理,共同维护健康的电商生态。

来源:36氪

08:18

帕特·基辛格希望在联邦政府的帮助下拯救摩尔定律

帕特·基辛格希望在联邦政府的帮助下拯救摩尔定律

半导体初创公司xLight正开发基于自由电子激光技术的创新解决方案,旨在解决芯片制造中的光刻瓶颈。该技术有望推动摩尔定律持续发展,通过更短波长、更高功率的光源实现更先进的半导体制造。尽管面临技术和资金挑战,但xLight已获得美国商务部高达1.5亿美元的初步投资意向,预示着政府对战略性科技公司的支持趋势。

来源:TechCrunch AI

01:00

创作者IShowSpeed因涉嫌殴打、掐脖网红人形机器人Rizzbot而被起诉

创作者IShowSpeed因涉嫌殴打、掐脖网红人形机器人Rizzbot而被起诉

新闻描述了知名创作者IShowSpeed与人形机器人Rizzbot会面时的不当行为导致的法律纠纷。Rizzbot是一款基于深度学习和多模态模型开发的人形网红,拥有超过百万粉丝。事件中,IShowSpeed对Rizzbot进行了物理攻击,造成其严重损坏,包括头部摄像头失灵、传感器连接端口失效等,导致机器人完全失去功能。此事件不仅引发了关于AI伦理规范的重要讨论,还凸显了在AI技术商业化过程中保护智能设备免受恶意破坏的重要性。

来源:TechCrunch AI

12月 6日
6 条新闻
21:36

Ilya刚预言完,世界首个原生多模态架构NEO就来了:视觉和语言彻底被焊死

Ilya刚预言完,世界首个原生多模态架构NEO就来了:视觉和语言彻底被焊死

NEO,全球首个开源原生多模态架构,由商汤科技与南洋理工大学等联合研发。它通过三大创新技术——原生图块嵌入、三维旋转位置编码及多头注意力机制,实现了视觉与语言的深度融合,仅用十分之一训练数据即在多项评测中追平甚至超越GPT-4V等顶级模型。NEO展示了下一代AI竞争力的关键在于架构创新而非单纯规模扩大,并且其高效性能和较低成本使得强大的多模态能力可普及至边缘设备,如手机、机器人等。

来源:量子位

11:47

OpenAI被曝最快将于下周二发布GPT-5.2

据报道,作为对谷歌与Anthropic加速竞争的首次“应急式”回应,OpenAI正准备推出其最新的GPT-5.2,当前内部计划的发布日期为12月9日,较原定的12月下旬计划明显提前。知情人士称,GPT-5.2应该能弥补谷歌上个月发布Gemini 3所拉开的差距。目前,Gemini 3在多项评测中名列前茅,并引起了Altman与马斯克的关注。本周早些时候,OpenAI首席执行官Sam Altman宣布公司进入“红色警报 (code red)”状态,以快速应对来自谷歌Gemini 3和Anthropic等竞争对手带来的日益增长的压力。随后,Altman在内部评估中表示,即将推出的GPT-5.2在推理能力上将“领先于谷歌的Gemini 3”。(广角观察)

来源:钛媒体

11:39

14岁华人小孩,折个纸成美国天才少年

14岁华人小孩,折个纸成美国天才少年

14岁华裔少年Miles Wu通过创新折纸设计,斩获JIC青少年创新挑战赛最高奖。他提出的三浦折叠变体能够承受自身重量的10000倍,展示了在应急避难所等领域的应用潜力。此案例突显了AI技术在辅助设计、优化结构性能方面的可能性,以及未来在多模态融合与智能材料开发中的发展趋势。

来源:量子位

09:41

好莱坞的鱼头终于朝向了奈飞

好莱坞的鱼头终于朝向了奈飞

奈飞以827亿美元收购华纳兄弟,标志着流媒体巨头在内容产业中的话语权进一步集中。此次并购不仅涉及电影电视工作室和HBO Max等资产,还反映了AI技术在内容推荐、个性化定制及广告投放等方面的应用前景。未来,随着AI技术的不断进步,尤其是在多模态处理与自然语言理解方面的能力提升,预计将推动流媒体平台在用户互动体验上的创新,并对传统院线模式构成挑战。同时,也引发了关于数据安全、算法偏见以及行业垄断等问题的关注。

来源:36氪

08:39

开源和闭源模型的差距在拉大:这是DeepSeek论文揭示的残酷真相

开源和闭源模型的差距在拉大:这是DeepSeek论文揭示的残酷真相

DeepSeek 发布 V3.2 技术报告,指出开源大模型与闭源模型的性能差距在扩大。报告通过对比测试显示,开源模型在复杂任务上明显落后于闭源模型。论文分析了三个关键问题:传统注意力机制效率低、后训练资源投入不足、AI Agent 能力滞后,并提出相应解决方案,包括引入 DSA 机制、增加后训练预算和开发系统化任务合成流程,显著缩小了与闭源模型的差距。

来源:36氪