AI新闻

已选标签:
具身智能
多模态AI
12月 10日
14 条新闻
15:04

谷歌打响AI战争第一枪

谷歌打响AI战争第一枪

谷歌基于Gemini模型为美军推出生成式AI平台GenAI.mil,处理海量文档并接入机密数据流,标志着其从2018年拒绝军事合作到全面支持五角大楼的转变。此举反映了AI技术在军事领域的深化应用,以及商业利益与国家战略需求的结合,同时引发了关于技术伦理和企业责任的讨论。

来源:36氪

15:04

只用512张H200,106B模型靠分布式RL杀出重围,全网开源

只用512张H200,106B模型靠分布式RL杀出重围,全网开源

Prime Intellect发布106B参数的INTELLECT-3模型,在数学、代码等基准测试中取得同规模最佳表现。该模型基于强化学习技术栈训练,通过开源其完整的训练流程(包括模型权重、框架、数据集及评测体系)推动大规模RL研究的发展。INTELLECT-3利用了全分布式PRIME-RL框架和高吞吐Prime Sandboxes系统,实现了高效的训练过程。未来,Prime Intellect计划进一步扩展智能体式RL的应用范围,并提高长时序任务处理能力。

来源:36氪

15:04

深大团队让机器人听懂指令精准导航,成功率可达72.5%,推理效率提升40%

深大团队让机器人听懂指令精准导航,成功率可达72.5%,推理效率提升40%

深圳大学李坚强教授团队联合其他机构提出视觉-语言导航新框架UNeMo,通过多模态世界模型与分层预测反馈机制提升导航智能体决策能力。相比主流方法,UNeMo在未见过环境中的导航成功率可达72.5%,尤其在长轨迹导航中表现优异,同时大幅降低资源消耗。该研究解决了传统方法中推理与决策分离的问题,为视觉-语言导航提供了一种高效可行方案,推动了服务机器人等实际应用场景的发展。

来源:36氪

14:28

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

可灵AI在5天内连续发布5次更新,推出全球首个统一的多模态视频及图片创作工具“可灵O1”、具备“音画同出”能力的可灵2.6模型等。这些更新不仅提升了生成式AI在视频和图像生成方面的可控性和多样性,还实现了从文本到包含自然语言、动作音效及环境氛围音的完整视频的一站式生成。此外,通过融合多模态理解与长上下文技术,可灵AI进一步推动了生成式AI技术的发展,并在多个应用场景中展现出卓越性能。

来源:量子位

12:34

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

2025年AI领域迎来重大突破,DeepSeek-R1及其开源版本V3.2引领技术发展。AI模型在性能与开源方面齐头并进,推动了从具身智能机器人到各种AI终端设备的应用扩展。这一年也被视为’Agent元年’,标志着AI从被动响应向主动规划执行转变,开启了智能体时代。同时,在医疗、气象等行业,AI正逐渐成为关键基础设施的一部分。通过年度榜单评选,展示了中国AI生态中最具代表性的企业、产品及个人,为未来AI发展方向提供了重要参考。

来源:量子位

09:55

清华紧逼谷歌,AI顶会NeurIPS论文数第二,中国占半壁江山

清华紧逼谷歌,AI顶会NeurIPS论文数第二,中国占半壁江山

NeurIPS 2025见证了中国AI从数量向质量的转变,清华大学论文接收量逼近谷歌,彰显了中国在底层架构创新上的突破。阿里千问团队提出的《Gated Attention for Large Language Models》获最佳论文奖,革新了Transformer机制,大幅提升了模型效率。中国科研机构通过人才回流和政策支持,在AI领域实现了与硅谷巨头并驾齐驱的局面。

来源:36氪

08:53

烧3万亿美元实现ASI,把自己优化掉:这是硅谷CEO们的新赌注

烧3万亿美元实现ASI,把自己优化掉:这是硅谷CEO们的新赌注

硅谷大佬们纷纷预言AI将接管公司,甚至CEO职位。然而,当前AI技术虽在特定任务如代码生成上表现出色,但在长期逻辑连贯性任务中仍显不足。尽管如此,科技巨头预计将在AI领域投入近3万亿美元,推动从自动化决策到多模态处理能力的提升。不过,微软CEO纳德拉认为最终决策者仍将是人类,强调AI作为工具而非替代者的角色。

来源:36氪

08:49

Coreweave首席执行官为AI循环交易辩护称其为“合作共赢”

Coreweave首席执行官为AI循环交易辩护称其为“合作共赢”

Coreweave 作为AI云基础设施提供商,尽管经历了IPO未达预期和收购计划受阻等挑战,但通过其独特的商业模式及与Nvidia、微软等巨头的合作,在AI数据中心市场中发挥了重要作用。公司CEO Michael Intrator 强调了他们在面对经济不确定性时的成功上市,并指出公司在提供GPU给AI开发者方面的贡献。此外,他还讨论了AI行业中‘循环性’商业关系的合理性,认为这是应对供需变化的一种方式。

来源:TechCrunch AI

07:52

SpaceX+空中数据中心,马斯克AI的下一个宏大叙事?

SpaceX+空中数据中心,马斯克AI的下一个宏大叙事?

马斯克提出太空数据中心概念,旨在解决地球物理瓶颈如电力短缺和冷却问题,推动AI算力大幅提升。SpaceX计划通过星舰每年发射100万吨载荷,部署提供100GW AI算力增量的卫星星座。大摩分析指出,太空环境可实现极致冷却、无限能源供给及全球边缘连接优势,显著提升算力效率与资源利用率。此外,谷歌、Axiom Space等科技巨头也在积极布局太空数据中心领域。

来源:36氪

07:52

马斯克的Optimus又“大翻车”,摔倒前摘下“不存在的VR头显”,网友炸锅:这是人类在远程操控?

马斯克的Optimus又“大翻车”,摔倒前摘下“不存在的VR头显”,网友炸锅:这是人类在远程操控?

特斯拉人形机器人Optimus在迈阿密的一次展示中出现意外,其在递水时突然失去平衡并做出类似摘下VR头显的动作,引发关于其实现真正自主控制能力的质疑。此事件揭示了当前人形机器人技术面临的挑战,尤其是在复杂场景下的自主性和稳定性方面。

来源:36氪

07:52

微软急了,紧急腰斩AI产品销售指标,内部拉响红色警告

微软急了,紧急腰斩AI产品销售指标,内部拉响红色警告

微软AI产品市场遇冷,用户反馈不佳导致销售目标下调。尽管与OpenAI紧密合作并集成GPT系列模型至多款产品中,但因产品性能欠佳及缺乏明确发展方向,未能满足用户需求。此外,过度依赖合作伙伴如OpenAI和英伟达也限制了其自主发展空间。谷歌凭借自研模型及生态整合优势,在AI领域逐渐占据上风。

来源:36氪

01:28

OpenAI、Anthropic和Block加入Linux基金会新倡议,共同推动AI代理时代的标准化

OpenAI、Anthropic和Block加入Linux基金会新倡议,共同推动AI代理时代的标准化

Linux 基金会成立 Agentic AI Foundation (AAIF),旨在促进 AI 代理的开放标准与互操作性,避免市场分裂。成员包括 Anthropic、Block 和 OpenAI 等公司,捐赠了 MCP、Goose 及 AGENTS.md 等开源项目。此举旨在建立共享协议,提升跨平台协作效率与安全性,推动 AI 代理技术在编程、数据分析等领域的广泛应用。

来源:TechCrunch AI

00:30

谷歌首款AI眼镜预计明年推出

谷歌首款AI眼镜预计明年推出

谷歌计划于2026年推出首款AI眼镜,基于Android XR操作系统,与Gentle Monster和Warby Parker合作开发。该眼镜分为屏幕辅助型和无屏语音交互型,后者利用内置扬声器、麦克风及摄像头实现Gemini助手互动与拍照功能;前者则通过镜片显示提供导航或字幕等信息。此外,还展示了Xreal的有线XR眼镜Project Aura,作为头盔与普通眼镜之间的折衷方案,支持办公娱乐扩展。此举措标志着谷歌加入到与Meta竞争智能眼镜市场的行列中。

来源:TechCrunch AI

00:29

欧盟对谷歌的人工智能搜索工具展开反垄断调查

欧盟对谷歌的人工智能搜索工具展开反垄断调查

欧盟委员会对谷歌展开反垄断调查,质疑其AI搜索工具是否违反了竞争法。调查聚焦于谷歌是否未经补偿使用网站内容生成AI摘要,并限制其他AI公司使用YouTube内容训练模型。此举旨在确保AI市场竞争公平,保护内容创作者权益。同时,欧盟正考虑简化AI监管规则,以应对高风险应用的挑战。

来源:TechCrunch AI

12月 9日
6 条新闻
22:39

Meta可能在明年初推出新AI大模型Avocado

相关报道援引知情人士透露,Meta可能在2026年第一季度发布新的大型语言模型“Avocado”,以进一步与谷歌、OpenAI等公司竞争。今年6月曾有市场消息称,包括扎克伯格在内的Meta高管已讨论过对其Llama系列语言模型“削减投资”,转而采用竞争对手开发的模型,包括OpenAI和Anthropic的产品。(广角观察)

来源:钛媒体

22:39

腾讯混元大模型品牌正式更名为Tencent HY

腾讯宣布自研大模型品牌“混元(Tencent Hunyuan)”正式更名为“Tencent HY”,版本号同步升级至2.0。此次调整聚焦传播效率优化与全球化适配,HY作为技术品牌核心标识,未来将通过“HY-1”“HY-Pro”等结构化命名清晰传递代际演进路径,同时弱化中文文化属性以适配国际市场。旗下腾讯元宝作为独立AI助手品牌,未进行任何更名,用户可继续通过“元宝”使用腾讯AI服务。(广角观察)

来源:钛媒体

20:32

国产多模态AI再开源,实测截图转网页、搜图购物,价格减半

国产多模态AI再开源,实测截图转网页、搜图购物,价格减半

智谱开源了GLM-4.6V系列多模态大模型,包括基础版和轻量版,支持智能图文混排、识图购物、前端复刻及长上下文理解等任务。该模型在多模态交互、逻辑推理和长上下文能力上取得SOTA表现,并且价格相比前代降低50%,轻量版全面免费。AutoGLM作为首个具备手机操作能力的AI Agent也被一同开源。

来源:36氪

18:29

人工智能生成广告:机遇、挑战与对策

新闻探讨了生成式人工智能技术,如大语言模型和多模态模型,在广告行业中的应用与变革。从程序化推荐到基于用户意图理解的智能广告系统,AI正在重塑数字广告的生产、投放及效果评估流程。以谷歌Gemini和腾讯混元大模型为例,展示了AI如何推动广告从被动呈现转向主动交互,并实现“一人千面”的个性化体验。然而,技术成熟度不足、数据合规性以及算法偏见等问题也对广告业提出了新的挑战。

来源:36氪

18:28

一文读懂Android XR发布会:谷歌“亲儿子”明年开卖

一文读懂Android XR发布会:谷歌“亲儿子”明年开卖

谷歌发布Android XR平台,整合多模态AI能力,支持智能眼镜与头显设备。通过Gemini AI实现情境感知式交互,如视觉搜索、实时翻译等功能。同时,推出有线XR眼镜Project Aura,平衡算力与佩戴舒适度。此外,更新了Android XR SDK,提供Jetpack Glimmer和Projected库,简化开发流程,并遵循OpenXR标准,促进生态发展。

来源:36氪