AI新闻

已选标签:
AI训练
多模态AI
12月 10日
20 条新闻
15:04

美团AI转向,前字节视觉模型AI平台负责人潘欣加入|智能涌现独家

美团AI转向,前字节视觉模型AI平台负责人潘欣加入|智能涌现独家

美团积极布局AI,引入前字节视觉大模型负责人潘欣推动多模态AI创新。2025年,美团发布一系列基座模型及应用,涵盖语言、视觉、音频、视频全模态,并在主营业务中加速AI化改造,推出如“袋鼠参谋”、“智能掌柜”等工具。当前,美团正聚焦于模型训练与商业化落地,招聘高标准AI人才,强化自研能力。

来源:36氪

15:04

谷歌打响AI战争第一枪

谷歌打响AI战争第一枪

谷歌基于Gemini模型为美军推出生成式AI平台GenAI.mil,处理海量文档并接入机密数据流,标志着其从2018年拒绝军事合作到全面支持五角大楼的转变。此举反映了AI技术在军事领域的深化应用,以及商业利益与国家战略需求的结合,同时引发了关于技术伦理和企业责任的讨论。

来源:36氪

15:04

只用512张H200,106B模型靠分布式RL杀出重围,全网开源

只用512张H200,106B模型靠分布式RL杀出重围,全网开源

Prime Intellect发布106B参数的INTELLECT-3模型,在数学、代码等基准测试中取得同规模最佳表现。该模型基于强化学习技术栈训练,通过开源其完整的训练流程(包括模型权重、框架、数据集及评测体系)推动大规模RL研究的发展。INTELLECT-3利用了全分布式PRIME-RL框架和高吞吐Prime Sandboxes系统,实现了高效的训练过程。未来,Prime Intellect计划进一步扩展智能体式RL的应用范围,并提高长时序任务处理能力。

来源:36氪

15:04

2比特复数模型媲美全精度,北大通用框架让大模型在手机上也能流畅运行

2比特复数模型媲美全精度,北大通用框架让大模型在手机上也能流畅运行

北京大学团队提出Fairy2i框架,通过广义线性表示、相位感知量化及递归残差量化技术,在无需重新训练的情况下实现预训练模型的2比特量化,性能接近FP16。该方法解决了大模型在边缘设备部署时面临的算力和存储挑战,为AI在移动设备上的高效运行提供了新路径。

来源:36氪

15:04

深大团队让机器人听懂指令精准导航,成功率可达72.5%,推理效率提升40%

深大团队让机器人听懂指令精准导航,成功率可达72.5%,推理效率提升40%

深圳大学李坚强教授团队联合其他机构提出视觉-语言导航新框架UNeMo,通过多模态世界模型与分层预测反馈机制提升导航智能体决策能力。相比主流方法,UNeMo在未见过环境中的导航成功率可达72.5%,尤其在长轨迹导航中表现优异,同时大幅降低资源消耗。该研究解决了传统方法中推理与决策分离的问题,为视觉-语言导航提供了一种高效可行方案,推动了服务机器人等实际应用场景的发展。

来源:36氪

14:28

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

可灵AI在5天内连续发布5次更新,推出全球首个统一的多模态视频及图片创作工具“可灵O1”、具备“音画同出”能力的可灵2.6模型等。这些更新不仅提升了生成式AI在视频和图像生成方面的可控性和多样性,还实现了从文本到包含自然语言、动作音效及环境氛围音的完整视频的一站式生成。此外,通过融合多模态理解与长上下文技术,可灵AI进一步推动了生成式AI技术的发展,并在多个应用场景中展现出卓越性能。

来源:量子位

13:01

微软承诺在加拿大和印度投入超300亿美元,用于建设“主权AI”

微软承诺在加拿大和印度投入超300亿美元,用于建设“主权AI”

微软宣布投资超过300亿美元于加拿大和印度,强化本地云基础设施建设与Azure AI服务集成。此举旨在响应各国对数据本地化及AI系统自主控制的需求,通过引入Azure Local、SAIL等技术保障数据主权,并在印度政府福利门户中嵌入AI以提升就业匹配效率。此外,微软加大了技能培训力度,目标是让民众主动参与技术未来构建。

来源:36氪

12:34

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

2025年AI领域迎来重大突破,DeepSeek-R1及其开源版本V3.2引领技术发展。AI模型在性能与开源方面齐头并进,推动了从具身智能机器人到各种AI终端设备的应用扩展。这一年也被视为’Agent元年’,标志着AI从被动响应向主动规划执行转变,开启了智能体时代。同时,在医疗、气象等行业,AI正逐渐成为关键基础设施的一部分。通过年度榜单评选,展示了中国AI生态中最具代表性的企业、产品及个人,为未来AI发展方向提供了重要参考。

来源:量子位

09:55

清华紧逼谷歌,AI顶会NeurIPS论文数第二,中国占半壁江山

清华紧逼谷歌,AI顶会NeurIPS论文数第二,中国占半壁江山

NeurIPS 2025见证了中国AI从数量向质量的转变,清华大学论文接收量逼近谷歌,彰显了中国在底层架构创新上的突破。阿里千问团队提出的《Gated Attention for Large Language Models》获最佳论文奖,革新了Transformer机制,大幅提升了模型效率。中国科研机构通过人才回流和政策支持,在AI领域实现了与硅谷巨头并驾齐驱的局面。

来源:36氪

09:55

年营收 10 亿美元的 Surge AI CEO:比算力更重要的,是 AI 的品味

Surge AI 通过自建训练系统和精细的数据标注方法,专注于提升AI模型的判断力与决策质量,而非单纯追求算力或融资规模。其独特的数据处理方式,包括对标注者行为信号的追踪、机器学习反向分析以及提供评估标准等,使得该公司能够为行业顶尖实验室提供高质量服务,并在未接受外部投资的情况下实现显著商业成功。

来源:36氪

08:53

烧3万亿美元实现ASI,把自己优化掉:这是硅谷CEO们的新赌注

烧3万亿美元实现ASI,把自己优化掉:这是硅谷CEO们的新赌注

硅谷大佬们纷纷预言AI将接管公司,甚至CEO职位。然而,当前AI技术虽在特定任务如代码生成上表现出色,但在长期逻辑连贯性任务中仍显不足。尽管如此,科技巨头预计将在AI领域投入近3万亿美元,推动从自动化决策到多模态处理能力的提升。不过,微软CEO纳德拉认为最终决策者仍将是人类,强调AI作为工具而非替代者的角色。

来源:36氪

08:53

非传统AI公司确认其4.75亿美元种子轮融资

非传统AI公司确认其4.75亿美元种子轮融资

Naveen Rao 创立的 Unconventional AI 获得 4.75 亿美元种子轮融资,估值达 45 亿美元。公司目标是构建高效能AI计算机,追求生物级效率。此轮融资由 Andreessen Horowitz 和 Lightspeed Ventures 领投,标志着对下一代算力效率和技术创新的重大投资。Rao 的过往经历包括成功创立并出售 MosaicML 和 Nervana Systems,显示出其在推动AI技术进步方面的深厚背景。

来源:TechCrunch AI

08:49

Coreweave首席执行官为AI循环交易辩护称其为“合作共赢”

Coreweave首席执行官为AI循环交易辩护称其为“合作共赢”

Coreweave 作为AI云基础设施提供商,尽管经历了IPO未达预期和收购计划受阻等挑战,但通过其独特的商业模式及与Nvidia、微软等巨头的合作,在AI数据中心市场中发挥了重要作用。公司CEO Michael Intrator 强调了他们在面对经济不确定性时的成功上市,并指出公司在提供GPU给AI开发者方面的贡献。此外,他还讨论了AI行业中‘循环性’商业关系的合理性,认为这是应对供需变化的一种方式。

来源:TechCrunch AI

07:52

SpaceX+空中数据中心,马斯克AI的下一个宏大叙事?

SpaceX+空中数据中心,马斯克AI的下一个宏大叙事?

马斯克提出太空数据中心概念,旨在解决地球物理瓶颈如电力短缺和冷却问题,推动AI算力大幅提升。SpaceX计划通过星舰每年发射100万吨载荷,部署提供100GW AI算力增量的卫星星座。大摩分析指出,太空环境可实现极致冷却、无限能源供给及全球边缘连接优势,显著提升算力效率与资源利用率。此外,谷歌、Axiom Space等科技巨头也在积极布局太空数据中心领域。

来源:36氪

07:52

马斯克的Optimus又“大翻车”,摔倒前摘下“不存在的VR头显”,网友炸锅:这是人类在远程操控?

马斯克的Optimus又“大翻车”,摔倒前摘下“不存在的VR头显”,网友炸锅:这是人类在远程操控?

特斯拉人形机器人Optimus在迈阿密的一次展示中出现意外,其在递水时突然失去平衡并做出类似摘下VR头显的动作,引发关于其实现真正自主控制能力的质疑。此事件揭示了当前人形机器人技术面临的挑战,尤其是在复杂场景下的自主性和稳定性方面。

来源:36氪

07:52

微软急了,紧急腰斩AI产品销售指标,内部拉响红色警告

微软急了,紧急腰斩AI产品销售指标,内部拉响红色警告

微软AI产品市场遇冷,用户反馈不佳导致销售目标下调。尽管与OpenAI紧密合作并集成GPT系列模型至多款产品中,但因产品性能欠佳及缺乏明确发展方向,未能满足用户需求。此外,过度依赖合作伙伴如OpenAI和英伟达也限制了其自主发展空间。谷歌凭借自研模型及生态整合优势,在AI领域逐渐占据上风。

来源:36氪

05:13

B Capital创始合伙人Kabir Narang离职创办新投资平台

B Capital创始合伙人Kabir Narang离职创办新投资平台

Kabir Narang离开B Capital,计划于2026年推出专注于技术、AI和全球资本流动交叉点的新投资平台。他强调AI在加速从想法到产出的过程中扮演的关键角色,并看好能够结合速度与定价权及改善单位经济效益的创始人。Narang还透露将个人持有1-2%的股份于他认为能‘智能增长’的企业中,表明其对早期AI及相关技术领域投资的兴趣持续高涨。

来源:TechCrunch AI

01:28

OpenAI、Anthropic和Block加入Linux基金会新倡议,共同推动AI代理时代的标准化

OpenAI、Anthropic和Block加入Linux基金会新倡议,共同推动AI代理时代的标准化

Linux 基金会成立 Agentic AI Foundation (AAIF),旨在促进 AI 代理的开放标准与互操作性,避免市场分裂。成员包括 Anthropic、Block 和 OpenAI 等公司,捐赠了 MCP、Goose 及 AGENTS.md 等开源项目。此举旨在建立共享协议,提升跨平台协作效率与安全性,推动 AI 代理技术在编程、数据分析等领域的广泛应用。

来源:TechCrunch AI

00:30

谷歌首款AI眼镜预计明年推出

谷歌首款AI眼镜预计明年推出

谷歌计划于2026年推出首款AI眼镜,基于Android XR操作系统,与Gentle Monster和Warby Parker合作开发。该眼镜分为屏幕辅助型和无屏语音交互型,后者利用内置扬声器、麦克风及摄像头实现Gemini助手互动与拍照功能;前者则通过镜片显示提供导航或字幕等信息。此外,还展示了Xreal的有线XR眼镜Project Aura,作为头盔与普通眼镜之间的折衷方案,支持办公娱乐扩展。此举措标志着谷歌加入到与Meta竞争智能眼镜市场的行列中。

来源:TechCrunch AI

00:29

欧盟对谷歌的人工智能搜索工具展开反垄断调查

欧盟对谷歌的人工智能搜索工具展开反垄断调查

欧盟委员会对谷歌展开反垄断调查,质疑其AI搜索工具是否违反了竞争法。调查聚焦于谷歌是否未经补偿使用网站内容生成AI摘要,并限制其他AI公司使用YouTube内容训练模型。此举旨在确保AI市场竞争公平,保护内容创作者权益。同时,欧盟正考虑简化AI监管规则,以应对高风险应用的挑战。

来源:TechCrunch AI