AI新闻

已选标签:
多模态AI
AI训练
12月 10日
20 条新闻
20:13

据报道,SpaceX计划于2026年进行IPO,目标估值达1.5万亿美元

据报道,SpaceX计划于2026年进行IPO,目标估值达1.5万亿美元

虽然新闻主要讨论了SpaceX计划在2026年进行IPO及其估值目标,但考虑到AI技术在航天领域的应用潜力,可以预见未来AI将在其商业落地中扮演重要角色。特别是,在自动驾驶、智能助手以及基于计算机视觉的导航系统等方面的应用,将极大推动太空探索与商业航天的发展。

来源:TechCrunch AI

19:12

一年内总融资额超10亿美元,Apptronik要做通用高性能机器人本体

一年内总融资额超10亿美元,Apptronik要做通用高性能机器人本体

Apptronik,一家专注于人形机器人本体的具身智能创业公司,在一年内获得超过10亿美元融资。其最新产品Apollo采用NVIDIA和谷歌DeepMind提供的模型,能够执行多种任务,目前主要应用于制造业与物流领域。该公司的长远目标是将机器人引入家庭环境,实现辅助护理等功能。随着AI技术的进步及供应链成本下降,预计到2035年全球人形机器人市场规模将达到380亿美元。

来源:36氪

19:11

花399买华为AI玩具们陪聊结果比养娃还累,被华强北吐槽“太Low”但专供小红书女孩?

花399买华为AI玩具们陪聊结果比养娃还累,被华强北吐槽“太Low”但专供小红书女孩?

华为等科技大厂推出300多元的AI陪伴机器人,如“憨憨”、“Fuzozo芙崽”等,通过模拟宠物或角色互动提供陪伴体验。尽管这些产品在语音识别、多模态交互方面有所尝试,但对话内容仍显单一且缺乏深度,难以真正满足成人的情感需求。这反映了当前消费级AI在提升用户体验、增强情感连接方面的挑战与局限性。

来源:36氪

18:09

智能体互联网引发物联网的重新定位,如何完成从”智联万物”到”可编程世界”的惊险一跃?

智能体互联网引发物联网的重新定位,如何完成从"智联万物"到"可编程世界"的惊险一跃?

本文探讨了AI与物联网的深度融合趋势,指出物联网正成为智能体互联网时代的数字底座。通过分析从互联网到智能体互联网的五次关键演进,强调了物联网在数据供应、价值创造及架构支撑方面对AI技术的重要性。未来,基于大模型的智能体将实现跨品牌设备协作,推动物理能力液态化,为用户提供无缝体验。

来源:36氪

18:09

「豆包手机」为何能靠超级Agent火遍全网,我们听听AI学者们怎么说

「豆包手机」为何能靠超级Agent火遍全网,我们听听AI学者们怎么说

豆包手机助手通过将AI Agent嵌入系统底层,实现了端侧AI能力的全面突破,带来了全新的交互方式和多模态体验。它能够跨App执行复杂指令,完成长链路任务,如地图标记、查找信息及订票等。该助手基于自研的UI-TARS引擎,结合视觉多模态理解和大模型推理,具备了强大的上下文记忆与决策能力,为实现更高阶的系统级GUI Agent奠定了基础。

来源:36氪

17:08

好莱坞首位AI女演员幕后:花6万美元「整」出黑眼圈,毙掉2000版,卡梅隆:令人毛骨悚然

好莱坞首位AI女演员幕后:花6万美元「整」出黑眼圈,毙掉2000版,卡梅隆:令人毛骨悚然

新闻报道了英国公司 Particle6 利用多种 AI 技术,包括 ChatGPT、Runway、Sora 等,创造了一个名为 Tilly Norwood 的虚拟女演员。Tilly 的设计经历了多次迭代优化,最终实现了高度逼真的外观与动态表现能力。这一案例展示了 AI 在图像生成、视频合成等多模态处理方面的最新进展及其在影视娱乐领域的潜在应用价值。

来源:36氪

17:07

AI 眼镜,距离大众市场还有多远?

AI 眼镜,距离大众市场还有多远?

2025年,AI眼镜成为新兴娱乐与实用工具,配备摄像头、麦克风及扬声器,搭载大模型和AI助手,支持录音录像、拍照识物等功能。市场增长迅速但面临高退货率挑战,主要问题集中在佩戴舒适度、AI响应速度及功能实用性上。未来,随着技术进步和供应链优化,预计将在视觉增强、听觉增强及融合显示三大方向进一步发展,目标是实现更轻便、更智能的穿戴体验。

来源:36氪

17:07

不融资、不烧钱、不扩团队,华裔 CEO 创办的AI独角兽打入谷歌、Anthropic核心供应链,如今营收近百亿

不融资、不烧钱、不扩团队,华裔 CEO 创办的AI独角兽打入谷歌、Anthropic核心供应链,如今营收近百亿

Surge AI 作为一家专注于高质量数据标注的公司,在没有外部投资的情况下实现了年营收超 10 亿美元的成绩。其创始人 Edwin Chen 认为,高质量的数据是训练出高性能 AI 模型的关键。Surge AI 通过构建精英标注员网络和先进的人机协同系统来保证数据质量,赢得了包括 OpenAI、谷歌等在内的顶尖客户。这表明,在当前模型能力快速提升的同时,高质量的训练数据成为了决定 AI 应用效果的重要因素。

来源:36氪

15:04

美团AI转向,前字节视觉模型AI平台负责人潘欣加入|智能涌现独家

美团AI转向,前字节视觉模型AI平台负责人潘欣加入|智能涌现独家

美团积极布局AI,引入前字节视觉大模型负责人潘欣推动多模态AI创新。2025年,美团发布一系列基座模型及应用,涵盖语言、视觉、音频、视频全模态,并在主营业务中加速AI化改造,推出如“袋鼠参谋”、“智能掌柜”等工具。当前,美团正聚焦于模型训练与商业化落地,招聘高标准AI人才,强化自研能力。

来源:36氪

15:04

谷歌打响AI战争第一枪

谷歌打响AI战争第一枪

谷歌基于Gemini模型为美军推出生成式AI平台GenAI.mil,处理海量文档并接入机密数据流,标志着其从2018年拒绝军事合作到全面支持五角大楼的转变。此举反映了AI技术在军事领域的深化应用,以及商业利益与国家战略需求的结合,同时引发了关于技术伦理和企业责任的讨论。

来源:36氪

15:04

只用512张H200,106B模型靠分布式RL杀出重围,全网开源

只用512张H200,106B模型靠分布式RL杀出重围,全网开源

Prime Intellect发布106B参数的INTELLECT-3模型,在数学、代码等基准测试中取得同规模最佳表现。该模型基于强化学习技术栈训练,通过开源其完整的训练流程(包括模型权重、框架、数据集及评测体系)推动大规模RL研究的发展。INTELLECT-3利用了全分布式PRIME-RL框架和高吞吐Prime Sandboxes系统,实现了高效的训练过程。未来,Prime Intellect计划进一步扩展智能体式RL的应用范围,并提高长时序任务处理能力。

来源:36氪

15:04

2比特复数模型媲美全精度,北大通用框架让大模型在手机上也能流畅运行

2比特复数模型媲美全精度,北大通用框架让大模型在手机上也能流畅运行

北京大学团队提出Fairy2i框架,通过广义线性表示、相位感知量化及递归残差量化技术,在无需重新训练的情况下实现预训练模型的2比特量化,性能接近FP16。该方法解决了大模型在边缘设备部署时面临的算力和存储挑战,为AI在移动设备上的高效运行提供了新路径。

来源:36氪

15:04

深大团队让机器人听懂指令精准导航,成功率可达72.5%,推理效率提升40%

深大团队让机器人听懂指令精准导航,成功率可达72.5%,推理效率提升40%

深圳大学李坚强教授团队联合其他机构提出视觉-语言导航新框架UNeMo,通过多模态世界模型与分层预测反馈机制提升导航智能体决策能力。相比主流方法,UNeMo在未见过环境中的导航成功率可达72.5%,尤其在长轨迹导航中表现优异,同时大幅降低资源消耗。该研究解决了传统方法中推理与决策分离的问题,为视觉-语言导航提供了一种高效可行方案,推动了服务机器人等实际应用场景的发展。

来源:36氪

14:28

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

可灵AI在5天内连续发布5次更新,推出全球首个统一的多模态视频及图片创作工具“可灵O1”、具备“音画同出”能力的可灵2.6模型等。这些更新不仅提升了生成式AI在视频和图像生成方面的可控性和多样性,还实现了从文本到包含自然语言、动作音效及环境氛围音的完整视频的一站式生成。此外,通过融合多模态理解与长上下文技术,可灵AI进一步推动了生成式AI技术的发展,并在多个应用场景中展现出卓越性能。

来源:量子位

13:01

微软承诺在加拿大和印度投入超300亿美元,用于建设“主权AI”

微软承诺在加拿大和印度投入超300亿美元,用于建设“主权AI”

微软宣布投资超过300亿美元于加拿大和印度,强化本地云基础设施建设与Azure AI服务集成。此举旨在响应各国对数据本地化及AI系统自主控制的需求,通过引入Azure Local、SAIL等技术保障数据主权,并在印度政府福利门户中嵌入AI以提升就业匹配效率。此外,微软加大了技能培训力度,目标是让民众主动参与技术未来构建。

来源:36氪

12:34

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

2025年AI领域迎来重大突破,DeepSeek-R1及其开源版本V3.2引领技术发展。AI模型在性能与开源方面齐头并进,推动了从具身智能机器人到各种AI终端设备的应用扩展。这一年也被视为’Agent元年’,标志着AI从被动响应向主动规划执行转变,开启了智能体时代。同时,在医疗、气象等行业,AI正逐渐成为关键基础设施的一部分。通过年度榜单评选,展示了中国AI生态中最具代表性的企业、产品及个人,为未来AI发展方向提供了重要参考。

来源:量子位

09:55

清华紧逼谷歌,AI顶会NeurIPS论文数第二,中国占半壁江山

清华紧逼谷歌,AI顶会NeurIPS论文数第二,中国占半壁江山

NeurIPS 2025见证了中国AI从数量向质量的转变,清华大学论文接收量逼近谷歌,彰显了中国在底层架构创新上的突破。阿里千问团队提出的《Gated Attention for Large Language Models》获最佳论文奖,革新了Transformer机制,大幅提升了模型效率。中国科研机构通过人才回流和政策支持,在AI领域实现了与硅谷巨头并驾齐驱的局面。

来源:36氪

09:55

年营收 10 亿美元的 Surge AI CEO:比算力更重要的,是 AI 的品味

Surge AI 通过自建训练系统和精细的数据标注方法,专注于提升AI模型的判断力与决策质量,而非单纯追求算力或融资规模。其独特的数据处理方式,包括对标注者行为信号的追踪、机器学习反向分析以及提供评估标准等,使得该公司能够为行业顶尖实验室提供高质量服务,并在未接受外部投资的情况下实现显著商业成功。

来源:36氪

08:53

烧3万亿美元实现ASI,把自己优化掉:这是硅谷CEO们的新赌注

烧3万亿美元实现ASI,把自己优化掉:这是硅谷CEO们的新赌注

硅谷大佬们纷纷预言AI将接管公司,甚至CEO职位。然而,当前AI技术虽在特定任务如代码生成上表现出色,但在长期逻辑连贯性任务中仍显不足。尽管如此,科技巨头预计将在AI领域投入近3万亿美元,推动从自动化决策到多模态处理能力的提升。不过,微软CEO纳德拉认为最终决策者仍将是人类,强调AI作为工具而非替代者的角色。

来源:36氪

08:53

非传统AI公司确认其4.75亿美元种子轮融资

非传统AI公司确认其4.75亿美元种子轮融资

Naveen Rao 创立的 Unconventional AI 获得 4.75 亿美元种子轮融资,估值达 45 亿美元。公司目标是构建高效能AI计算机,追求生物级效率。此轮融资由 Andreessen Horowitz 和 Lightspeed Ventures 领投,标志着对下一代算力效率和技术创新的重大投资。Rao 的过往经历包括成功创立并出售 MosaicML 和 Nervana Systems,显示出其在推动AI技术进步方面的深厚背景。

来源:TechCrunch AI