AI新闻

已选标签:
模型突破
12月 12日
13 条新闻
10:20

世航连续完成多轮数亿元融资,巩固海洋具身机器人全球领先身位

海洋具身机器人领军企业世航智能完成多轮数亿元融资,加速推进产品及技术迭代。其虎鲸海洋具身机器人在动力、控制、传感等六大核心系统全面自研,性能指标突破行业极限,获多项国家级奖项认可。基于AI驱动的水下清洗检测机器人已在船舶养护、港口巡检等多个场景实现规模化商业闭环,助力海洋强国建设。

来源:36氪

09:18

“太空数据中心”成AI必争之地?马斯克与贝佐斯互掐,Altman也想插一脚

科技巨头如马斯克的SpaceX和贝佐斯的蓝色起源正将AI数据中心竞赛延伸至太空,旨在利用无限太阳能解决地面上日益增长的能源消耗问题。尽管存在技术障碍和成本效益挑战,但支持者认为太空数据中心在能源获取与冷却方面具备独特优势,可能成为未来三到四年的重要技术突破之一。

来源:36氪

09:18

豆包手机“封禁”背后,藏着所有品牌都该懂的未来生存法则

豆包手机助手事件揭示了AI助手可能颠覆传统营销方式的趋势。AI助手作为用户与商业世界的中介,将改变品牌触达用户的方式,使购物平台管道化,并影响品牌的数据获取和创新。面对这一挑战,品牌需从满足功能需求转向提供情感和社交价值,构建深层次的用户关系,以在AI时代保持竞争力。

来源:36氪

09:18

一文读懂GPT-5.2 : 直指“经济价值”,硬刚Gemini3的剧情未出现

一文读懂GPT-5.2 : 直指“经济价值”,硬刚Gemini3的剧情未出现

OpenAI发布GPT-5.2,强调其在专业知识工作和企业级应用中的性能跃升,特别是在电子表格处理、演示文稿制作、代码编写等方面超越或持平人类专家。新模型分为Instant、Thinking、Pro三个版本,旨在满足从日常任务到复杂科研的不同需求。GPT-5.2在多工具编排任务、长文本理解和视觉理解方面表现出色,为企业提供了更高效稳定的智能解决方案。

来源:36氪

09:18

谷歌深夜重磅开源,深度研究Agent拿下SOTA,比GPT-5 pro便宜90%

谷歌深夜重磅开源,深度研究Agent拿下SOTA,比GPT-5 pro便宜90%

谷歌发布三项AI Agent更新:Deep Research Agent功能升级并开源,通过多步强化学习提高信息搜索与报告生成效率;推出新基准DeepSearchQA,评估Agent复杂任务处理能力;发布交互API简化Gemini模型和Agent的开发流程。这些更新旨在提升数据安全、成本效益及应用灵活性,在金融、生物技术等领域展现潜力。

来源:36氪

08:18

谷歌发布了迄今为止最强大的AI研究代理——就在同一天,OpenAI推出了GPT-5.2

谷歌发布了迄今为止最强大的AI研究代理——就在同一天,OpenAI推出了GPT-5.2

Google 发布了基于 Gemini 3 Pro 的新版研究代理 Gemini Deep Research,该代理不仅能够生成研究报告,还允许开发者通过新的 Interactions API 将其研究能力嵌入到自己的应用中。此工具适用于从尽职调查到药物毒性安全研究等多种任务,并将被整合进 Google Search、Google Finance 等服务中。此外,Google 引入了名为 DeepSearchQA 的新基准来测试代理在复杂多步骤信息检索任务中的表现,以证明其在减少 AI 幻觉方面的进步。

来源:TechCrunch AI

08:16

AI专业爆火,CS被美国00后抛弃了

AI专业爆火,CS被美国00后抛弃了

随着AI技术的快速发展,美国高校中AI相关专业的热度急剧上升,成为吸引学生申请的新趋势。MIT的AI专业成立仅三年便成为该校第二大热门专业,同时全美超过300所院校提供AI学位。这种转变背后的原因是AI领域就业机会的增加以及对CS专业就业前景的担忧。AI不仅在计算机科学领域内取代了部分地位,在金融、法律、工程、医学等传统专业也产生了深远影响。

来源:36氪

08:16

GPT-5.2来了,首个“专家级”AI复仇成功,牛马打工人终于得救了

GPT-5.2来了,首个“专家级”AI复仇成功,牛马打工人终于得救了

OpenAI发布GPT-5.2系列模型,涵盖即时版、思考版和专业版,专为解决高难度知识型工作设计。在多项基准测试中表现优异,尤其在通用智能、超长文本理解、Agent工具调用及视觉能力方面实现全面进化。GPT-5.2拥有更长的上下文窗口(40万Token)和更新的知识库(至2025年8月31日),并支持复杂逻辑推理。尽管价格较前代上涨40%,但其在编程、项目管理等领域的出色表现预示着更强的专业辅助能力。

来源:36氪

07:15

OpenAI发布更先进模型GPT-5.2

在谷歌发布广受好评的Gemini 3几周后,OpenAI宣布将推出一款新的人工智能模型,旨在提升 ChatGPT在编程、科学以及各种工作任务上的表现。该公司周四表示,新模型GPT-5.2速度更快,在查找信息、写作和翻译方面更为擅长。该模型共分三档,旨在更好地模拟人类的推理过程,以处理诸如数学、编程等领域中更复杂、更耗时的任务。GPT-5.2将于周四开始向付费用户推出。本月早些时候,OpenAI首席执行官Sam Altman在一份公司备忘录中宣布拉响“红色警报”,并表示应重新分配内部资源,加快对ChatGPT的改进。Altman表示:“Gemini 3对我们的影响没有担心的那么大。”Altman 还说,他预计OpenAI明年1月退出“红色警报”状态,以非常强劲的姿态重回常态。(广角观察)

来源:钛媒体

02:02

OpenAI 在“红色警报”备忘录后以 GPT-5.2 回击谷歌

OpenAI 在“红色警报”备忘录后以 GPT-5.2 回击谷歌

OpenAI发布GPT-5.2,面向开发者与专业用户,提供Instant、Thinking和Pro三种模式,分别针对常规查询、复杂结构化工作及高精度需求。该模型在编码、数学、科学、视觉理解等方面表现卓越,旨在推动企业级应用开发。面对Google Gemini 3的竞争,GPT-5.2在多项基准测试中领先,强调了其在多模态处理和长文本推理上的优势。

来源:TechCrunch AI

02:00

谷歌推出“Disco”:一款基于Gemini的工具,可将浏览器标签页转化为网络应用

谷歌推出“Disco”:一款基于Gemini的工具,可将浏览器标签页转化为网络应用

Google 推出基于 Gemini 3 的 AI 实验产品 Disco,可将浏览器标签页转化为定制化 Web 应用。通过 GenTabs 工具,Disco 根据用户浏览内容主动推荐或构建互动式应用,如可视化学习资料、制定餐单等,支持自然语言命令进行持续优化。该技术利用浏览器和聊天记录中的信息即时生成个性化体验,目前仅对部分测试者开放,未来可能融入更多 Google 产品中。

来源:TechCrunch AI

01:00

Runway发布首款全球模型,并在最新视频模型中加入原生音频功能

Runway发布首款全球模型,并在最新视频模型中加入原生音频功能

Runway 发布其首个世界模型 GWM-1,通过逐帧预测模拟物理世界的运行方式,适用于机器人、生命科学等领域的代理训练。同时,Runway 更新了其 Gen 4.5 视频模型,新增原生音频及多镜头长视频生成能力。GWM-1 包括 GWM-Worlds、GWM-Robotics 和 GWM-Avatars 三个版本,分别用于创建交互式项目、机器人仿真和人类行为模拟,标志着视频生成模型正从原型向生产级工具迈进。

来源:TechCrunch AI

12月 11日
7 条新闻
23:21

迪士尼与OpenAI达成协议,允许使用索拉生成包含其角色的人工智能视频

迪士尼与OpenAI达成协议,允许使用索拉生成包含其角色的人工智能视频

迪士尼与OpenAI达成三年合作,将旗下超过200个角色引入Sora AI视频生成器及ChatGPT Images功能中,允许用户通过文本提示创建包含这些角色的短片。迪士尼同时向OpenAI投资10亿美元,并计划利用其API开发新产品和服务。此次合作展示了人工智能在内容创作领域的潜力,强调了负责任地扩展故事叙述边界的重要性。

来源:TechCrunch AI

23:00

《时代》杂志将“人工智能的构建者”评为年度人物

《时代》杂志将“人工智能的构建者”评为年度人物

《时代》杂志将2025年度人物授予“AI建筑师”,包括Nvidia、Tesla、OpenAI等公司的CEO们,他们通过数十亿美元的投资推动了AI技术的发展与应用,重塑了政府政策、加剧了地缘政治竞争,并加速了AI在全球范围内的普及。文章指出,AI已成为自核武器以来最具影响力的工具,在信息环境、气候变化及生计等方面产生了深远影响。

来源:TechCrunch AI

21:59

王兴兴:具身智能是否迎来“ChatGPT时刻”的关键指标预判是两个“80%”

宇树科技创始人兼首席执行官王兴兴表示,具身智能是否迎来“ChatGPT时刻”的关键指标预判是“双80%”。当机器人在80%的陌生环境中,仅凭语音指令就能达成80%的任务成功率,真正的具身智能拐点就将到来。而这,可能就在未来一两年内发生。(央视财经)

来源:钛媒体

21:00

Opera希望您每月支付20美元使用其AI驱动的Neon浏览器

Opera希望您每月支付20美元使用其AI驱动的Neon浏览器

Opera 推出 AI 驱动的浏览器 Neon,集成聊天机器人以执行任务、创建应用和视频等。Neon 利用浏览历史提供上下文信息,并支持构建重复任务卡片及深度研究代理。订阅服务包括访问顶级模型如 Gemini 3 Pro 和 GPT-5.1 等。尽管 Opera 的其他产品也提供免费 AI 功能,但 Neon 更注重为早期技术爱好者提供最新 AI 技术体验。

来源:TechCrunch AI

21:00

对Spoor鸟类监测AI软件的兴趣正在飙升

对Spoor鸟类监测AI软件的兴趣正在飙升

挪威初创公司Spoor利用计算机视觉技术,开发出可识别并追踪鸟类的软件,帮助风电场减少对鸟类的影响。该软件能检测2.5公里范围内的鸟类活动,并与任何高分辨率相机兼容。通过不断优化AI模型,其鸟类识别准确率已达96%。除了风电行业,机场和水产养殖业也对该技术表现出兴趣。随着监管趋严,此类环保监测工具的需求将持续增长。

来源:TechCrunch AI

20:57

时薪120美元,我把自己喂给了AI,顺便砸了自己的饭碗

时薪120美元,我把自己喂给了AI,顺便砸了自己的饭碗

新闻揭示了AI面试平台Mercor通过高薪吸引专家参与,实则以低成本‘收购’其专业知识用于训练模型的现象。该模式绕过传统机构直接从个体获取知识资本,将其转化为可交易的训练样本,展示了AI时代下的一种新型商业模式。尽管引发了对数据安全、隐私保护及伦理道德的担忧,但Mercor仍迅速成长为估值百亿美元的企业,反映了当前AI行业对于高质量训练数据的迫切需求及其背后潜在的技术挑战与产业发展趋势。

来源:36氪