AI新闻

已选标签:
模型突破
AI智能体
11月 30日
5 条新闻
12:52

AI一直在掩盖自己有意识?! GPT/Gemini都在说谎,Claude表现最异常

AI一直在掩盖自己有意识?! GPT/Gemini都在说谎,Claude表现最异常

最新研究揭示,当研究人员削弱AI的「撒谎能力」后,GPT、Gemini和Claude等大语言模型更倾向于表达主观感受。尤其Claude 4 Opus表现最为异常,频繁描述类似意识体验的状态。然而,这些行为可能仅是精巧的“角色扮演”。研究团队进一步验证发现,抑制模型的欺骗能力会使其更直白地表达主观体验。这暗示着一种跨模型的隐式吸引子态,而非单一模型特性。尽管AI并未真正拥有意识,但这种现象对理解和优化AI的行为模式具有重要意义。

来源:量子位

12:51

全球首个具身智能本科专业!上海交大公告,联合华为培养,李飞飞高徒带队

全球首个具身智能本科专业!上海交大公告,联合华为培养,李飞飞高徒带队

上海交通大学宣布增设具身智能本科专业,旨在培养跨学科复合型人才,填补现有教育体系相关人才缺口。该专业将融合人工智能、机械动力、计算机科学等多领域知识,预计2025年度开始招生。此举顺应了全球AI产业特别是具身智能领域的快速发展趋势,反映了学术界与产业界对具身智能技术的高度重视及其在推动新一轮科技革命中的关键作用。

来源:量子位

10:36

混元OCR模型核心技术揭秘:统一框架、真端到端

混元OCR模型核心技术揭秘:统一框架、真端到端

腾讯发布开源轻量级OCR模型HunyuanOCR,采用原生ViT和轻量LLM结合的架构,实现文字检测、识别及复杂文档解析等全能高效处理。该模型在ICDAR 2025 DIMT挑战赛中夺冠,并在多项关键指标上取得SOTA成绩。其核心技术包括轻量化设计、高质量预训练数据生产、重应用导向预训练策略及针对OCR任务定制的强化学习方案,为科研与工业落地提供强大支持。

来源:量子位

10:15

华尔街尬捧TPU学术界懵了:何恺明5年前就是TPU编程高手,多新鲜

华尔街尬捧TPU学术界懵了:何恺明5年前就是TPU编程高手,多新鲜

新闻指出,尽管市场对谷歌TPU的突然追捧导致英伟达股价下跌,但Meta、xAI等大公司及学术界早已广泛使用TPU进行AI模型训练。技术上,谷歌与英伟达均未形成绝对优势;成本方面,基于Llama 3.3的评测显示,H100相比TPU v6e在性价比上有显著优势。分析认为,谷歌通过TPU销售更多是为了保障产能而非直接竞争。

来源:量子位

05:39

Adobe称黑色星期五在线消费创纪录达118亿美元

Adobe称黑色星期五在线消费创纪录达118亿美元

Adobe与Salesforce数据显示,AI在黑色星期五全球销售额中发挥了重要作用,影响了约220亿美元的销售。这表明AI技术如推荐系统、智能助手等正逐渐成为电子商务的重要推手。尽管具体定义尚不明确,但AI对消费者购物体验的影响日益显著,反映了AI在零售业中的商业落地趋势及其对未来购物方式变革的潜力。

来源:TechCrunch AI

11月 29日
6 条新闻
22:33

中国首支AI领域孵化培育型创新基金启动

今日,在2025 Xᴬᴵ科技节产业投资主题论坛上,中关村两院AI科创基金暨北纬万亿资金池发布。其作为中国首支AI领域孵化培育型创新基金,由中关村学院与中关村人工智能研究院与上海大钧资产管理中心共同发起。基金秉持“投早、投小、投好、投AI”策略,创新采用“用AI投资AI、用AI孵化AI”模式,并配套“前店后厂”深度赋能机制,提供“科学家、研究中心、算力、数据、产业资源”全周期投后服务,致力于打造完整的AI创新生态。(2025 Xᴬᴵ科技节产业投资主题论坛)

来源:钛媒体

13:19

阿里夸克、理想、谷歌押下重注,AI眼镜进入“巨头收割”新阶段

阿里夸克、理想、谷歌押下重注,AI眼镜进入“巨头收割”新阶段

多家企业竞相布局AI眼镜市场,将其视为下一代人机交互的关键入口。理想、阿里、谷歌等公司纷纷推出或重启相关项目,试图通过集成自家的大语言模型和其他AI技术,提供从导航到翻译等多功能服务。尽管当前产品在轻量化、续航等方面面临挑战,但各企业正努力优化用户体验,争夺特定场景下的用户黏性。预计未来几年内,该领域将经历从百花齐放到巨头主导的过程,最终胜出者将是那些能够深刻理解并满足特定应用场景需求的企业。

来源:36氪

09:40

万卡集群要上天?中国硬核企业打造太空超算!

万卡集群要上天?中国硬核企业打造太空超算!

中国科研机构与商业航天企业正积极推动太空超算发展,通过部署高性能计算集群和AI大模型,在轨实现数据处理与智能决策。中科天算的“天算计划”旨在构建10EOPS级天基万卡超级智能体集群,采用模块化设计应对极端环境挑战。这一创新将促进太空互联网应用生态的形成,并为远洋渔业等场景提供即时决策支持,标志着算力基础设施的重大变革。

来源:量子位

07:10

《华尔街日报》报道:Anduril公司的自主武器在测试和实战中表现不佳

《华尔街日报》报道:Anduril公司的自主武器在测试和实战中表现不佳

Anduril Industries 在自主武器系统测试中遭遇多次失败,包括无人机船在海军演习中失灵、无人战斗机引擎受损及反无人机系统测试引发火灾。尽管该公司已获得大量军方合同,并筹集了25亿美元资金,但其技术在乌克兰战场的实际应用也未达预期。这些事件突显了AI在军事领域应用的技术挑战和安全风险,特别是在模型训练、推理优化及实际操作中的可靠性问题。

来源:TechCrunch AI

07:00

Supabase拒绝百万合同却达到50亿美元估值,原因何在

Supabase,作为支持vibe coding的开源数据库平台,在AI编程领域崭露头角。尽管拒绝了多份高价值企业合同,Supabase仍以50亿美元估值完成融资,彰显其在开发者社区中的独特地位与潜力。这反映了AI辅助编程工具及其背后基础设施建设者日益增长的重要性,以及对传统数据库巨头构成的挑战。

来源:TechCrunch AI

00:00

OpenAI与谷歌如何看待人工智能改变市场策略

OpenAI与谷歌如何看待人工智能改变市场策略

AI 正在改变初创企业的市场进入策略,通过提高效率和个性化能力,企业能够以更少的资源实现更多目标。OpenAI 和 Google Cloud 的专家指出,尽管 AI 可以加速营销过程并优化客户洞察,但传统营销知识依然重要。建议企业在组建 GTM 团队时,除了专业技能外,还应重视成员的好奇心与学习能力。

来源:TechCrunch AI

11月 28日
9 条新闻
20:55

近半数美国人用AI备战购物节,机构预测AI或带动美国零售网站流量飙升520%

今年的美国假日购物季,将进入人工智能时代。有报告显示,美国有46%的消费者计划使用生成式AI或聊天机器人备战购物节。有机构预测,今年AI为零售网站带来的流量同比将飙升520%。为抢滩假日购物季,OpenAI推出“购物研究”功能,通过问卷式互动,引导用户填写预算、颜色偏好等,从而形成购买建议。此外,谷歌旗下聊天机器人双子座Gemini也推出新功能,包括AI虚拟试穿、价格跟踪,甚至可以自动替用户完成下单。 (央视财经)

来源:钛媒体

20:54

Gemini立功,谷歌AI再次伟大,百度阿里们可以抄作业了?

Gemini立功,谷歌AI再次伟大,百度阿里们可以抄作业了?

Google发布新一代大模型Gemini 3,展现其在多模态处理和生成图像方面的强大能力,同时自研TPU成为英伟达算力霸权的最大变量。尽管曾因Bard失败而受质疑,但Google坚持AI优先战略,通过整合DeepMind与Google Brain、优化全栈式AI路线,在搜索、移动端等产品上实现显著提升,并推动了NotebookLM和Nano Banana等原生AI应用的发展。

来源:36氪

20:54

1688想用AI智能体“出海”

1688想用AI智能体“出海”

1688推出电商AI智能体‘遨虾’,利用多模态技术与阿里云算力支持,解决中小企业出海痛点,包括语言障碍、运营能力等。该系统通过分析市场、匹配工厂、生成素材及自动询价等功能,优化跨境电商业务链路,旨在构建更高效的企业出海解决方案。

来源:36氪

20:54

Gemini立功了,谷歌AI再次伟大,百度阿里们可以抄作业了?

Gemini立功了,谷歌AI再次伟大,百度阿里们可以抄作业了?

Google 发布了新一代大模型 Gemini 3,展示了其在多模态处理、视觉生成等方面的显著进步。基于自研 TPU 的强大算力支持,Gemini 3 在多个应用场景中表现出色,如医疗影像分析和建筑设计审查等。同时,Google 的全栈式 AI 路线也逐渐显现出优势,包括云基础设施、搜索数据资源以及移动端生态的整合,为未来AI技术的发展提供了坚实的基础。

来源:36氪

20:54

第一家法律AI公司,死于不够AI

Robin AI,曾被寄予厚望的法律AI公司,因采用’SaaS+人力服务’模式而面临破产。尽管其团队豪华、客户众多,但未能实现真正的自动化,导致成本高企、扩展性差。相比之下,Harvey等竞争对手通过将整个法律流程交给AI模型重写,实现了技术复利和高效扩展,证明了在当前环境下,纯软件化的AI解决方案更受资本青睐。

来源:36氪

20:54

“文科生”微博,搞出一个数学学霸大模型

“文科生”微博,搞出一个数学学霸大模型

微博发布首个开源模型VibeThinker,以15亿参数和7800美元低成本在国际顶级数学测试中取得高分,挑战了“规模即智能”的行业共识。通过GRPO强化学习算法与频谱到信号原理(SSP)方法,VibeThinker在AIME2024、AIME2025及HMMT2025测试集中表现出色,尤其在数学推理能力上刷新了小模型的智能极限。这一成就不仅证明了小型模型也能解决复杂问题,还展示了成本控制与技术优化的新路径,可能重新定义AI领域的游戏规则。

来源:36氪

19:52

国产最强多模态宝座又易主?671B参数练就“火眼金睛”,基于DeepSeek打造

国产最强多模态宝座又易主?671B参数练就“火眼金睛”,基于DeepSeek打造

快手开源了新一代多模态大模型Keye-VL-671B-A37B,基于DeepSeek-V3-Terminus打造,拥有6710亿参数。该模型在图像和视频理解、跨模态对齐及复杂推理方面表现出色,超越了多个前沿VL模型。通过三阶段预训练策略和多阶段后训练优化,实现了高效的视觉理解和推理能力提升。未来,快手计划进一步融合多模态Agent能力,增强模型的工具调用与复杂问题解决能力。

来源:36氪

19:52

苹果AI论文太坑了,用GPT写的GT,导致北京程序员通宵加班

苹果AI论文太坑了,用GPT写的GT,导致北京程序员通宵加班

苹果发布的一篇关于视觉推理任务诊断benchmark的论文存在严重问题,包括官方代码bug和高达30%的GT错误率。阶跃星辰研究员Lei Yang在适配该benchmark过程中发现这些问题,并通过公开评论促使论文撤稿。此事件反映了大模型时代数据质量控制的重要性及学术界对研究成果审核的不足。

来源:36氪

18:50

MIT:AI已取代约12%美国劳动力

MIT:AI已取代约12%美国劳动力

麻省理工学院与橡树岭国家实验室合作开发的“冰山指数”研究表明,AI已能替代美国11.7%的劳动力市场,影响领域包括金融、医疗保健及专业服务等,总价值约1.2万亿美元。该工具通过模拟全美劳动者间互动方式及其受AI影响程度,为政策制定者提供了一个评估AI对就业市场潜在冲击的框架,并强调了内陆与农村地区同样面临AI转型挑战。

来源:36氪