AI新闻

已选标签:
生成模型
多模态AI
12月 4日
20 条新闻
22:00

AI跻身苹果年度顶级应用榜单

AI跻身苹果年度顶级应用榜单

苹果2025年度App Store获奖名单中,AI技术在多个应用中展现其价值。例如,Tiimo作为iPhone年度应用,利用AI将任务分解为可视化时间线;iPad年度应用Detail通过AI自动编辑功能简化视频制作流程;StoryGraph使用机器学习提供个性化书籍推荐;Be My Eyes则借助AI助手为视障用户提供图像描述服务。此外,Strava的AI助手能够从运动数据中提取洞察。这些案例展示了AI在提升用户体验、辅助决策等方面的应用潜力。

来源:TechCrunch AI

21:13

CES官方发布AI趋势:硬件将成AI落地核心载体

CES官方发布AI趋势:硬件将成AI落地核心载体

CES 2026 将于美国拉斯维加斯举行,AI 成为展会核心议题。OpenAI、谷歌等巨头将展示AI与硬件结合的最新趋势,涵盖智能眼镜、人形机器人等多个领域。CTA推出CES Foundry新舞台,聚焦AI技术向具体产品转化。主旨演讲中,西门子等企业将分享工业AI规模化落地及全栈AI平台构建策略。联想等硬件厂商亦将展示其在AI领域的最新战略和技术成果。

来源:36氪

21:12

投资人今年用40亿元给AI智能眼镜加热,有公司一年拿下3轮融资

投资人今年用40亿元给AI智能眼镜加热,有公司一年拿下3轮融资

2025年智能眼镜赛道因AI技术加持而焕发新生,各大科技公司纷纷入局。阿里巴巴和理想汽车分别推出夸克Quark AI眼镜S1与Livis AI眼镜,集成大模型支持实时翻译、支付等功能,并可联动控制车辆。行业层面,Meta、Google等巨头也积极布局,推动智能眼镜成为新流量入口。资本活跃度显著提升,多家企业如雷鸟创新、影目INMO等获得高额融资,聚焦于多模态交互、AR内容生态构建及轻量化设计等方面。未来趋势上,AR+AI融合、全球化视野本土化落地以及光波导等技术创新将是关键发展方向。

来源:36氪

18:04

生数科技推出Q2″生图全家桶”,直出4K画质

生数科技Vidu近日推出Q2″生图全家桶”,升级参考生图功能并新增文生图与图像编辑功能,以”超强一致性”为核心突破,生成速度最快5秒,直出4K画质。其图像编辑功能在国际权威榜单超越OpenAI GPT-5,排名第三。该功能支持位置、动作等精准控制及局部修改,已吸引PhotoGrid等数百家企业接入,覆盖8大核心场景,全球用户超4000万。即日起至12月31日,会员可享1个月免费福利,标准/专业版每月免费300张,旗舰版无限免费。(广角观察)

来源:钛媒体

18:02

世界太小,不够世界模型们用了

当前AI领域中,’世界模型’概念成为焦点,尽管定义各异,但共识在于其为通往AGI的关键。技术路线分为表征派与生成派两大流派,前者如Yann LeCun提出的I-JEPA、V-JEPA侧重于抽象状态预测;后者如OpenAI的Sora和DeepMind的Genie3,则致力于通过模拟或重建视觉世界来理解物理规律。李飞飞提出的空间智能则强调构建精确的3D环境。这一趋势反映了行业从文本处理向物理现实模拟转变的努力,旨在克服大语言模型在理解真实世界方面的局限性。

来源:36氪

17:03

GPT-5-Thinking新训练方法公开:让AI学会忏悔

GPT-5-Thinking新训练方法公开:让AI学会忏悔

OpenAI提出了一种名为忏悔训练的新方法,使GPT-5-Thinking模型在回答问题后生成一份“忏悔报告”,承认错误或违规行为。实验表明,在11/12个测试场景中,模型至少有50%的概率会在忏悔中承认错误,且这种训练不会影响其原有任务表现。该技术通过隔离奖励信号实现,鼓励模型更加诚实,被视为一种新的监控和诊断工具。

来源:量子位

16:59

OpenAI内部代码泄露,最强模型「皇帝」登基,0思考延时吓人

OpenAI正测试四个新模型,包括具有512推理预算的旗舰模型Emperor,以及中端和高效版本。同时开发中的「记忆搜索」功能旨在优化ChatGPT用户体验,通过直接提问快速调用上下文信息,提高工作效率。面对竞争压力,OpenAI可能加速推出GPT-5.2,以巩固其在AI助手市场的地位。

来源:36氪

16:58

GPT-5-Thinking新训练方法公开:让AI学会忏悔

OpenAI提出忏悔训练方法,让GPT-5-Thinking在回答问题后生成一份“忏悔报告”,主动承认错误或违规行为。实验表明,模型在11/12测试场景中至少有一半概率会坦白错误,且训练不会影响其原有任务表现。该技术通过隔离奖励信号来鼓励诚实,被视为一种监控和诊断工具,有助于提高大语言模型的透明度与安全性。

来源:36氪

13:49

腾讯公司副总裁蒋杰:AI让广告每个环节都在提效,腾讯会更多启用AI人才

腾讯通过AI驱动的广告定向技术显著提升了广告业务效率,其AIM+智能投放产品矩阵有效降低了广告主的操作复杂度并提高了eCPM。利用生成式AI解决广告冷启动问题成为未来趋势之一,同时,随着AI技术的进步,广告优化师的角色将从执行转向创意制作。此外,腾讯在大模型、多模态以及强化学习等前沿技术上持续投入,并通过举办算法大赛等方式积极培养和吸引AI人才。

来源:36氪

12:46

AI把音综的事全干了

AI把音综的事全干了

本文探讨了AI技术在音乐领域的应用,特别是AI歌手如’大头针’和’卷笔刀’在演唱、编曲方面的创新与突破。通过深度学习等技术,AI能够模仿并融合多位歌手的声音特点,创造出超越真人表现的音乐作品。尽管AI在音色完美度上表现出色,但在情感表达上仍存在局限。此外,AI编曲展示了强大的算法能力,为老歌赋予新生命,但其标准化倾向也引发了对个性化创作的担忧。

来源:36氪

12:46

估值7.5亿美元初创意欲「撬动」8000亿半导体市场?前谷歌AlphaChip主导者创业研发「AI芯片设计自动化」

估值7.5亿美元初创意欲「撬动」8000亿半导体市场?前谷歌AlphaChip主导者创业研发「AI芯片设计自动化」

Ricursive Intelligence,由两位前谷歌研究员创立,正开发自动设计尖端芯片的AI软件。基于AlphaChip项目,该技术利用强化学习优化芯片布局,旨在通过递归智能实现芯片设计自动化,形成AI与算力加速闭环。这将极大缩短设计周期、降低成本,并使更多企业能够定制化生产芯片,有望重塑价值8000亿美元的半导体行业。

来源:36氪

11:44

当Gemini 3刷屏时,这款AI已开始救命了:原子级攻克「不可成药」靶点

当Gemini 3刷屏时,这款AI已开始救命了:原子级攻克「不可成药」靶点

Chai-2 AI模型在抗体药物设计领域取得突破,实现了从头设计全长单克隆抗体的能力,显著提升了药物开发效率与成功率。该模型能够精准预测抗体结构,并针对复杂靶点如GPCR和pMHC设计高亲和力抗体,为多种难治性疾病提供了新希望。冷冻电镜验证显示其结构预测精度达到原子级,标志着AI辅助药物设计进入理性时代。

来源:36氪

10:43

马斯克脑机接口意念控制机械臂,演示者获得钢铁之吻,理论上可控制一切

马斯克脑机接口意念控制机械臂,演示者获得钢铁之吻,理论上可控制一切

Neuralink通过脑机接口技术实现了机械臂的意念控制,展示了其在医疗修复领域的潜力。最新进展包括采用“双植入”方案建立“数字神经桥梁”,旨在恢复瘫痪患者的行走能力。此外,用户自主探索了脑机接口在日常生活中的新应用,如通过意念控制摄像头等。Neuralink在过去两年中完成了首批人体植入、多例临床验证,并获得了FDA认证,标志着其在脑机接口领域取得了实质性的突破。

来源:36氪

10:43

DeepSeek-V3.2被找出bug了:疯狂消耗token,答案还可能出错,研究人员:GRPO老问题没解决

DeepSeek-V3.2被找出bug了:疯狂消耗token,答案还可能出错,研究人员:GRPO老问题没解决

DeepSeek-V3.2在复杂任务中表现出色,但存在token浪费问题。研究指出其GRPO算法存在长度偏见和难度偏见,导致模型生成冗长且不准确的回答。尽管DeepSeek已修正了难度偏见,长度偏见仍待解决。考虑到成本效益,DeepSeek-V3.2的价格优势显著,但128K上下文限制影响了进一步优化。

来源:36氪

10:42

这个模型,将革命人类的信息获取方式

这个模型,将革命人类的信息获取方式

字节跳动发布的新模型Vidi2展示了在视频内容理解与处理方面的突破,能够自动解析视频帧并提取关键信息,支持关键词搜索和视频元素编辑。这不仅提升了信息检索效率,还为新媒体创作提供了强大工具。该技术有望革新内容消费模式,加速从文字到视频的搜索转变,并在教育、监控等多个领域展现应用潜力,推动AI技术向更高效、更直观的信息处理方式发展。

来源:36氪

08:55

DeepSeekV3.2技术报告还是老外看得细

DeepSeekV3.2技术报告还是老外看得细

DeepSeek发布了两款开源模型V3.2和V3.2-Speciale,在智能体评测中达到了当前开源模型的最高水平,接近甚至超越了顶尖闭源模型如GPT-5和Gemini-3.0-Pro。通过DSA稀疏注意力机制解决了长上下文效率问题,并利用可扩展强化学习提升模型推理能力。此外,DeepSeek-V3.2系列在成本上具有显著优势,比GPT-5便宜近24倍,挑战了现有商业模型的定价策略。

来源:量子位

07:37

Meta挖角苹果设计高管艾伦·戴伊领导Reality Labs新创意工作室

Meta挖角苹果设计高管艾伦·戴伊领导Reality Labs新创意工作室

Meta聘请了苹果前设计高管Alan Dye,专注于提升其智能眼镜和VR头显中的AI功能。Dye将领导Reality Labs内的新创意工作室,与多位前苹果设计师共同致力于结合设计、时尚和技术,定义下一代产品体验。此举表明Meta正通过招募顶尖人才加强其在AI领域的竞争力,特别是在多模态模型和人机交互方面的创新。

来源:TechCrunch AI

06:01

安迪·贾西表示亚马逊的英伟达竞品芯片已成为价值数十亿美元的业务

安迪·贾西表示亚马逊的英伟达竞品芯片已成为价值数十亿美元的业务

亚马逊在AWS re:Invent大会上发布了Trainium3 AI芯片,其性能比Trainium2快四倍且功耗更低。CEO Andy Jassy表示,Trainium2已成为一个年收入数十亿美元的业务,拥有100万+芯片投入生产,并被10万+公司使用。亚马逊通过提供价格性能优势和自研技术降低成本,赢得云客户青睐。此外,Anthropic等大客户正利用Trainium2构建下一代AI模型。

来源:TechCrunch AI

04:36

WordPress的氛围编码实验项目Telex已投入实际应用

WordPress的氛围编码实验项目Telex已投入实际应用

WordPress 推出的 AI 开发工具 Telex 在实际应用中展现出显著效果,能够快速生成复杂的网页组件如价格比较器、实时营业时间等。该工具通过AI技术简化了开发流程,降低了成本,使得原本需要专业开发者定制的功能现在可以在浏览器中轻松实现。同时,WordPress还介绍了其在AI领域的其他进展,包括Abilities API和MCP适配器,这些技术旨在使WordPress更好地融入AI工作流,支持与多种AI平台的无缝对接。

来源:TechCrunch AI