AI新闻

已选标签:
生成模型
AI视频
12月 12日
4 条新闻
02:09

谷歌的AI试衣功能现在只需一张自拍即可使用

谷歌的AI试衣功能现在只需一张自拍即可使用

Google升级了AI试穿功能,用户仅需一张自拍照即可虚拟试穿衣物。该功能基于Gemini 2.5 Flash Image模型(Nano Banana),能够生成用户的全身数字形象,并支持多种体型选择。此外,Google还通过其Doppl应用提供了一个可购物的发现流,展示个性化推荐并允许用户虚拟试穿新商品。这项技术展示了计算机视觉在电商领域的最新应用及其提升用户体验的潜力。

来源:TechCrunch AI

02:02

OpenAI 在“红色警报”备忘录后以 GPT-5.2 回击谷歌

OpenAI 在“红色警报”备忘录后以 GPT-5.2 回击谷歌

OpenAI发布GPT-5.2,面向开发者与专业用户,提供Instant、Thinking和Pro三种模式,分别针对常规查询、复杂结构化工作及高精度需求。该模型在编码、数学、科学、视觉理解等方面表现卓越,旨在推动企业级应用开发。面对Google Gemini 3的竞争,GPT-5.2在多项基准测试中领先,强调了其在多模态处理和长文本推理上的优势。

来源:TechCrunch AI

02:00

谷歌推出“Disco”:一款基于Gemini的工具,可将浏览器标签页转化为网络应用

谷歌推出“Disco”:一款基于Gemini的工具,可将浏览器标签页转化为网络应用

Google 推出基于 Gemini 3 的 AI 实验产品 Disco,可将浏览器标签页转化为定制化 Web 应用。通过 GenTabs 工具,Disco 根据用户浏览内容主动推荐或构建互动式应用,如可视化学习资料、制定餐单等,支持自然语言命令进行持续优化。该技术利用浏览器和聊天记录中的信息即时生成个性化体验,目前仅对部分测试者开放,未来可能融入更多 Google 产品中。

来源:TechCrunch AI

01:00

Runway发布首款全球模型,并在最新视频模型中加入原生音频功能

Runway发布首款全球模型,并在最新视频模型中加入原生音频功能

Runway 发布其首个世界模型 GWM-1,通过逐帧预测模拟物理世界的运行方式,适用于机器人、生命科学等领域的代理训练。同时,Runway 更新了其 Gen 4.5 视频模型,新增原生音频及多镜头长视频生成能力。GWM-1 包括 GWM-Worlds、GWM-Robotics 和 GWM-Avatars 三个版本,分别用于创建交互式项目、机器人仿真和人类行为模拟,标志着视频生成模型正从原型向生产级工具迈进。

来源:TechCrunch AI

12月 11日
16 条新闻
23:21

迪士尼与OpenAI达成协议,允许使用索拉生成包含其角色的人工智能视频

迪士尼与OpenAI达成协议,允许使用索拉生成包含其角色的人工智能视频

迪士尼与OpenAI达成三年合作,将旗下超过200个角色引入Sora AI视频生成器及ChatGPT Images功能中,允许用户通过文本提示创建包含这些角色的短片。迪士尼同时向OpenAI投资10亿美元,并计划利用其API开发新产品和服务。此次合作展示了人工智能在内容创作领域的潜力,强调了负责任地扩展故事叙述边界的重要性。

来源:TechCrunch AI

20:57

最牛打工妹,瞄准人形机器人

最牛打工妹,瞄准人形机器人

立讯精密计划今年出货3000台人形机器人,旨在通过其在消费电子领域积累的精密制造能力转型为智能制造业赋能者。尽管市场预测显示人形机器人产业未来前景广阔,但目前仍面临技术壁垒、商业化路径不明确等挑战。立讯精密需加强技术研发和生态布局,以实现从零部件供应商到整机制造商的跨越。

来源:36氪

19:55

独立开发者的AGI焦虑,何处有解?

独立开发者的AGI焦虑,何处有解?

新闻探讨了AGI浪潮下独立开发者面临的机遇与挑战,通过具体案例展示了AI技术如何显著降低软件开发门槛,并推动独立开发者快速实现商业成功。同时指出了独立开发者在收入稳定性、市场竞争等方面的困境,强调了构建支持系统的重要性。随着AGI技术的发展,尤其是以GPT-5为代表的先进大模型及其工具链的成熟,为独立开发者提供了前所未有的机会。

来源:36氪

19:55

阿里成立千问C端事业群,吴嘉能成下一个旗帜吗?

阿里成立千问C端事业群,吴嘉能成下一个旗帜吗?

阿里巴巴成立千问C端事业群,整合智能信息与互联业务,旨在打造覆盖全场景的AI超级应用,成为用户接触AI技术的首选。通过集中优势资源和技术,阿里期望在生成式AI时代掌握用户心智和流量分发权,构建以自身为核心的AI新生态。吴嘉作为该事业群负责人,将面临从移动到AI的技术浪潮挑战,目标是实现用户增长并探索AI商业化路径。

来源:36氪

19:54

倒反天罡,Meta抄阿里千问作业,没拿授权

倒反天罡,Meta抄阿里千问作业,没拿授权

Meta在研发新大模型“牛油果”时,采用阿里云通义千问开源模型进行微调优化,标志着中国AI技术在全球范围内影响力增强。面对Llama 4表现不佳及与竞争对手差距拉大的挑战,Meta转向闭源专有路线,计划于2026年发布性能对标GPT-5的‘牛油果’。此转变反映了AI领域内从开源到闭源策略的调整趋势,以及中国AI企业崛起对全球格局的影响。

来源:36氪

19:00

Port 以8亿美元估值筹集1亿美元对抗Spotify的Backstage

Port 以8亿美元估值筹集1亿美元对抗Spotify的Backstage

以色列初创公司Port筹集1亿美元C轮融资,估值达8亿美元。Port提供了一个开发者工具门户,用于管理和编排AI代理,以实现代码外的自动化任务如事件解决、安全管理等。其产品包括一个“上下文湖”功能,定义了数据源、上下文记忆和代理操作规范,确保企业标准下的高效协作与执行。随着大语言模型技术在编程领域的深入应用,Port正成为这一新兴市场中的重要参与者。

来源:TechCrunch AI

18:51

马斯克霸气回怼Waymo:连对抗特斯拉的机会都没有

马斯克霸气回怼Waymo:连对抗特斯拉的机会都没有

新闻围绕Waymo与特斯拉在自动驾驶领域的竞争展开,重点介绍了Waymo基于Gemini大模型构建的“快速感知-深度推理”双系统架构及其在安全性和运营里程上的优势。同时提及了特斯拉FSD的安全数据及成本优势,并指出马斯克计划在三周内在奥斯汀部署无安全员的Robotaxi服务,反映了自动驾驶技术在实际应用中的最新进展。

来源:36氪

18:51

Meta大转向:下一代模型“牛油果”推迟,开源时代或将终结

Meta大转向:下一代模型“牛油果”推迟,开源时代或将终结

Meta调整AI战略,推迟至2026年一季度发布下一代模型Avocado,并转向闭源模式。此举标志着Meta从开源生态向更具防御性和商业导向策略的转变。为支持闭源模型,Meta增加资本支出至700-720亿美元,重点投向训练集群与数据中心扩建。组织层面,FAIR与GenAI影响力减弱,新成立的MSL强调产品落地与闭环速度。硬件方面,Meta削减元宇宙预算,资源重心转向AI相关设备。整体上,Meta正构建一个更封闭、集中且以商业结果为导向的AI体系。

来源:36氪

18:51

AI巨头制定AI“宪法”:捐赠核心技术,推动“智能体联合国”标准化

AI巨头制定AI“宪法”:捐赠核心技术,推动“智能体联合国”标准化

OpenAI、Anthropic与Block联合成立AI智能体基金会(AAIF),旨在推动形成统一开放标准,解决智能体互操作性问题及避免封闭垄断风险。通过捐赠包括MCP协议、AGENTS.md规范和Goose框架在内的关键技术,为开发者提供更高效、安全的协作环境,加速AI智能体从实验阶段向现实应用迈进。这一合作反映了巨头们在智能体商业化赛道上对开放生态的战略共识。

来源:36氪

18:50

完美主义,苹果AI无能的“元凶”?

完美主义,苹果AI无能的“元凶”?

苹果在2025年AI领域的投入和战略经历了显著转变,从年初的股价下跌到下半年的反弹,反映了市场对其AI投资态度的变化。尽管苹果面临高管流失和技术路线争议,但最终决定加大AI投入,尤其在生成式AI领域,并调整了内部管理结构以促进AI技术的发展。然而,苹果长期以来的完美主义文化和封闭模式是否能适应快速发展的AI时代,仍需时间检验。

来源:36氪

18:50

刚刚,AI顶会ICML允许AI参与审稿

刚刚,AI顶会ICML允许AI参与审稿

ICML 2026推出复杂双轨制审稿政策,允许有限度地使用AI辅助审稿并引入对等原则防止双标;新平台aiXiv则激进拥抱全自动科研模式,由AI撰写和评审论文。两者分别代表了AI Integrated与AI Native两条路线,旨在应对AI领域论文数量爆炸的现状。ICML试图通过制度设计保持人类在科学评价中的核心地位,而aiXiv则押注于AI最终能涌现出鉴别真理的能力。

来源:36氪

17:48

AI 时代,年轻译者正集体断层

AI 时代,年轻译者正集体断层

随着AI技术,特别是机器翻译的进步,语言专业学生面临严峻的就业挑战。以美国明德大学蒙特雷国际研究学院宣布停止部分项目为标志,反映了AI对传统翻译行业的冲击及教育体系与行业需求之间的脱节。尽管AI在效率和成本上具备优势,但在文化语境理解和复杂表达方面仍无法完全替代人类译员。这一现象不仅揭示了AI技术的发展趋势,也引发了关于未来职业选择、人才培养模式以及人机协作的新思考。

来源:36氪

16:46

从冷门歌手到热门金曲,AI音乐成了?

从冷门歌手到热门金曲,AI音乐成了?

AI音乐在近两年内实现了从技术试水到内容爆发的转变,通过深度学习模型学习海量音乐数据结构与风格规律,生成符合用户指令的音乐。2024年多款AI音乐生成模型及工具如Suno V3、Mureka等相继推出,支持多种音乐风格并能快速生成完整歌曲。AI音乐不仅在C端市场受到欢迎,在B端也展现出显著的成本和效率优势。然而,版权问题仍是制约其发展的主要挑战之一。

来源:36氪

16:46

OpenAI 盲测新模型不如 Nano Banana Pro?曝 Altman 要暂停 Sora,死磕 ChatGPT

OpenAI 盲测新模型不如 Nano Banana Pro?曝 Altman 要暂停 Sora,死磕 ChatGPT

OpenAI 正在内部测试 GPT-5.2,并在 Design Arena 与 LM Arena 平台上盲测新的图像生成模型 Chestnut 和 Hazelnut。新模型具有全球知识,可生成高质量的名人自拍照和代码图像,但图像质量仍有提升空间。公司计划本周推出 GPT-5.2,旨在增强代码开发和企业用户应用。此外,OpenAI 内部出现产品派与研究派分歧,优先考虑短期增长而非长期技术探索。

来源:36氪

16:46

GPT-5.2提前泄露?今夜,OpenAI要拿Gemini 3祭天

GPT-5.2提前泄露?今夜,OpenAI要拿Gemini 3祭天

OpenAI发布GPT-5.2,专为编程和逻辑推理任务设计,以对抗谷歌Gemini 3。GPT-5.2在Cursor IDE中首次亮相,展示了其在长程任务执行与代码同步调整上的强大能力。据称,该模型在数学与学术推理、处理速度及能效方面均有显著提升。同时,OpenAI正开发代号为Shallotpeat的新模型,旨在进一步优化预训练过程,提高整体性能。

来源:36氪