AI新闻

已选标签:
AI训练
AI绘画
12月 11日
6 条新闻
16:46

OpenAI 盲测新模型不如 Nano Banana Pro?曝 Altman 要暂停 Sora,死磕 ChatGPT

OpenAI 盲测新模型不如 Nano Banana Pro?曝 Altman 要暂停 Sora,死磕 ChatGPT

OpenAI 正在内部测试 GPT-5.2,并在 Design Arena 与 LM Arena 平台上盲测新的图像生成模型 Chestnut 和 Hazelnut。新模型具有全球知识,可生成高质量的名人自拍照和代码图像,但图像质量仍有提升空间。公司计划本周推出 GPT-5.2,旨在增强代码开发和企业用户应用。此外,OpenAI 内部出现产品派与研究派分歧,优先考虑短期增长而非长期技术探索。

来源:36氪

15:16

MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这

MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这

MEET2026智能未来大会汇聚了近1500名线下观众和350万+线上观众,聚焦AI的最新进展与趋势。专家们讨论了生成式AI向智能体演化的趋势、多模态模型的重要性以及AI在终端侧的应用挑战。百度、高通等企业展示了其在超级智能体、端侧大模型部署等方面的创新成果。同时,大会还探讨了AI在企业级应用中的规模化、成本效率和精度要求,强调了开源开放对于推动AI技术进步的关键作用。

来源:量子位

13:40

美国AI春晚,一盆凉水浇在Agent身上

美国AI春晚,一盆凉水浇在Agent身上

2025年,AI Agent成为NeurIPS与re:Invent大会焦点,标志着其在AI领域的崛起。亚马逊云科技等企业发布多项围绕Agent的技术更新,强调其在提高开发效率方面的潜力。然而,开发者们也指出当前Agent面临成本高、软件生态不匹配等挑战。未来,优化AI基础设施以降低推理成本及改善数据管理将成为关键发展方向。

来源:36氪

11:36

OpenAI神秘生图AI爆出,实测不敌谷歌一根香蕉,网友:就这?

OpenAI神秘生图AI爆出,实测不敌谷歌一根香蕉,网友:就这?

OpenAI即将发布GPT-5.2及图像生成模型GPT Image 2(代号栗子/榛子),与谷歌Nano Banana Pro展开竞争。尽管在物理色彩理论等复杂场景下表现不佳,但部分测试显示其生成代码和信息图的能力有所提升。谷歌新推出的Flash版「香蕉」则以将游戏画面转化为真实感图片、单句编辑图片等功能见长。双方在多模态处理能力上的较量预示着AI技术正向着更广泛的应用场景迈进。

来源:36氪

09:10

谷歌应对AI竞赛的策略——提拔其数据中心技术背后的功臣

谷歌应对AI竞赛的策略——提拔其数据中心技术背后的功臣

Google 提升 Amin Vahdat 为 AI 基础设施首席技术官,彰显其在 AI 竞争中的重要性。Vahdat 在大规模计算效率方面有深厚背景,负责 Google 的 TPU、Jupiter 网络和 Borg 系统等关键基础设施,推动 AI 训练和推理的算力效率显著提升。此举不仅加强了 Google 在 AI 领域的技术实力,也有助于人才保留。

来源:TechCrunch AI

12月 10日
8 条新闻
22:00

Figma推出基于AI的对象移除与图片扩展新功能

Figma推出基于AI的对象移除与图片扩展新功能

Figma 推出了基于AI的图像编辑新功能,包括对象移除、隔离和图像扩展等,旨在简化设计流程并减少对第三方工具的依赖。这些功能利用了先进的计算机视觉技术,使用户能够更直观地调整图像元素如光照、阴影、颜色等。同时,Figma 将所有图像编辑工具整合到一个工具栏中,提高了易用性。此举标志着Figma在与Adobe和Canva等竞争对手的竞争中迎头赶上,并展示了AI在提升用户体验方面的潜力。

来源:TechCrunch AI

17:07

不融资、不烧钱、不扩团队,华裔 CEO 创办的AI独角兽打入谷歌、Anthropic核心供应链,如今营收近百亿

不融资、不烧钱、不扩团队,华裔 CEO 创办的AI独角兽打入谷歌、Anthropic核心供应链,如今营收近百亿

Surge AI 作为一家专注于高质量数据标注的公司,在没有外部投资的情况下实现了年营收超 10 亿美元的成绩。其创始人 Edwin Chen 认为,高质量的数据是训练出高性能 AI 模型的关键。Surge AI 通过构建精英标注员网络和先进的人机协同系统来保证数据质量,赢得了包括 OpenAI、谷歌等在内的顶尖客户。这表明,在当前模型能力快速提升的同时,高质量的训练数据成为了决定 AI 应用效果的重要因素。

来源:36氪

15:04

2比特复数模型媲美全精度,北大通用框架让大模型在手机上也能流畅运行

2比特复数模型媲美全精度,北大通用框架让大模型在手机上也能流畅运行

北京大学团队提出Fairy2i框架,通过广义线性表示、相位感知量化及递归残差量化技术,在无需重新训练的情况下实现预训练模型的2比特量化,性能接近FP16。该方法解决了大模型在边缘设备部署时面临的算力和存储挑战,为AI在移动设备上的高效运行提供了新路径。

来源:36氪

13:01

微软承诺在加拿大和印度投入超300亿美元,用于建设“主权AI”

微软承诺在加拿大和印度投入超300亿美元,用于建设“主权AI”

微软宣布投资超过300亿美元于加拿大和印度,强化本地云基础设施建设与Azure AI服务集成。此举旨在响应各国对数据本地化及AI系统自主控制的需求,通过引入Azure Local、SAIL等技术保障数据主权,并在印度政府福利门户中嵌入AI以提升就业匹配效率。此外,微软加大了技能培训力度,目标是让民众主动参与技术未来构建。

来源:36氪

09:55

年营收 10 亿美元的 Surge AI CEO:比算力更重要的,是 AI 的品味

Surge AI 通过自建训练系统和精细的数据标注方法,专注于提升AI模型的判断力与决策质量,而非单纯追求算力或融资规模。其独特的数据处理方式,包括对标注者行为信号的追踪、机器学习反向分析以及提供评估标准等,使得该公司能够为行业顶尖实验室提供高质量服务,并在未接受外部投资的情况下实现显著商业成功。

来源:36氪

08:53

非传统AI公司确认其4.75亿美元种子轮融资

非传统AI公司确认其4.75亿美元种子轮融资

Naveen Rao 创立的 Unconventional AI 获得 4.75 亿美元种子轮融资,估值达 45 亿美元。公司目标是构建高效能AI计算机,追求生物级效率。此轮融资由 Andreessen Horowitz 和 Lightspeed Ventures 领投,标志着对下一代算力效率和技术创新的重大投资。Rao 的过往经历包括成功创立并出售 MosaicML 和 Nervana Systems,显示出其在推动AI技术进步方面的深厚背景。

来源:TechCrunch AI

05:13

B Capital创始合伙人Kabir Narang离职创办新投资平台

B Capital创始合伙人Kabir Narang离职创办新投资平台

Kabir Narang离开B Capital,计划于2026年推出专注于技术、AI和全球资本流动交叉点的新投资平台。他强调AI在加速从想法到产出的过程中扮演的关键角色,并看好能够结合速度与定价权及改善单位经济效益的创始人。Narang还透露将个人持有1-2%的股份于他认为能‘智能增长’的企业中,表明其对早期AI及相关技术领域投资的兴趣持续高涨。

来源:TechCrunch AI

00:09

印度提议对使用版权内容训练AI的OpenAI和谷歌收费

印度提议对使用版权内容训练AI的OpenAI和谷歌收费

印度提议对使用版权内容训练AI模型的公司实施强制性版税制度,旨在降低AI公司的合规成本并确保创作者得到补偿。该提案通过设立单一收集机构自动授权AI企业访问所有版权作品,以换取强制支付版税。此举措可能重塑OpenAI和谷歌等公司在全球快速增长市场中的运营方式,并为AI训练提供了一个新的监管框架。

来源:TechCrunch AI

12月 9日
3 条新闻
22:39

OpenAI推出首期OpenAI认证课程

OpenAI宣布推出首期OpenAI认证课程,旨在提供实用的人工智能技能:“人工智能基础课程”将通过与一批企业和公共服务合作伙伴的试点项目在ChatGPT平台推出;“教师版ChatGPT基础课程”则已在Coursera平台上线。(广角观察)

来源:钛媒体

16:26

智元宣布开源高性能视频数据加载库VideoDataset

智元机器人宣布开源VideoDataset。据介绍,VideoDataset是智元机器人团队基于实际AI训练需求深度开发的高性能视频数据加载库,其基于NVIDIA Video Codec SDK进行封装,通过多解码器(Decoder)调度和生产者—消费者模型等多种手段实现了解码与训练的完全异步流水线,使解码器利用率达到90%以上。(广角观察)

来源:钛媒体

12:16

被OpenAI开除的天才少年:联手谷歌,围剿英伟达

被OpenAI开除的天才少年:联手谷歌,围剿英伟达

谷歌正通过扶持云服务商Fluidstack分发自研TPU芯片,以打破英伟达在AI算力市场的垄断。此举不仅反映了谷歌在提升算力效率和成本控制上的努力,也揭示了AI领域内资本与技术之间的激烈竞争。前OpenAI研究员阿申布伦纳创立的基金有意领投Fluidstack的新一轮融资,进一步加剧了这场围绕AI基础设施建设的博弈。

来源:36氪

12月 8日
3 条新闻
19:40

又一国产图像大模型开源,实测连续P图绝了,中文渲染是短板

又一国产图像大模型开源,实测连续P图绝了,中文渲染是短板

美团发布并开源图像生成模型LongCat-Image,该6B参数模型在文生图与单图编辑场景中表现出色,特别是在‘编辑可控性’和‘中文文字渲染’方面达到开源SOTA水平。尽管在复杂排版及游戏界面设计上存在不足,但其通过多任务联合学习机制、渐进式训练策略等技术手段显著提升了图像编辑的稳定性和真实感。

来源:36氪

15:28

英伟达自毁CUDA门槛,15行Python写GPU内核,性能匹敌200行C++

英伟达自毁CUDA门槛,15行Python写GPU内核,性能匹敌200行C++

英伟达发布CUDA 13.1,引入CUDA Tile编程模型,允许开发者用Python编写高性能GPU内核,极大简化了AI算法的开发流程。新模型提高了跨代兼容性,降低了AI编程门槛,但可能削弱了CUDA对特定硬件的绑定优势。此外,CUDA Tile还带来了一系列针对Blackwell架构的性能优化,如cuBLAS、cuSOLVER等库的加速。

来源:36氪