AI新闻

已选标签:
AI训练
11月 27日
2 条新闻
16:07

月之暗面公开RL训练加速方法:训练速度暴涨97%,长尾延迟狂降93%

月之暗面公开RL训练加速方法:训练速度暴涨97%,长尾延迟狂降93%

月之暗面联合清华大学提出全新加速引擎Seer,显著提升LLM强化学习训练速度,在不改变核心算法前提下,实现Rollout效率提升74%~97%,长尾延迟减少75%~93%。Seer通过三大模块(推理引擎池、请求缓冲区、上下文管理器)和三项关键技术(分段生成、上下文感知调度、自适应分组推测解码),从内存、调度、推理三个维度优化rollout效率。实验验证表明,Seer在不同工作负载中均实现性能突破,吞吐量提升显著,且大幅降低长尾延迟。

来源:量子位

15:58

谷歌 Ironwood TPU 突袭,英伟达 GPU 迎来挑战者?

谷歌 Ironwood TPU 突袭,英伟达 GPU 迎来挑战者?

谷歌发布第七代TPU Ironwood,性能提升显著,与ARM架构AxionVM共同构建全方位AI基础设施体系,提供“AI超级计算机即服务”模式。此方案对大模型训练、推理及服务场景友好,大幅降低AI落地门槛和运维成本。英伟达强调其在通用性、兼容性和生态方面的优势,但市场格局正面临挑战。未来AI芯片市场将呈现多样化共存态势,投资逻辑转向全栈服务能力。

来源:36氪

11月 25日
5 条新闻
20:36

AI芯片开启第二战场

AI芯片开启第二战场

谷歌TPU芯片成为AI硬件焦点,与博通合作开发TPU v7p预计2026年推出。Meta计划租用并部署谷歌TPU,交易规模或达数十亿美元。谷歌TPU在大规模、低功耗推理上展现优势,支持Gemini 3等模型训练。市场对ASIC芯片兴趣重燃,预计2026-2027年各大CSP的ASIC数量将迎来爆发式增长。

来源:36氪

19:34

马斯克开始用Grok替代员工了,最惨部门裁员90%

马斯克开始用Grok替代员工了,最惨部门裁员90%

马斯克正在推动用AI替代人力的战略,通过Grok模型取代X公司中负责安全和内容管理的工程团队。他计划让X的算法完全AI化,并由Grok接管推荐系统及用户兴趣匹配。此外,他还启动了Macrohard项目,旨在利用AI自动化软件开发过程,涵盖代码编写、游戏设计等领域。然而,这种激进策略可能引发平台安全性和核心业务稳定性方面的风险。

来源:36氪

16:28

新加坡国家AI计划放弃Meta模型,转向阿里千问

新加坡国家人工智能计划(AISG)正在进行一次重大战略调整,在其最新的东南亚语言大模型项目中,放弃了Meta模型,转向阿里巴巴的通义千问Qwen开源架构,标志着中国开源AI模型在全球影响力版图中的一次关键扩张。据悉,AISG于11月25日宣布推出的“Qwen-SEA-LION-v4”模型,在一项衡量东南亚语言能力的开源榜单上迅速占据首位。这一转变旨在解决一个长期痛点:此前以Meta的Llama系列为代表的开源模型,在处理印尼语、泰语和马来语等区域性语言时表现不佳,严重制约了本地化AI应用的开发效率与性能。 (上证报)

来源:钛媒体

11月 24日
2 条新闻
17:44

美国AI算力新基建是“泡沫”吗?

美国AI算力新基建是“泡沫”吗?

美国正进行大规模算力投资,以支持通用人工智能的发展,预计吸引超2.5万亿美元投资。尽管存在泡沫风险,但大模型企业如OpenAI和Anthropic的高速增长收入及各行业对AI应用的需求,为这一投资提供了合理性。同时,AI技术推动了云计算行业的显著增长,增加了对芯片和数据中心的需求。然而,需关注潜在的技术迭代减缓、产业链循环投资等风险。

来源:36氪

16:43

青年科学家数量创新高!35位新一期“新基石研究员”获资助

青年科学家数量创新高!35位新一期“新基石研究员”获资助

新基石研究员项目第三期资助35位科学家,其中青年科学家占比超过四分之一,平均年龄45岁。该项目聚焦原始创新与自由探索,支持数学与物质科学、生物与医学科学两大领域,鼓励跨学科研究。通过长期稳定资金支持,促进AI相关基础技术如深度学习、机器学习及多模态模型的发展,并推动其在医疗诊断等领域的应用。

来源:量子位