DeepSeek-V3.2系列开源,性能直接对标Gemini-3.0-Pro

1个月前更新 jovi
8 0 0

DeepSeek-V3.2系列开源,性能直接对标Gemini-3.0-Pro

DeepSeek发布V3.2系列开源模型,性能对标Gemini-3.0-Pro。DeepSeek-V3.2适用于日常问答与工具调用,推理能力达GPT-5水平;DeepSeek-V3.2-Speciale专注复杂推理任务,在数学证明、编程竞赛等表现卓越。引入DSA稀疏注意力机制大幅降低计算成本,强化学习训练预算超预训练10%,显著提升模型在长序列处理及Agent任务上的效率与泛化能力。

来源:量子位

© 版权声明
广告也精彩

相关文章

没有相关内容!