08:55
DeepSeekV3.2技术报告还是老外看得细

DeepSeek发布了两款开源模型V3.2和V3.2-Speciale,在智能体评测中达到了当前开源模型的最高水平,接近甚至超越了顶尖闭源模型如GPT-5和Gemini-3.0-Pro。通过DSA稀疏注意力机制解决了长上下文效率问题,并利用可扩展强化学习提升模型推理能力。此外,DeepSeek-V3.2系列在成本上具有显著优势,比GPT-5便宜近24倍,挑战了现有商业模型的定价策略。















