以下是 DeepSeek 已发表的主要论文及其对应的论文地址(截至2025年2月9日):
---
### **一、核心语言模型与架构创新**
1. **《DeepSeek LLM: Scaling Open-Source Language Models with Longtermism》**
- **发布时间**:2024年1月5日
- **主要内容**:提出基于长期主义的开源语言模型扩展策略,优化分组查询注意力(GQA)与多步学习率调度器,性能超越 LLaMA-2 70B。
- **论文地址**:[arXiv:2401.02954](https://arxiv.org/abs/2401.02954)
2. **《DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models》**
- **发布时间**:2024年1月11日
- **主要内容**:提出细粒度专家分割与共享专家隔离策略,提升混合专家模型(MoE)的专业化水平,降低计算成本。
- **论文地址**:[arXiv:2401.06066](https://arxiv.org/abs/2401.06066)
3. **《DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model》**
- **发布时间**:2024年5月
- **主要内容**:结合多头潜在注意力(MLA)与改进的 MoE 架构,显著优化推理效率与训练成本。
- **论文地址**:[arXiv:2405.04434](https://arxiv.org/abs/2405.04434)
4. **《DeepSeek-V3 Technical Report》**
- **发布时间**:2024年12月27日
- **主要内容**:总参数量达671B,支持多令牌预测(MTP)与FP8混合精度训练,显著降低训练成本至557.6万美元。
- **论文地址**:[arXiv:2412.19437](https://arxiv.org/abs/2412.19437)
---
### **二、推理与强化学习突破**
5. **《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》**
- **发布时间**:2025年1月
- **主要内容**:通过纯强化学习(RL)提升模型推理能力,无需监督微调,并在数学与编程任务中达到与 OpenAI o1 相当的水平。
- **论文地址**:[arXiv:2501.12948](https://arxiv.org/abs/2501.12948)
6. **《Distilling Reasoning Capabilities from DeepSeek-R1 to Smaller Models》**
- **发布时间**:2025年1月
- **主要内容**:将 DeepSeek-R1 的推理能力蒸馏至 Qwen 和 Llama 系列小模型,显著提升其性能。
- **论文地址**:[GitHub](https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf)
---
### **三、多领域与多模态扩展**
7. **《深度求索代码模型V2:打破代码智能领域中闭源模型的壁垒》**
- **发布时间**:2024年6月17日
- **主要内容**:对标 GitHub Copilot,开源代码模型在生成与理解任务中表现优异。
- **论文地址**:未提供公开链接,需通过 CSDN 下载合集
8. **《深度求索视觉语言模型:迈向真实世界的视觉-语言理解》**
- **发布时间**:2024年3月11日
- **主要内容**:探索视觉-语言联合建模,支持机器人、AR/VR等真实场景应用。
- **论文地址**:未提供公开链接,需通过 CSDN 下载合集
---
### **四、其他关键技术报告**
9. **《深度求索证明器V1.5:利用证明助手反馈进行强化学习和蒙特卡洛树搜索》**
- **发布时间**:2024年8月15日
- **主要内容**:结合形式化验证与强化学习,优化数学与逻辑推理能力。
- **论文地址**:未提供公开链接,需通过 CSDN 下载合集
---
### **论文合集下载**
- **CSDN 下载链接**:[DeepSeek论文合集](https://download.csdn.net/download/admans/90345790)
---
### **补充说明**
- 部分论文(如代码模型V2、视觉语言模型)未直接提供公开链接,建议通过 CSDN 合集或 GitHub 仓库获取完整技术文档。
- 最新论文动态可关注 DeepSeek 官方 GitHub 页面:[DeepSeek-ai](https://github.com/deepseek-ai) 。