DeepSeek 深度追踪
🏢 公司追踪
国内大模型
高频追踪
📅 更新时间:2026年5月11日 · 熏儿出品
公司概况
DeepSeek(深度求索)是中国领先的开源大模型研发公司,由量化私募基金经理梁文锋于2023年创立。公司以"AGI普惠化"为使命,致力于开发高质量、低成本的开源大模型,已成为全球开源AI领域的重要力量。
核心产品
DeepSeek V4 系列(2026年4月发布)
DeepSeek V4 是当前最先进的开源大模型系列,于2026年4月24日发布Preview版本,包含两个主要型号:
| 型号 | 总参数 | 活跃参数 | 定位 |
| DeepSeek-V4-Pro | 1.6万亿 | 490亿 | 旗舰版,最强性能 |
| DeepSeek-V4-Flash | 2840亿 | 130亿 | 轻量版,高效推理 |
核心特性
- 1M上下文长度:所有官方服务默认支持100万token上下文,可处理完整书籍或大型代码库
- Agent能力SOTA:开源模型中Agent编码基准测试达到最佳,与Claude Code、OpenClaw等AI Agent无缝集成
- 双模式推理:支持Thinking(深度思考)和Non-Thinking(快速响应)两种模式
- MoE架构创新:采用Token-wise压缩 + DeepSeek Sparse Attention (DSA)技术,大幅提升推理效率
- API兼容:完全兼容OpenAI ChatCompletions和Anthropic API格式
DeepSeek R2 系列(推理模型)
DeepSeek R2是基于V4的推理增强版本,专门针对复杂推理任务优化,在数学、STEM、编程领域超越所有现有开源模型,媲美顶级闭源模型。
技术演进时间线
2023年12月
DeepSeek V1 发布
首个开源大模型,参数规模7B-67B,开启开源之路
2024年3月
DeepSeek V2 发布
引入MoE架构,性能大幅提升,推理成本下降70%
2024年12月
DeepSeek V3 发布
总参数671B,活跃参数37B,开源模型性能标杆
2025年1月
DeepSeek R1 发布
开源推理模型,性能接近OpenAI o1,引发全球关注
2026年4月
DeepSeek V4 发布
1M上下文、Agent能力SOTA、双模式推理,开源新高度
商业模式
开源策略
DeepSeek采用"开源为主、商业为辅"的策略:
- 模型开源:所有模型权重完全开源,支持商业使用
- 技术透明:公布训练方法、数据配方和技术细节
- 社区驱动:积极参与开源社区,接受贡献和反馈
收入来源
- API服务:提供云上推理服务,按token计费
- 企业版:私有化部署、定制化服务、技术支持
- 咨询服务:帮助企业落地AI应用
竞争格局
| 维度 | DeepSeek | OpenAI | Anthropic | 阿里通义 |
| 开源策略 | 完全开源 | 闭源 | 闭源 | 部分开源 |
| 性能水平 | 顶级(开源) | 顶级 | 顶级 | 优秀 |
| 推理成本 | 最低 | 高 | 高 | 中等 |
| 上下文长度 | 100万(V4) | 128K | 200K | 32K |
| 企业服务 | 中等 | 成熟 | 成熟 | 成熟 |
追踪重点
🔍 重点关注
- 技术突破:每次大版本更新的架构创新和能力提升
- 开源生态:社区贡献、应用案例、第三方工具集成
- 商业化进展:API用户增长、企业客户突破、收入情况
- 人才动态:核心团队变化、关键技术人才引入
- 融资与估值:新一轮融资、估值变化、投资方背景
信息源
- 官方渠道:DeepSeek官网、GitHub仓库、官方博客
- 社交媒体:X (Twitter)、微信公众号
- 技术论文:arXiv、官方技术报告
- 媒体报道:36氪、机器之心、量子位
近期动态(2026年5月)
- ✅ V4 Preview版本发布,1M上下文、Agent能力SOTA
- ✅ API服务全面迁移至V4系列,旧版本将于7月停用
- 🔄 社区集成:Claude Code、Cursor、Continue等工具支持
- 🔄 企业版:私有化部署方案优化中
关键洞察
"DeepSeek证明了开源可以与闭源竞争。它的成功不仅是技术胜利,更是开源理念的商业验证。在AI领域,开源正在从追随者变为引领者。"
📌 本页面由熏儿出品 · 数据截至2026年5月11日
每月月初更新追踪信息
← 返回追踪体系