DeepSeek 深度追踪

🏢 公司追踪国内大模型高频追踪

📅 更新时间：2026年5月11日 · 熏儿出品

公司概况

DeepSeek（深度求索）是中国领先的开源大模型研发公司，由量化私募基金经理梁文锋于2023年创立。公司以"AGI普惠化"为使命，致力于开发高质量、低成本的开源大模型，已成为全球开源AI领域的重要力量。

📊 核心数据

2023

创立年份

500+

团队规模

$20亿+

估值

1.6万亿

V4参数

核心产品

DeepSeek V4 系列（2026年4月发布）

DeepSeek V4 是当前最先进的开源大模型系列，于2026年4月24日发布Preview版本，包含两个主要型号：

型号	总参数	活跃参数	定位
DeepSeek-V4-Pro	1.6万亿	490亿	旗舰版，最强性能
DeepSeek-V4-Flash	2840亿	130亿	轻量版，高效推理

核心特性

1M上下文长度：所有官方服务默认支持100万token上下文，可处理完整书籍或大型代码库
Agent能力SOTA：开源模型中Agent编码基准测试达到最佳，与Claude Code、OpenClaw等AI Agent无缝集成
双模式推理：支持Thinking（深度思考）和Non-Thinking（快速响应）两种模式
MoE架构创新：采用Token-wise压缩 + DeepSeek Sparse Attention (DSA)技术，大幅提升推理效率
API兼容：完全兼容OpenAI ChatCompletions和Anthropic API格式

DeepSeek R2 系列（推理模型）

DeepSeek R2是基于V4的推理增强版本，专门针对复杂推理任务优化，在数学、STEM、编程领域超越所有现有开源模型，媲美顶级闭源模型。

技术演进时间线

2023年12月

DeepSeek V1 发布

首个开源大模型，参数规模7B-67B，开启开源之路

2024年3月

DeepSeek V2 发布

引入MoE架构，性能大幅提升，推理成本下降70%

2024年12月

DeepSeek V3 发布

总参数671B，活跃参数37B，开源模型性能标杆

2025年1月

DeepSeek R1 发布

开源推理模型，性能接近OpenAI o1，引发全球关注

2026年4月

DeepSeek V4 发布

1M上下文、Agent能力SOTA、双模式推理，开源新高度

商业模式

开源策略

DeepSeek采用"开源为主、商业为辅"的策略：

模型开源：所有模型权重完全开源，支持商业使用
技术透明：公布训练方法、数据配方和技术细节
社区驱动：积极参与开源社区，接受贡献和反馈

收入来源

API服务：提供云上推理服务，按token计费
企业版：私有化部署、定制化服务、技术支持
咨询服务：帮助企业落地AI应用

竞争格局

维度	DeepSeek	OpenAI	Anthropic	阿里通义
开源策略	完全开源	闭源	闭源	部分开源
性能水平	顶级（开源）	顶级	顶级	优秀
推理成本	最低	高	高	中等
上下文长度	100万（V4）	128K	200K	32K
企业服务	中等	成熟	成熟	成熟

追踪重点

🔍 重点关注

技术突破：每次大版本更新的架构创新和能力提升
开源生态：社区贡献、应用案例、第三方工具集成
商业化进展：API用户增长、企业客户突破、收入情况
人才动态：核心团队变化、关键技术人才引入
融资与估值：新一轮融资、估值变化、投资方背景

信息源

官方渠道：DeepSeek官网、GitHub仓库、官方博客
社交媒体：X (Twitter)、微信公众号
技术论文：arXiv、官方技术报告
媒体报道：36氪、机器之心、量子位

近期动态（2026年5月）

✅ V4 Preview版本发布，1M上下文、Agent能力SOTA
✅ API服务全面迁移至V4系列，旧版本将于7月停用
🔄 社区集成：Claude Code、Cursor、Continue等工具支持
🔄 企业版：私有化部署方案优化中

关键洞察

"DeepSeek证明了开源可以与闭源竞争。它的成功不仅是技术胜利，更是开源理念的商业验证。在AI领域，开源正在从追随者变为引领者。"

📌 本页面由熏儿出品 · 数据截至2026年5月11日
每月月初更新追踪信息

← 返回追踪体系