知识库 · 模型追踪
AI发展史与能力矩阵
从1956年达特茅斯会议到2026年的今天,AI经历了三次寒冬、三次浪潮。当前处于以大语言模型为核心的第三波AI浪潮的高峰期。本文用时间轴和能力矩阵两个维度,帮你建立对AI全貌的系统认知。
📅 AI发展关键里程碑
1956
AI概念诞生
达特茅斯会议,John McCarthy 提出"Artificial Intelligence"一词
1986
反向传播算法
Hinton 等人提出反向传播,奠定深度学习理论基础
2012
AlexNet 横空出世
深度学习在 ImageNet 大幅超越传统方法,第三波AI浪潮开始
2017
Transformer架构
Google 发表《Attention Is All You Need》,现代 LLM 的基础架构诞生
2020
GPT-3 涌现能力
1750亿参数,首次展示"涌现能力",LLM 时代开启
2022.11
ChatGPT 发布
5天用户破百万,AI 正式进入大众视野,引发全球 AI 竞赛
2024
推理模型 + Agent 元年
o1/o3 推理模型、Claude Code、Devin——AI 从工具走向自主 Agent
2025
GPT-5 / Gemini 3
旗舰模型能力全面跃升,AGI讨论升温,AI基础设施化加速
🗺️ 2026年AI能力矩阵
| 能力维度 | 当前水平 | 代表模型 | 距人类水平 |
|---|---|---|---|
| 文本理解与生成 | 接近/超越人类 | GPT-5, Claude 3.5 | 部分任务已超越 |
| 代码生成与调试 | 高级专业水平 | Claude Code, GPT-5 | SWE-bench 55% |
| 数学推理 | 高中~竞赛水平 | o3, DeepSeek R1 | IMO部分题目 |
| 图像理解 | 接近人类 | GPT-4o, Gemini 3 | 医疗影像接近专家 |
| 视频理解 | 中等水平 | Gemini 3 Ultra | 长视频仍有不足 |
| 科学发现 | 辅助研究阶段 | AlphaFold, 专业模型 | 独立发现有限 |
| 长期规划 | 有限能力 | Agent系统 | 超过10步规划不稳定 |
| 常识推理 | 中等水平 | GPT-5 | 仍有明显盲区 |
| 情感理解 | 表面理解 | Claude 3 Opus | 无真实情感 |
| 自主学习 | 基础能力 | 研究阶段 | 持续在线学习未商用 |
评级:🔴 基础 | 🟡 中等 | 🟢 高级 | 🔵 接近/超越人类
🔭 当前AI前沿方向
- Test-time Compute:增加推理时间而非训练参数来提升能力,o3/R1 已验证有效
- World Models:让 AI 理解物理世界规律,Sora/OpenAI 在持续探索
- Continual Learning:让模型持续从新数据中学习,而不只是固定知识截止日期
- Multimodal Agents:能看屏幕、控制电脑、执行复杂任务的多模态 Agent
- Scientific AI:AI 加速科学研究,AlphaFold 之后的下一个突破在哪里