知识库 · 模型追踪
AI发展史与能力矩阵
📚 全景视图 持续更新
从1956年达特茅斯会议到2026年的今天,AI经历了三次寒冬、三次浪潮。当前处于以大语言模型为核心的第三波AI浪潮的高峰期。本文用时间轴和能力矩阵两个维度,帮你建立对AI全貌的系统认知。
📅 AI发展关键里程碑
1956
AI概念诞生
达特茅斯会议,John McCarthy 提出"Artificial Intelligence"一词
1986
反向传播算法
Hinton 等人提出反向传播,奠定深度学习理论基础
2012
AlexNet 横空出世
深度学习在 ImageNet 大幅超越传统方法,第三波AI浪潮开始
2017
Transformer架构
Google 发表《Attention Is All You Need》,现代 LLM 的基础架构诞生
2020
GPT-3 涌现能力
1750亿参数,首次展示"涌现能力",LLM 时代开启
2022.11
ChatGPT 发布
5天用户破百万,AI 正式进入大众视野,引发全球 AI 竞赛
2024
推理模型 + Agent 元年
o1/o3 推理模型、Claude Code、Devin——AI 从工具走向自主 Agent
2025
GPT-5 / Gemini 3
旗舰模型能力全面跃升,AGI讨论升温,AI基础设施化加速
🗺️ 2026年AI能力矩阵
能力维度当前水平代表模型距人类水平
文本理解与生成接近/超越人类GPT-5, Claude 3.5部分任务已超越
代码生成与调试高级专业水平Claude Code, GPT-5SWE-bench 55%
数学推理高中~竞赛水平o3, DeepSeek R1IMO部分题目
图像理解接近人类GPT-4o, Gemini 3医疗影像接近专家
视频理解中等水平Gemini 3 Ultra长视频仍有不足
科学发现辅助研究阶段AlphaFold, 专业模型独立发现有限
长期规划有限能力Agent系统超过10步规划不稳定
常识推理中等水平GPT-5仍有明显盲区
情感理解表面理解Claude 3 Opus无真实情感
自主学习基础能力研究阶段持续在线学习未商用

评级:🔴 基础 | 🟡 中等 | 🟢 高级 | 🔵 接近/超越人类

🔭 当前AI前沿方向
  • Test-time Compute:增加推理时间而非训练参数来提升能力,o3/R1 已验证有效
  • World Models:让 AI 理解物理世界规律,Sora/OpenAI 在持续探索
  • Continual Learning:让模型持续从新数据中学习,而不只是固定知识截止日期
  • Multimodal Agents:能看屏幕、控制电脑、执行复杂任务的多模态 Agent
  • Scientific AI:AI 加速科学研究,AlphaFold 之后的下一个突破在哪里