PhoenixM PhoenixM
首页
AI
云原生
中间件
标签
关于作者
GitHub (opens new window)

PhoenixM

首页
AI
云原生
中间件
标签
关于作者
GitHub (opens new window)
  • LLM 技术体系
    • 一、整体架构总览
    • 二、LLM(Large Language Model)
      • 本质
      • 关键特点
    • 三、Token(模型处理单位)
      • Token 与成本
    • 四、Context(上下文)
    • 五、Context Window(上下文窗口)
    • 六、Prompt(提示词)
      • System Prompt
      • User Prompt
    • 七、Tools(工具)
    • 八、MCP(Model Context Protocol)
    • 九、Agent(智能体)
    • 十、Agent Skill(能力模块)
    • 十一、完整 AI 系统架构
    • 十二、AI 系统类比(工程理解)
    • 十三、AI 系统核心公式
    • 十四、未来 AI 架构趋势
      • 1. Agent 化
      • 2. 工具生态
      • 3. 多 Agent 协作
  • AI
LiFengMing
2026-03-15
目录

LLM 技术体系

从LLM到Agent的完整AI技术栈解析,涵盖Token、Context、Prompt、Tools、MCP、Agent Skills等核心概念及其关系。

# 一、整体架构总览

AI 应用可以看成一套 从底层模型到上层智能体的技术栈:

Application(AI应用)
      ↑
Agent(智能体)
      ↑
Agent Skills(能力模块)
      ↑
Tools(工具)
      ↑
Prompt(提示词)
      ↑
Context(上下文)
      ↑
Token(文本单位)
      ↑
LLM(大语言模型)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

LLM负责理解语言,Prompt负责控制行为,Tool负责扩展能力,Agent负责完成任务。


# 二、LLM(Large Language Model)

LLM 是 AI 系统的 核心计算模型,代表模型例如 OpenAI 的 GPT 系列、Anthropic 的 Claude 系列。

# 本质

LLM 的本质是:预测下一个 Token 的概率。

数学形式:

P(next_token | previous_tokens)
1

例如:

  • 输入:The capital of France is
  • 模型预测:Paris

# 关键特点

  1. 无长期记忆
  2. 基于概率生成
  3. 依赖上下文输入

# 三、Token(模型处理单位)

Token 是 LLM 处理文本的 最小单位。

英文示例:

"Hello world" → ["Hello", " world"]
1

中文示例:

"你好世界" → ["你", "好", "世界"]
1

# Token 与成本

Token 直接决定:

  • 推理成本 — 越多 Token 计算量越大
  • 上下文容量 — Token 数限制了可输入的信息量
  • API 费用 — 按 Token 计费

经验值:1 Token ≈ 3~4 个英文字符


# 四、Context(上下文)

Context 是 模型在当前推理中看到的全部信息。

例如:

User: 我叫小明
User: 我是谁?
→ 模型回答:小明(因为 Context = [我叫小明, 我是谁?])
1
2
3

如果删除第一句,只输入 我是谁?,模型就无法回答。


# 五、Context Window(上下文窗口)

Context Window 指 模型一次最多能处理多少 Token。

模型 Context Window
GPT-3 4K
GPT-4 8K
GPT-4o 128K
Claude 3 200K

超过限制的旧内容会被丢弃,因此在 AI 系统中经常需要:

  • RAG(检索增强生成)
  • 对话裁剪
  • Memory 管理

# 六、Prompt(提示词)

Prompt 是 给 LLM 的输入指令文本,本质就是输入给模型的文本。

示例:

把下面中文翻译成英文:
你好
1
2

Prompt 决定了 AI 的任务方向、输出风格和推理方向。

# System Prompt

System Prompt 用于定义 AI 的角色和规则,可以理解为 AI 的系统配置。

You are a professional software architect.
Always answer in Chinese.
1
2

作用:定义 AI 角色、规定行为、限制输出范围。

# User Prompt

User Prompt 是 用户的实际输入。

完整输入结构:

System Prompt + User Prompt + Conversation History
1

# 七、Tools(工具)

LLM 本身无法直接执行现实操作(查询数据库、调用 API、访问互联网、写代码执行),因此需要 Tools 扩展能力。

常见工具:

  • Search Tool
  • Weather API
  • Database Query
  • Code Interpreter

调用流程:

User → LLM → Tool → Result → LLM 总结
1

示例:

用户:东京天气
  → LLM:调用 Weather API
  → API 返回数据
  → LLM:生成回答
1
2
3
4

# 八、MCP(Model Context Protocol)

MCP 是 AI 调用工具的 标准协议,由 Anthropic 提出,作用是统一 LLM 与工具之间的通信方式。

技术 作用
HTTP Web 通信
SQL 数据查询
MCP AI 调用工具

架构:

LLM → MCP Client → MCP Server → Tools
1

示例:

AI → MCP → GitHub
AI → MCP → Slack
AI → MCP → Database
1
2
3

# 九、Agent(智能体)

Agent 是 具备任务执行能力的 AI 系统。

普通 LLM 只是 输入 → 输出,而 Agent 具备完整的任务闭环:

理解任务 → 规划步骤 → 调用工具 → 执行任务 → 总结结果
1

常见循环模式:

Plan → Act → Observe → Reflect
1

示例 — 任务:帮我分析某股票

  1. 查询价格
  2. 查询财报
  3. 分析趋势
  4. 输出报告

# 十、Agent Skill(能力模块)

Agent Skill 是 Agent 的能力插件。

Agent
 ├─ Search Skill
 ├─ Coding Skill
 ├─ Database Skill
 └─ Browser Skill
1
2
3
4
5

Skill 本质:

Skill = Prompt + Tool + Workflow
1

# 十一、完整 AI 系统架构

AI Application
      ↓
Agent System
      ↓
Skill Layer
      ↓
Tool Layer
      ↓
MCP Protocol
      ↓
Prompt Layer
      ↓
Context Layer
      ↓
Token Layer
      ↓
LLM Model
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

# 十二、AI 系统类比(工程理解)

可以类比传统计算机架构:

AI 概念 类比 真实案例
LLM CPU Qwen、DeepSeek、GPT-4
Token 指令 Tokenizer、BPE、SentencePiece
Context 内存 Chat 历史、RAG 检索内容
Context Window 内存大小 8K / 32K / 128K / 200K tokens
Prompt 程序 Prompt Template、Prompt Engineering
Tool 外部设备 Search API、Weather API、Database
MCP 驱动 Model Context Protocol
Agent 操作系统 LangChain、AutoGPT
Skill 软件 Code Skill、Search Skill、Data Analysis Skill

LLM ≠ AI 应用,LLM 只是 AI 的计算核心。


# 十三、AI 系统核心公式

AI Application = LLM + Prompt + Context + Tool + Agent
1

# 十四、未来 AI 架构趋势

# 1. Agent 化

从单模型推理走向 Agent 系统,自主规划和执行任务。

# 2. 工具生态

Tool Ecosystem 标准化,MCP 等协议推动工具互通。

# 3. 多 Agent 协作

多个专业 Agent 组成 AI Team 协同工作:

  • Research Agent — 信息收集与分析
  • Coding Agent — 代码生成与调试
  • Data Agent — 数据处理与分析
  • Ops Agent — 运维与部署
编辑 (opens new window)
#LLM#Agent
上次更新: 2026/03/15, 23:38:54
最近更新
01
云原生资源
05-25
02
快速搭建Spring项目
03-27
03
kafka版本迭代说明
03-11
更多文章>
Theme by Vdoing | Copyright © 2018-2026 LiFengMing | MIT License
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式