概念 – 林恩笔记

概念

AI发展日新月异，新概念时不时冒出来。

训练相关

Architecture Design（架构设计）
↓
Pretraining（预训练）
↓
Fine-tuning（微调）、Quantization（量化）
↓
Alignment（对齐）
↓
Distillation（蒸馏）

Pretraining（预训练）

预训练在海量通用语料上训练模型参数，让模型学会语言结构与通用知识。这是 LLM 能力的来源阶段，计算量最大、成本最高。

Fine-tuning（微调）

在特定数据集上继续训练，使模型适配某个领域或任务。属于“模型再训练”，但规模远小于预训练。

常见类型：

SFT（监督微调）：人工标注问答数据继续训练
指令微调（Instruction Tuning）：让模型更好理解指令
领域微调：金融 / 医疗 / 法律等垂直领域

Low-Rank Adaptation（LoRA 微调）

LoRA 是一种参数高效微调（PEFT）方法。

特点：

不修改原模型权重
只新增低秩矩阵
训练参数量极小
显存占用低

适用于：

私有模型定制
低成本领域适配
多任务切换（可加载不同 LoRA）

Quantization（量化）

将模型参数从 FP16/FP32 压缩为 INT8/INT4 等。

目标：

减少显存
提高推理速度
属于推理优化手段，不是训练。

Alignment（对齐）

通过 SFT监督微调、RLHF人类反馈的强化学习等方式让模型行为符合人类价值和使用习惯。

MoE（Mixture of Experts 多专家架构）

每次只激活部分参数。
专家分工（代码专家 / 数学专家）。
目的：提升模型容量，提升多任务能力，同时控制计算成本。

Actor–Critic（演员–评论家范式）

把模型拆成两个角色训练：

Actor（演员，生成模型）：负责生成答案
Critic（评论家，奖励模型/评估模型）：负责评价答案质量

用 Critic 的评分来优化 Actor

在 LLM 中的作用：

提升推理能力
强化逻辑一致性
解决长链推理误差积累

Distillation（蒸馏）

用大模型训练小模型。

目标：

降低模型体积
提高推理速度
降低部署成本

推理相关

Inference（推理）
↓
Prompt / CoT / ReAct（思考方式）
↓
Function Call（行动决策输出格式）
↓
Tools（可执行能力）
↓
Skill（能力封装）
↓
Agent（自主决策系统）
↓
Workflow / DAG（工程调度层）
↓
Context / Memory / RAG（记忆）
↓
MCP / OpenAPI / OpenSpec（能力标准化）

【2026.03更新】LLM 是大脑，Prompt 决定思考方式，Function Call 选择行动，Tools 执行操作，Skill 封装能力，Agent 形成闭环决策，Memory 和 RAG 提供知识增强，Workflow 负责工程调度，MCP 统一能力标准。

Inference（推理）

LLM 大语言模型是核心智能引擎，本质是基于上下文进行 token 概率预测的生成模型，负责理解、推理和生成文本，但不具备直接执行现实操作的能力。

Prompt / CoT / ReAct（推理方式）

Prompt 是对模型的输入控制；Chain of Thought（链式思考）通过显式推理步骤提升复杂任务表现；ReAct 则把“思考 + 行动”结合，是 Agent 多步决策的基础模式。

Function Call / Tools（外部能力调用）

Function Call 是模型输出结构化调用意图（通常为 JSON）的机制；Tools 是实际可执行的外部能力（API、数据库、代码执行等）。模型负责决策，系统负责执行。

Skills（能力封装）

Skill 是对 Tool 与 Prompt 的组合封装，相当于高阶能力模块，使 Agent 调用更稳定、更可复用。

Agent（智能体）

Agent 是具备目标、规划、决策、执行和反馈循环的系统。其核心是 LLM 推理 + 工具调用 + 状态管理，实现多步任务处理。多 Agent 协作需要角色分工，Planner、Executor、Reviewer。

Workflow / DAG（工程编排）

Workflow 是固定流程调度；DAG 是有向无环图结构，支持复杂依赖与并行执行。它们属于工程控制层，而非模型智能层。

Context / Memory（记忆系统）

Context 是当前对话上下文（短期记忆）；Memory 是外部持久存储（长期记忆），用于跨会话状态保存与个性化。

RAG / Embedding / 向量数据库（知识增强）

Embedding 将文本转为向量；向量数据库存储并检索相似语义；RAG（检索增强生成）在生成前先检索相关知识，减少幻觉并接入私有数据。

MCP / OpenAPI / OpenSpec（能力标准化）

MCP 是模型上下文协议，用于统一能力接入；OpenAPI 是接口描述规范；OpenSpec 用于描述 AI 能力与工具结构，实现跨系统复用。

最后更新于 March 4, 2026

大模型发展与原理