196 个术语 · 15 个类别

完整词汇表

所有AI术语（英文标准用法）附简单定义。

基础概念

10 个术语

Artificial Intelligence (AI)

让机器完成通常需要人类智能才能完成的任务的学科领域。

用于： ch.01, ch.08, ch.10, ch.11, ch.13, ch.19

Machine Learning (ML)

AI的一个子领域，系统从数据中学习，而非依赖显式编程规则。

Deep Learning

基于多层神经网络的机器学习方法。

Narrow AI

专注于单一特定任务的AI，例如下棋。

AGI (Artificial General Intelligence)

假想中能完成任何人类智力任务的通用AI。

用于： ch.16

Superintelligence

在所有领域都远超人类智能的假想AI。

Symbolic AI

基于规则和形式逻辑的传统AI方法。

Model

从数据中学习得到的数学表示。

用于： ch.08, ch.11, ch.13

Inference

已训练模型进行预测的阶段。

Training

模型从数据中学习参数的阶段。

学习类型

10 个术语

Supervised Learning

使用带标签数据（输入→已知输出）进行学习。

用于： ch.08, ch.14

Unsupervised Learning

无需标签的学习方式，模型自行发现数据中的隐藏结构。

Self-supervised Learning

模型从数据本身自动生成监督信号进行学习。

用于： ch.06

Reinforcement Learning

通过试错并获得奖励信号来学习的方式。

用于： ch.08

Transfer Learning

将在一个任务上训练好的模型迁移到相似的新任务中。

Few-shot Learning

仅凭极少数样本进行学习的能力。

Zero-shot Learning

无需任何训练样本即可完成任务的能力。

Meta-learning

训练模型快速适应新任务的方法，即让模型学会如何学习。

Federated Learning

在不集中数据的前提下进行分布式训练。

Continual Learning

模型在学习新任务的同时不遗忘旧任务的能力。

神经网络

16 个术语

Neuron / Unit

网络中受生物神经元启发的基本计算单元。

Layer

并行处理的一组神经元。

Weights

决定神经元间连接强度的可学习参数。

Bias

加在加权求和结果上的常数项。

Activation Function

应用于神经元输出的非线性函数。

ReLU

最常用的激活函数之一：max(0, x)。

Softmax

将向量转换为概率分布的函数。

用于： ch.01, ch.04, ch.05, ch.07

Forward Pass

从输入到输出的正向计算过程。

Backpropagation

计算梯度以更新权重的算法。

用于： ch.06

Gradient Descent

通过调整权重来最小化误差的优化算法。

用于： ch.01, ch.03, ch.04, ch.05, ch.06, ch.08, ch.14, ch.21

Loss Function

衡量预测值与真实值之间差距的函数。

用于： ch.01, ch.06, ch.08

Cross-Entropy Loss

分类任务中常用的标准损失函数。

用于： ch.06, ch.13

Optimizer

驱动权重更新的算法，如Adam、SGD等。

Learning Rate

梯度下降时每步更新的步长大小。

用于： ch.06

Epoch

对整个训练集完整遍历一次。

Batch

每次一起处理的一组数据样本。

用于： ch.06, ch.18

架构

18 个术语

Feedforward Network

信息单向流动的神经网络。

用于： ch.04, ch.05

MLP (Multi-Layer Perceptron)

具有全连接层的经典前馈神经网络。

用于： ch.05, ch.15

CNN (Convolutional Neural Network)

专为图像设计的神经网络，使用卷积滤波器。

RNN (Recurrent Neural Network)

通过内部状态处理序列数据的神经网络。

用于： ch.04

LSTM

改进版RNN，能记忆更长时间范围内的信息。

用于： ch.04

Transformer

基于注意力机制的架构，自2017年起主导AI领域。

用于： ch.01, ch.02, ch.04, ch.05, ch.07, ch.08, ch.10, ch.15, ch.17, ch.18, ch.20, ch.21

Self-Attention

序列中每个位置关注其他所有位置的机制。

用于： ch.01, ch.03, ch.04, ch.05, ch.07, ch.08, ch.09, ch.15, ch.17, ch.18, ch.21

Multi-Head Attention

并行运行多个注意力机制以捕捉不同关系。

用于： ch.04, ch.05

Encoder-Decoder

用于翻译和生成任务的经典架构。

用于： ch.15

Positional Encoding

将词序信息注入Transformer的方法。

用于： ch.05

RoPE

现代LLM中常用的旋转式位置编码。

用于： ch.05

Residual Connection

跨越若干层的直连，用于稳定训练。

用于： ch.04, ch.05

Layer Normalization

用于稳定训练过程的归一化技术。

用于： ch.04, ch.05, ch.19

Mixture of Experts (MoE)

由多个专门子模型组成，按需选择性激活。

用于： ch.05

Diffusion Model

通过逐步去噪学习生成图像的生成模型。

GAN (Generative Adversarial Network)

生成器与判别器相互对抗的双网络架构。

Vision Transformer (ViT)

将Transformer应用于图像处理的模型。

用于： ch.05, ch.09, ch.15

State Space Model / Mamba

处理长序列的Transformer替代架构。

自然语言处理

13 个术语

NLP

让机器理解和处理人类语言的学科。

用于： ch.15

Tokenization

将文本拆分为基本单元（token）的过程。

用于： ch.01, ch.02, ch.08, ch.15

Token

模型处理的基本单位，可以是词、子词或字符。

用于： ch.01, ch.02, ch.03, ch.04, ch.05, ch.06, ch.07, ch.08, ch.09, ch.10, ch.11, ch.12, ch.13, ch.14, ch.15, ch.17, ch.18, ch.19, ch.20, ch.21

BPE (Byte Pair Encoding)

一种广泛使用的子词分词算法。

用于： ch.02

WordPiece / SentencePiece

其他常见的分词算法。

用于： ch.02

Vocabulary

模型所能识别的全部token集合。

用于： ch.01, ch.02, ch.05, ch.07, ch.20

Embedding

将词或token表示为密集向量的方式。

用于： ch.01, ch.03, ch.04, ch.05, ch.10, ch.11, ch.15, ch.21

Word2Vec

一种早期的词向量生成技术。

Contextual Embedding

根据句子上下文动态变化的词向量表示。

Named Entity Recognition

识别文本中实体（人名、地名等）的任务。

Sentiment Analysis

检测文本情感倾向的技术。

Speech Recognition (ASR)

将语音转换为文本的技术。

Text-to-Speech (TTS)

将文本转换为语音的技术。

用于： ch.15

语言模型与生成式AI

33 个术语

Language Model

预测词序列出现概率的模型。

用于： ch.01, ch.02, ch.04, ch.16

LLM (Large Language Model)

在海量文本上训练的超大规模语言模型。

用于： ch.01, ch.02, ch.03, ch.04, ch.05, ch.06, ch.07, ch.08, ch.09, ch.10, ch.11, ch.12, ch.13, ch.15, ch.16, ch.17, ch.18, ch.20

Foundation Model

可复用于多种任务的通用大型预训练模型。

Generative AI

能生成文本、图像、音频等内容的AI系统。

Pre-training

在大规模原始数据上进行的初始训练阶段。

用于： ch.06, ch.08, ch.12, ch.13, ch.14, ch.15

Fine-tuning

在特定任务数据上对预训练模型进行调整。

用于： ch.01, ch.08, ch.09, ch.11, ch.13, ch.14, ch.17, ch.19, ch.20

Instruction Tuning

通过微调让模型更好地遵循人类指令。

用于： ch.08, ch.14

RLHF

利用人类反馈信号对模型进行强化学习微调。

用于： ch.01, ch.08, ch.13, ch.14, ch.20

DPO (Direct Preference Optimization)

RLHF的简化替代方法，直接优化偏好数据。

用于： ch.08, ch.14

Constitutional AI

基于一套原则约束模型行为的对齐方法。

用于： ch.08

Prompt

输入给模型的文本内容。

用于： ch.01, ch.07, ch.08, ch.09, ch.10, ch.11, ch.12, ch.17, ch.18, ch.21

System Prompt

在对话开始前给模型设定行为规范的指令。

用于： ch.09, ch.18

Prompt Engineering

设计高效提示词以引导模型输出的技术。

用于： ch.12

Chain-of-Thought (CoT)

引导模型逐步推理的提示技术。

用于： ch.12, ch.17

Few-shot Prompting

在提示词中提供少量示例以引导模型输出。

In-Context Learning

模型根据提示词中的示例即时学习的能力。

用于： ch.12, ch.20

Context Window

模型一次能处理的最大文本量。

用于： ch.01, ch.02, ch.04, ch.08, ch.09, ch.12

Temperature

控制输出随机性的参数，低值趋于确定，高值趋于多样。

用于： ch.01, ch.07, ch.12

Top-k Sampling

从概率最高的k个token中采样。

用于： ch.01, ch.07

Top-p / Nucleus Sampling

从累计概率达到p的最小token集合中采样。

用于： ch.01, ch.07

Greedy Decoding

每步选择概率最高的token进行生成。

用于： ch.07

Beam Search

同时探索多条候选序列以寻找最优输出。

用于： ch.07

Hallucination

模型生成看似合理但实为错误的内容。

用于： ch.08, ch.10, ch.11, ch.13, ch.17

RAG (Retrieval-Augmented Generation)

模型在生成前检索外部文档以提升准确性。

用于： ch.01, ch.03, ch.08, ch.10, ch.11, ch.13, ch.14

Vector Database

专门存储和检索向量嵌入的数据库。

Semantic Search

基于语义相似度而非关键词匹配的检索方式。

Reasoning Model

经过专门优化、能进行深度逐步推理的LLM。

Multimodal Model

能处理多种输入类型（文本、图像、音频等）的模型。

Vision-Language Model

同时理解图像和文本的模型。

Text-to-Image

根据文本描述生成图像的技术。

LoRA

基于低秩矩阵分解的轻量级微调技术。

用于： ch.14

QLoRA

结合量化与LoRA以节省显存的微调方法。

用于： ch.14, ch.18

PEFT

参数高效微调方法的统称，只训练少量参数。

用于： ch.14

智能体与工具

8 个术语

AI Agent

通过多步骤规划和工具调用来完成目标的AI系统。

Tool Use / Function Calling

模型调用外部函数或API的能力。

用于： ch.11

ReAct

交替进行推理与行动的智能体模式。

用于： ch.11

Planning

智能体将目标分解为子任务的能力。

用于： ch.11, ch.21

Multi-Agent System

多个智能体协同合作或相互协调的系统。

MCP (Model Context Protocol)

将外部工具连接到LLM的标准协议。

用于： ch.11

Computer Use

智能体操作计算机界面完成任务的能力。

用于： ch.11

Agentic AI

能在环境中自主行动的AI系统。

数据

11 个术语

Dataset

用于训练或测试模型的数据集合。

用于： ch.08, ch.14, ch.16, ch.21

Training / Validation / Test Set

分别用于训练、调参和最终评估的数据集。

用于： ch.06, ch.19

Label / Ground Truth

与样本对应的正确答案或标注结果。

Annotation

为数据添加标签的过程。

Data Augmentation

通过变换现有数据人工扩充训练集的方法。

Synthetic Data

由算法或AI人工生成的数据。

Feature

输入给模型的变量或属性。

用于： ch.20

Feature Engineering

手动构建有意义输入特征的过程。

One-Hot Encoding

将类别变量编码为二进制向量的方法。

Data Drift

部署后数据分布相对训练时逐渐发生偏移的现象。

Data Leakage

测试集信息泄露到训练集，导致评估结果虚高。

训练与优化

13 个术语

Hyperparameter

训练前手动设定的参数，如学习率、批大小等。

Cross-Validation

通过多次划分数据进行更可靠评估的方法。

Overfitting

模型过度拟合训练数据，泛化能力差。

用于： ch.06

Underfitting

模型过于简单，无法捕捉数据中的规律。

Regularization

防止过拟合的一系列技术手段。

用于： ch.06

Dropout

训练时随机关闭部分神经元以防止过拟合。

Early Stopping

当验证集误差开始上升时提前终止训练。

Vanishing Gradient

梯度在反向传播中越来越小，导致深层网络难以训练。

Catastrophic Forgetting

模型在学习新任务时遗忘旧任务的现象。

Distillation

将大模型的知识迁移到小模型的技术。

用于： ch.21

Pruning

删除冗余权重以压缩模型体积的技术。

Quantization

降低权重数值精度以减少内存占用的技术。

用于： ch.07, ch.14, ch.18

Scaling Laws

描述模型大小、数据量、计算量与性能之间关系的规律。

用于： ch.01, ch.06, ch.08, ch.17, ch.19, ch.21

评估与指标

11 个术语

Accuracy

预测正确的样本占总样本的比例。

Precision

预测为正例中实际为正例的比例。

Recall

实际正例中被正确预测出来的比例。

F1 Score

精确率与召回率的调和平均值。

Confusion Matrix

对比预测结果与真实标签的交叉表格。

ROC / AUC

评估分类器性能的曲线及其面积指标。

Perplexity

衡量语言模型不确定性的指标，越低越好。

BLEU / ROUGE

用于评估机器翻译和自动摘要质量的指标。

用于： ch.01, ch.06

FID

衡量生成图像质量的指标。

Benchmark

用于比较模型能力的标准化测试，如MMLU、HumanEval等。

用于： ch.16

Red Teaming

通过对抗性测试发现模型缺陷的方法。

强化学习

8 个术语

Agent

在环境中做出决策的实体。

用于： ch.11, ch.18

Environment

智能体所处并与之交互的世界。

Policy

智能体的决策策略，将状态映射到动作。

Reward

指示动作好坏的数值信号。

用于： ch.06, ch.08, ch.11, ch.13

Q-Learning

基于Q值估计的强化学习算法。

PPO

广泛使用的强化学习算法，也用于RLHF训练。

用于： ch.08, ch.14

Exploration vs Exploitation

在尝试新动作与利用已知最优动作之间权衡的难题。

Reward Hacking

智能体以非预期方式钻奖励函数空子的现象。

用于： ch.11

计算机视觉

8 个术语

Computer Vision

处理图像和视频的AI子领域。

Image Classification

为图像整体分配类别标签的任务。

Object Detection

在图像中定位并识别各个目标对象的任务。

Semantic Segmentation

为图像中每个像素分配类别标签的任务。

OCR

从图像中识别文字的技术。

YOLO / R-CNN

经典的目标检测模型。

SAM (Segment Anything)

能分割任意对象的通用分割模型。

NeRF

从多角度图片中学习三维场景的神经网络表示。

安全、对齐与伦理

14 个术语

AI Alignment

确保AI系统的目标与人类价值观保持一致的研究领域。

用于： ch.07, ch.08, ch.13, ch.21

AI Safety

致力于让AI可靠、安全、可控的研究领域。

Adversarial Attack

专门设计用来欺骗模型的输入样本。

Jailbreak

绕过LLM安全限制的方法。

用于： ch.08

Prompt Injection

在提示词中注入恶意指令以操控模型行为。

用于： ch.12

Bias (algorithmic)

数据或模型预测中存在的系统性偏差。

Fairness

确保算法决策对不同群体公平一致。

Explainability

理解模型为何做出某一决策的能力。

Mechanistic Interpretability

研究神经网络内部工作机制的学科。

Differential Privacy

在统计数据中保护个人隐私的数学方法。

Deepfake

由AI生成或篡改的虚假媒体内容。

Misalignment

模型实际目标与预期目标之间的偏差。

Reward Model

预测人类对回答偏好程度的模型。

用于： ch.08, ch.13

AI Governance

对AI开发与应用进行监管与治理的机制。

基础设施与MLOps

14 个术语

GPU

图形处理器，广泛用于AI计算加速。

用于： ch.06, ch.09, ch.14, ch.18, ch.21

TPU

谷歌专为AI训练设计的专用芯片。

CUDA

Nvidia提供的GPU并行计算平台。

FLOPS

每秒浮点运算次数，衡量计算能力的指标。

用于： ch.18, ch.19

Distributed Training

在多台机器上并行训练模型。

Data Parallelism

每个GPU使用相同权重处理不同数据的并行方式。

Model Parallelism

将模型拆分到多个GPU上并行运行。

PyTorch / TensorFlow / JAX

主流深度学习框架。

Hugging Face

提供模型、数据集和ML工具的开放平台。

用于： ch.14, ch.18

ONNX

用于在不同框架间交换模型的标准格式。

Edge AI

在终端设备上本地运行的AI。

Latency

模型响应所需的时间。

用于： ch.18

Throughput

模型每秒处理的推理请求数量。

MLOps

将DevOps实践应用于机器学习的工程方法。

新兴概念

9 个术语

Emergent Abilities

模型规模超过某一阈值后突然涌现的新能力。

用于： ch.19

Scaling

通过增加模型规模、数据量或计算量提升性能。

用于： ch.06, ch.17, ch.19, ch.20

Open Weights

公开发布权重、可自由下载使用的模型。

Frontier Model

代表当前最先进水平的前沿模型。

Small Language Model (SLM)

体积精简、注重效率的紧凑型语言模型。

Human-in-the-Loop

在学习或决策过程中引入人类参与和监督。

World Model

智能体内部对环境动态变化的预测性表示。

Embodied AI

具身于物理实体（如机器人）中的AI。

Model Card

描述模型能力、局限性和偏差的标准化说明文档。