196 个术语 · 15 个类别

完整词汇表

所有AI术语(英文标准用法)附简单定义。

基础概念

10 个术语

Artificial Intelligence (AI)

让机器完成通常需要人类智能才能完成的任务的学科领域。

用于: ch.01, ch.08, ch.10, ch.11, ch.13, ch.19

Machine Learning (ML)

AI的一个子领域,系统从数据中学习,而非依赖显式编程规则。

Deep Learning

基于多层神经网络的机器学习方法。

Narrow AI

专注于单一特定任务的AI,例如下棋。

AGI (Artificial General Intelligence)

假想中能完成任何人类智力任务的通用AI。

用于: ch.16

Superintelligence

在所有领域都远超人类智能的假想AI。

Symbolic AI

基于规则和形式逻辑的传统AI方法。

Model

从数据中学习得到的数学表示。

用于: ch.08, ch.11, ch.13

Inference

已训练模型进行预测的阶段。

Training

模型从数据中学习参数的阶段。

学习类型

10 个术语

Supervised Learning

使用带标签数据(输入→已知输出)进行学习。

用于: ch.08, ch.14

Unsupervised Learning

无需标签的学习方式,模型自行发现数据中的隐藏结构。

Self-supervised Learning

模型从数据本身自动生成监督信号进行学习。

用于: ch.06

Reinforcement Learning

通过试错并获得奖励信号来学习的方式。

用于: ch.08

Transfer Learning

将在一个任务上训练好的模型迁移到相似的新任务中。

Few-shot Learning

仅凭极少数样本进行学习的能力。

Zero-shot Learning

无需任何训练样本即可完成任务的能力。

Meta-learning

训练模型快速适应新任务的方法,即让模型学会如何学习。

Federated Learning

在不集中数据的前提下进行分布式训练。

Continual Learning

模型在学习新任务的同时不遗忘旧任务的能力。

神经网络

16 个术语

Neuron / Unit

网络中受生物神经元启发的基本计算单元。

Layer

并行处理的一组神经元。

Weights

决定神经元间连接强度的可学习参数。

Bias

加在加权求和结果上的常数项。

Activation Function

应用于神经元输出的非线性函数。

ReLU

最常用的激活函数之一:max(0, x)。

Forward Pass

从输入到输出的正向计算过程。

Backpropagation

计算梯度以更新权重的算法。

用于: ch.06

Loss Function

衡量预测值与真实值之间差距的函数。

用于: ch.01, ch.06, ch.08

Cross-Entropy Loss

分类任务中常用的标准损失函数。

用于: ch.06, ch.13

Optimizer

驱动权重更新的算法,如Adam、SGD等。

Learning Rate

梯度下降时每步更新的步长大小。

用于: ch.06

Epoch

对整个训练集完整遍历一次。

Batch

每次一起处理的一组数据样本。

用于: ch.06, ch.18

架构

18 个术语

Feedforward Network

信息单向流动的神经网络。

用于: ch.04, ch.05

MLP (Multi-Layer Perceptron)

具有全连接层的经典前馈神经网络。

用于: ch.05, ch.15

CNN (Convolutional Neural Network)

专为图像设计的神经网络,使用卷积滤波器。

RNN (Recurrent Neural Network)

通过内部状态处理序列数据的神经网络。

用于: ch.04

LSTM

改进版RNN,能记忆更长时间范围内的信息。

用于: ch.04

Multi-Head Attention

并行运行多个注意力机制以捕捉不同关系。

用于: ch.04, ch.05

Encoder-Decoder

用于翻译和生成任务的经典架构。

用于: ch.15

Positional Encoding

将词序信息注入Transformer的方法。

用于: ch.05

RoPE

现代LLM中常用的旋转式位置编码。

用于: ch.05

Residual Connection

跨越若干层的直连,用于稳定训练。

用于: ch.04, ch.05

Layer Normalization

用于稳定训练过程的归一化技术。

用于: ch.04, ch.05, ch.19

Mixture of Experts (MoE)

由多个专门子模型组成,按需选择性激活。

用于: ch.05

Diffusion Model

通过逐步去噪学习生成图像的生成模型。

GAN (Generative Adversarial Network)

生成器与判别器相互对抗的双网络架构。

Vision Transformer (ViT)

将Transformer应用于图像处理的模型。

用于: ch.05, ch.09, ch.15

State Space Model / Mamba

处理长序列的Transformer替代架构。

自然语言处理

13 个术语

NLP

让机器理解和处理人类语言的学科。

用于: ch.15

Tokenization

将文本拆分为基本单元(token)的过程。

用于: ch.01, ch.02, ch.08, ch.15

BPE (Byte Pair Encoding)

一种广泛使用的子词分词算法。

用于: ch.02

WordPiece / SentencePiece

其他常见的分词算法。

用于: ch.02

Word2Vec

一种早期的词向量生成技术。

Contextual Embedding

根据句子上下文动态变化的词向量表示。

Named Entity Recognition

识别文本中实体(人名、地名等)的任务。

Sentiment Analysis

检测文本情感倾向的技术。

Speech Recognition (ASR)

将语音转换为文本的技术。

Text-to-Speech (TTS)

将文本转换为语音的技术。

用于: ch.15

语言模型与生成式AI

33 个术语

Foundation Model

可复用于多种任务的通用大型预训练模型。

Generative AI

能生成文本、图像、音频等内容的AI系统。

Instruction Tuning

通过微调让模型更好地遵循人类指令。

用于: ch.08, ch.14

DPO (Direct Preference Optimization)

RLHF的简化替代方法,直接优化偏好数据。

用于: ch.08, ch.14

Constitutional AI

基于一套原则约束模型行为的对齐方法。

用于: ch.08

System Prompt

在对话开始前给模型设定行为规范的指令。

用于: ch.09, ch.18

Prompt Engineering

设计高效提示词以引导模型输出的技术。

用于: ch.12

Chain-of-Thought (CoT)

引导模型逐步推理的提示技术。

用于: ch.12, ch.17

Few-shot Prompting

在提示词中提供少量示例以引导模型输出。

In-Context Learning

模型根据提示词中的示例即时学习的能力。

用于: ch.12, ch.20

Temperature

控制输出随机性的参数,低值趋于确定,高值趋于多样。

用于: ch.01, ch.07, ch.12

Top-k Sampling

从概率最高的k个token中采样。

用于: ch.01, ch.07

Top-p / Nucleus Sampling

从累计概率达到p的最小token集合中采样。

用于: ch.01, ch.07

Greedy Decoding

每步选择概率最高的token进行生成。

用于: ch.07

Vector Database

专门存储和检索向量嵌入的数据库。

Reasoning Model

经过专门优化、能进行深度逐步推理的LLM。

Multimodal Model

能处理多种输入类型(文本、图像、音频等)的模型。

Vision-Language Model

同时理解图像和文本的模型。

Text-to-Image

根据文本描述生成图像的技术。

LoRA

基于低秩矩阵分解的轻量级微调技术。

用于: ch.14

QLoRA

结合量化与LoRA以节省显存的微调方法。

用于: ch.14, ch.18

PEFT

参数高效微调方法的统称,只训练少量参数。

用于: ch.14

智能体与工具

8 个术语

AI Agent

通过多步骤规划和工具调用来完成目标的AI系统。

Tool Use / Function Calling

模型调用外部函数或API的能力。

用于: ch.11

ReAct

交替进行推理与行动的智能体模式。

用于: ch.11

Planning

智能体将目标分解为子任务的能力。

用于: ch.11, ch.21

Multi-Agent System

多个智能体协同合作或相互协调的系统。

MCP (Model Context Protocol)

将外部工具连接到LLM的标准协议。

用于: ch.11

Computer Use

智能体操作计算机界面完成任务的能力。

用于: ch.11

Agentic AI

能在环境中自主行动的AI系统。

数据

11 个术语

Training / Validation / Test Set

分别用于训练、调参和最终评估的数据集。

用于: ch.06, ch.19

Label / Ground Truth

与样本对应的正确答案或标注结果。

Annotation

为数据添加标签的过程。

Data Augmentation

通过变换现有数据人工扩充训练集的方法。

Synthetic Data

由算法或AI人工生成的数据。

Feature

输入给模型的变量或属性。

用于: ch.20

Feature Engineering

手动构建有意义输入特征的过程。

One-Hot Encoding

将类别变量编码为二进制向量的方法。

Data Drift

部署后数据分布相对训练时逐渐发生偏移的现象。

Data Leakage

测试集信息泄露到训练集,导致评估结果虚高。

训练与优化

13 个术语

Hyperparameter

训练前手动设定的参数,如学习率、批大小等。

Cross-Validation

通过多次划分数据进行更可靠评估的方法。

Overfitting

模型过度拟合训练数据,泛化能力差。

用于: ch.06

Underfitting

模型过于简单,无法捕捉数据中的规律。

Regularization

防止过拟合的一系列技术手段。

用于: ch.06

Dropout

训练时随机关闭部分神经元以防止过拟合。

Early Stopping

当验证集误差开始上升时提前终止训练。

Vanishing Gradient

梯度在反向传播中越来越小,导致深层网络难以训练。

Catastrophic Forgetting

模型在学习新任务时遗忘旧任务的现象。

Distillation

将大模型的知识迁移到小模型的技术。

用于: ch.21

Pruning

删除冗余权重以压缩模型体积的技术。

Quantization

降低权重数值精度以减少内存占用的技术。

用于: ch.07, ch.14, ch.18

评估与指标

11 个术语

Accuracy

预测正确的样本占总样本的比例。

Precision

预测为正例中实际为正例的比例。

Recall

实际正例中被正确预测出来的比例。

F1 Score

精确率与召回率的调和平均值。

Confusion Matrix

对比预测结果与真实标签的交叉表格。

ROC / AUC

评估分类器性能的曲线及其面积指标。

Perplexity

衡量语言模型不确定性的指标,越低越好。

BLEU / ROUGE

用于评估机器翻译和自动摘要质量的指标。

用于: ch.01, ch.06

FID

衡量生成图像质量的指标。

Benchmark

用于比较模型能力的标准化测试,如MMLU、HumanEval等。

用于: ch.16

Red Teaming

通过对抗性测试发现模型缺陷的方法。

强化学习

8 个术语

Agent

在环境中做出决策的实体。

用于: ch.11, ch.18

Environment

智能体所处并与之交互的世界。

Policy

智能体的决策策略,将状态映射到动作。

Q-Learning

基于Q值估计的强化学习算法。

PPO

广泛使用的强化学习算法,也用于RLHF训练。

用于: ch.08, ch.14

Exploration vs Exploitation

在尝试新动作与利用已知最优动作之间权衡的难题。

Reward Hacking

智能体以非预期方式钻奖励函数空子的现象。

用于: ch.11

计算机视觉

8 个术语

Computer Vision

处理图像和视频的AI子领域。

Image Classification

为图像整体分配类别标签的任务。

Object Detection

在图像中定位并识别各个目标对象的任务。

Semantic Segmentation

为图像中每个像素分配类别标签的任务。

OCR

从图像中识别文字的技术。

YOLO / R-CNN

经典的目标检测模型。

SAM (Segment Anything)

能分割任意对象的通用分割模型。

NeRF

从多角度图片中学习三维场景的神经网络表示。

安全、对齐与伦理

14 个术语

AI Alignment

确保AI系统的目标与人类价值观保持一致的研究领域。

用于: ch.07, ch.08, ch.13, ch.21

AI Safety

致力于让AI可靠、安全、可控的研究领域。

Adversarial Attack

专门设计用来欺骗模型的输入样本。

Jailbreak

绕过LLM安全限制的方法。

用于: ch.08

Prompt Injection

在提示词中注入恶意指令以操控模型行为。

用于: ch.12

Bias (algorithmic)

数据或模型预测中存在的系统性偏差。

Fairness

确保算法决策对不同群体公平一致。

Explainability

理解模型为何做出某一决策的能力。

Mechanistic Interpretability

研究神经网络内部工作机制的学科。

Differential Privacy

在统计数据中保护个人隐私的数学方法。

Deepfake

由AI生成或篡改的虚假媒体内容。

Misalignment

模型实际目标与预期目标之间的偏差。

Reward Model

预测人类对回答偏好程度的模型。

用于: ch.08, ch.13

AI Governance

对AI开发与应用进行监管与治理的机制。

基础设施与MLOps

14 个术语

TPU

谷歌专为AI训练设计的专用芯片。

CUDA

Nvidia提供的GPU并行计算平台。

FLOPS

每秒浮点运算次数,衡量计算能力的指标。

用于: ch.18, ch.19

Distributed Training

在多台机器上并行训练模型。

Data Parallelism

每个GPU使用相同权重处理不同数据的并行方式。

Model Parallelism

将模型拆分到多个GPU上并行运行。

PyTorch / TensorFlow / JAX

主流深度学习框架。

Hugging Face

提供模型、数据集和ML工具的开放平台。

用于: ch.14, ch.18

ONNX

用于在不同框架间交换模型的标准格式。

Edge AI

在终端设备上本地运行的AI。

Latency

模型响应所需的时间。

用于: ch.18

Throughput

模型每秒处理的推理请求数量。

MLOps

将DevOps实践应用于机器学习的工程方法。

新兴概念

9 个术语

Emergent Abilities

模型规模超过某一阈值后突然涌现的新能力。

用于: ch.19

Scaling

通过增加模型规模、数据量或计算量提升性能。

用于: ch.06, ch.17, ch.19, ch.20

Open Weights

公开发布权重、可自由下载使用的模型。

Frontier Model

代表当前最先进水平的前沿模型。

Small Language Model (SLM)

体积精简、注重效率的紧凑型语言模型。

Human-in-the-Loop

在学习或决策过程中引入人类参与和监督。

World Model

智能体内部对环境动态变化的预测性表示。

Embodied AI

具身于物理实体(如机器人)中的AI。

Model Card

描述模型能力、局限性和偏差的标准化说明文档。

Step by Token — Comprendre les LLMs visuellement