Artificial Intelligence (AI)
让机器完成通常需要人类智能才能完成的任务的学科领域。
196 个术语 · 15 个类别
所有AI术语(英文标准用法)附简单定义。
让机器完成通常需要人类智能才能完成的任务的学科领域。
AI的一个子领域,系统从数据中学习,而非依赖显式编程规则。
基于多层神经网络的机器学习方法。
专注于单一特定任务的AI,例如下棋。
假想中能完成任何人类智力任务的通用AI。
用于: ch.16
在所有领域都远超人类智能的假想AI。
基于规则和形式逻辑的传统AI方法。
从数据中学习得到的数学表示。
已训练模型进行预测的阶段。
模型从数据中学习参数的阶段。
使用带标签数据(输入→已知输出)进行学习。
无需标签的学习方式,模型自行发现数据中的隐藏结构。
模型从数据本身自动生成监督信号进行学习。
用于: ch.06
通过试错并获得奖励信号来学习的方式。
用于: ch.08
将在一个任务上训练好的模型迁移到相似的新任务中。
仅凭极少数样本进行学习的能力。
无需任何训练样本即可完成任务的能力。
训练模型快速适应新任务的方法,即让模型学会如何学习。
在不集中数据的前提下进行分布式训练。
模型在学习新任务的同时不遗忘旧任务的能力。
网络中受生物神经元启发的基本计算单元。
并行处理的一组神经元。
决定神经元间连接强度的可学习参数。
加在加权求和结果上的常数项。
应用于神经元输出的非线性函数。
最常用的激活函数之一:max(0, x)。
将向量转换为概率分布的函数。
从输入到输出的正向计算过程。
计算梯度以更新权重的算法。
用于: ch.06
通过调整权重来最小化误差的优化算法。
衡量预测值与真实值之间差距的函数。
分类任务中常用的标准损失函数。
驱动权重更新的算法,如Adam、SGD等。
梯度下降时每步更新的步长大小。
用于: ch.06
对整个训练集完整遍历一次。
每次一起处理的一组数据样本。
信息单向流动的神经网络。
具有全连接层的经典前馈神经网络。
专为图像设计的神经网络,使用卷积滤波器。
通过内部状态处理序列数据的神经网络。
用于: ch.04
改进版RNN,能记忆更长时间范围内的信息。
用于: ch.04
基于注意力机制的架构,自2017年起主导AI领域。
用于: ch.01, ch.02, ch.04, ch.05, ch.07, ch.08, ch.10, ch.15, ch.17, ch.18, ch.20, ch.21
序列中每个位置关注其他所有位置的机制。
用于: ch.01, ch.03, ch.04, ch.05, ch.07, ch.08, ch.09, ch.15, ch.17, ch.18, ch.21
并行运行多个注意力机制以捕捉不同关系。
用于翻译和生成任务的经典架构。
用于: ch.15
将词序信息注入Transformer的方法。
用于: ch.05
现代LLM中常用的旋转式位置编码。
用于: ch.05
跨越若干层的直连,用于稳定训练。
用于稳定训练过程的归一化技术。
由多个专门子模型组成,按需选择性激活。
用于: ch.05
通过逐步去噪学习生成图像的生成模型。
生成器与判别器相互对抗的双网络架构。
将Transformer应用于图像处理的模型。
处理长序列的Transformer替代架构。
让机器理解和处理人类语言的学科。
用于: ch.15
将文本拆分为基本单元(token)的过程。
模型处理的基本单位,可以是词、子词或字符。
用于: ch.01, ch.02, ch.03, ch.04, ch.05, ch.06, ch.07, ch.08, ch.09, ch.10, ch.11, ch.12, ch.13, ch.14, ch.15, ch.17, ch.18, ch.19, ch.20, ch.21
一种广泛使用的子词分词算法。
用于: ch.02
其他常见的分词算法。
用于: ch.02
模型所能识别的全部token集合。
将词或token表示为密集向量的方式。
一种早期的词向量生成技术。
根据句子上下文动态变化的词向量表示。
识别文本中实体(人名、地名等)的任务。
检测文本情感倾向的技术。
将语音转换为文本的技术。
将文本转换为语音的技术。
用于: ch.15
预测词序列出现概率的模型。
在海量文本上训练的超大规模语言模型。
用于: ch.01, ch.02, ch.03, ch.04, ch.05, ch.06, ch.07, ch.08, ch.09, ch.10, ch.11, ch.12, ch.13, ch.15, ch.16, ch.17, ch.18, ch.20
可复用于多种任务的通用大型预训练模型。
能生成文本、图像、音频等内容的AI系统。
在大规模原始数据上进行的初始训练阶段。
在特定任务数据上对预训练模型进行调整。
用于: ch.01, ch.08, ch.09, ch.11, ch.13, ch.14, ch.17, ch.19, ch.20
通过微调让模型更好地遵循人类指令。
利用人类反馈信号对模型进行强化学习微调。
RLHF的简化替代方法,直接优化偏好数据。
基于一套原则约束模型行为的对齐方法。
用于: ch.08
输入给模型的文本内容。
用于: ch.01, ch.07, ch.08, ch.09, ch.10, ch.11, ch.12, ch.17, ch.18, ch.21
在对话开始前给模型设定行为规范的指令。
设计高效提示词以引导模型输出的技术。
用于: ch.12
引导模型逐步推理的提示技术。
在提示词中提供少量示例以引导模型输出。
模型根据提示词中的示例即时学习的能力。
模型一次能处理的最大文本量。
控制输出随机性的参数,低值趋于确定,高值趋于多样。
从概率最高的k个token中采样。
从累计概率达到p的最小token集合中采样。
每步选择概率最高的token进行生成。
用于: ch.07
同时探索多条候选序列以寻找最优输出。
用于: ch.07
模型生成看似合理但实为错误的内容。
模型在生成前检索外部文档以提升准确性。
专门存储和检索向量嵌入的数据库。
基于语义相似度而非关键词匹配的检索方式。
经过专门优化、能进行深度逐步推理的LLM。
能处理多种输入类型(文本、图像、音频等)的模型。
同时理解图像和文本的模型。
根据文本描述生成图像的技术。
基于低秩矩阵分解的轻量级微调技术。
用于: ch.14
结合量化与LoRA以节省显存的微调方法。
参数高效微调方法的统称,只训练少量参数。
用于: ch.14
用于训练或测试模型的数据集合。
分别用于训练、调参和最终评估的数据集。
与样本对应的正确答案或标注结果。
为数据添加标签的过程。
通过变换现有数据人工扩充训练集的方法。
由算法或AI人工生成的数据。
输入给模型的变量或属性。
用于: ch.20
手动构建有意义输入特征的过程。
将类别变量编码为二进制向量的方法。
部署后数据分布相对训练时逐渐发生偏移的现象。
测试集信息泄露到训练集,导致评估结果虚高。
训练前手动设定的参数,如学习率、批大小等。
通过多次划分数据进行更可靠评估的方法。
模型过度拟合训练数据,泛化能力差。
用于: ch.06
模型过于简单,无法捕捉数据中的规律。
防止过拟合的一系列技术手段。
用于: ch.06
训练时随机关闭部分神经元以防止过拟合。
当验证集误差开始上升时提前终止训练。
梯度在反向传播中越来越小,导致深层网络难以训练。
模型在学习新任务时遗忘旧任务的现象。
将大模型的知识迁移到小模型的技术。
用于: ch.21
删除冗余权重以压缩模型体积的技术。
降低权重数值精度以减少内存占用的技术。
描述模型大小、数据量、计算量与性能之间关系的规律。
预测正确的样本占总样本的比例。
预测为正例中实际为正例的比例。
实际正例中被正确预测出来的比例。
精确率与召回率的调和平均值。
对比预测结果与真实标签的交叉表格。
评估分类器性能的曲线及其面积指标。
衡量语言模型不确定性的指标,越低越好。
用于评估机器翻译和自动摘要质量的指标。
衡量生成图像质量的指标。
用于比较模型能力的标准化测试,如MMLU、HumanEval等。
用于: ch.16
通过对抗性测试发现模型缺陷的方法。
处理图像和视频的AI子领域。
为图像整体分配类别标签的任务。
在图像中定位并识别各个目标对象的任务。
为图像中每个像素分配类别标签的任务。
从图像中识别文字的技术。
经典的目标检测模型。
能分割任意对象的通用分割模型。
从多角度图片中学习三维场景的神经网络表示。
确保AI系统的目标与人类价值观保持一致的研究领域。
致力于让AI可靠、安全、可控的研究领域。
专门设计用来欺骗模型的输入样本。
绕过LLM安全限制的方法。
用于: ch.08
在提示词中注入恶意指令以操控模型行为。
用于: ch.12
数据或模型预测中存在的系统性偏差。
确保算法决策对不同群体公平一致。
理解模型为何做出某一决策的能力。
研究神经网络内部工作机制的学科。
在统计数据中保护个人隐私的数学方法。
由AI生成或篡改的虚假媒体内容。
模型实际目标与预期目标之间的偏差。
预测人类对回答偏好程度的模型。
对AI开发与应用进行监管与治理的机制。
图形处理器,广泛用于AI计算加速。
谷歌专为AI训练设计的专用芯片。
Nvidia提供的GPU并行计算平台。
每秒浮点运算次数,衡量计算能力的指标。
在多台机器上并行训练模型。
每个GPU使用相同权重处理不同数据的并行方式。
将模型拆分到多个GPU上并行运行。
主流深度学习框架。
提供模型、数据集和ML工具的开放平台。
用于在不同框架间交换模型的标准格式。
在终端设备上本地运行的AI。
模型响应所需的时间。
用于: ch.18
模型每秒处理的推理请求数量。
将DevOps实践应用于机器学习的工程方法。
模型规模超过某一阈值后突然涌现的新能力。
用于: ch.19
通过增加模型规模、数据量或计算量提升性能。
公开发布权重、可自由下载使用的模型。
代表当前最先进水平的前沿模型。
体积精简、注重效率的紧凑型语言模型。
在学习或决策过程中引入人类参与和监督。
智能体内部对环境动态变化的预测性表示。
具身于物理实体(如机器人)中的AI。
描述模型能力、局限性和偏差的标准化说明文档。