术语表

术语按字母顺序列出。

术语 描述

精度

模型为分类决策作出的正确预测百分比。对于数值决策而言,这更为复杂。

主动学习

一种机器学习 (ML) 技术,它要求人机回圈为特定输入提供结果。这些输入被机器用于优化学习速率,并更大程度减少与人机回圈的交互次数。另请参阅指导性学习

AutoML(自动机器学习)

一种机器学习系统,不需要用户输入即可拟合数据、分析变量之间的关系,并对新数据进行预测。一个典型的例子是自动统计学家 (Automatic Statistician)。

二进制变量

采用两个值(通常为 True 或 False)之一的分类变量。

校准

这一流程包括审查模型输入和结果预测,并在需要时覆盖模型决策。

分类变量

变量,即采用一组固定值中的一个。如果值是无序的,则为“名义”分类变量;如果值是有序的,则为“有序”分类变量。

确定性

请参阅可信度

条件

规则的一部分。必须满足规则的所有条件,才能应用规则。例如:stock room = full。也称为“限制”。

可信度

这定义了模型在预测中的确定性,例如,100 次预测中正确的次数。也称为“确定性”。

数据类型

问题中的变量类型。可以是分类或数值。

Decision

请参阅结果变量

异常:

请参阅规则

指导性学习

一种机器学习技术,它要求人机回圈提供生成特定输出的输入。这些输出被计算机用于优化学习速率,并更大限度减少与人机回圈中的交互次数。另请参阅主动学习

人机回圈

为机器学习方法或自动化提供指导的人。

输入变量

决策流程的输入。

输入重要性

模型为输入变量提供的相对值,与其他输入变量进行比较以确定其重要性。较高的值表示模型认为该变量比较重要。一些模型允许用户改变这些权重。也称为特征重要性或特征权重。

kNN 模型

基于训练数据中输入的 k 个最近邻居 (kNN) 对该输入进行预测(分类或数值)的机器学习或统计非参数模型。最近的邻居可以被视为等量(未加权 kNN 模型)或通过其反距离或相似性(加权 kNN 模型)加权。

机器学习

计算机进行自行学习的系统。

模型

基于给定特征集预测结果(决策)的机器学习系统。

邻居

被视作与为变量输入值相似的样本子集。请参阅 kNN 模型

零代码

无需编程即可配置的系统。这些系统通常为业务用户而非工程师使用而设计。

名义变量

无序分类变量。例如,“cat”、“horse”、“dog”。

非参数模型

这种机器学习模型对问题结构作出的假设较少,并且适用于拟合数据。通常,这些模型比标准统计参数模型更为灵活。

数值变量

取某一范围内的任何值的变量。例如,1、1.2、100、-3。

有序变量

有序分类变量。例如,“小”、“中”、“大”。

结果变量

决策流程的结果。也称为“决策”

规则

用户定义的 Decision 模型异常。这是一个条件或约束的列表,当满足这些条件或约束时,将强迫结果为一个特定的值。也称为“异常”。

样本

数据点,是一组完整的输入变量值,可能也与结果变量值相关联。

未加权

请参阅 kNN 模型

变量

输入或结果(决策)变量的通用术语。

加权

请参阅 kNN 模型。