评价模型的参数 TP、TN、FP、FN
一、基础概念
- TP:被模型预测为正类的正样本
- TN:被模型预测为负类的负样本
- FP:被模型预测为正类的负样本
- FN:被模型预测为负类的正样本
预测为正样本(Positive) | 预测为负样本(Negative) | |
---|---|---|
实际为正样本(True) | TP(真正例) | FN(假反例) |
实际为负样本(False) | FP(假正例) | TN(真反例) |
二、通俗理解(以西瓜数据集为例)
以西瓜数据集为例,我们来通俗理解一下什么是TP、TN、FP、FN。
- TP:被模型预测为好瓜的好瓜(是真正的好瓜,而且也被模型预测为好瓜)
- TN:被模型预测为坏瓜的坏瓜(是真正的坏瓜,而且也被模型预测为坏瓜)
- FP:被模型预测为好瓜的坏瓜(瓜是真正的坏瓜,但是被模型预测为了好瓜)
- FN:被模型预测为坏瓜的好瓜(瓜是真正的好瓜,但是被模型预测为了坏瓜)
三、查准率、查全率
还是以西瓜数据集为例
(1)查准率、查全率代表的含义
- 查准率:模型挑出来的西瓜中有多少比例是好瓜
- 查全率:所有的好瓜中有多少比例是被模型挑出来的
(2)如何计算查准率、查全率
查准率用P来表示:
$$P= TP/(TP+FP)$$
查全率用R来表示:
$$R=TP(TP+FN)$$
评价模型的参数 TP、TN、FP、FN
https://flepeng.github.io/ml-评价模型的参数-TP、TN、FP、FN/