机器学习中涉及到几个关于错误的概念:
precision:(精确度)
precision = TP/(TP+FP)
recall:(召回率)
recall = TP/(TP+FN)
accuracy:(准确度)
accuracy = (TP+TN)/(TP+FP+TN+FN)
F1 score:
F1 score = (2 * precision * recall) / (precision + recall)
对应到搜索引擎里就是:
给定查询条件,得到一个结果集,
Precision = 结果集中实际相关的文档集/结果集;
Recall = 结果集中实际相关的文档集/实际上与查询条件相关的文档集
这两个概念的主要作用是,对一个十分skewed的分类问题来说,很容易可以得到某个高精度的 学习算法,很容易以为得到一个好的算法,但是如果同时检查这个算法的 precision 和 recall,就可以知道这个学习算法到底是不是一个好的算法。