白话理解: 准确率(Accuracy), 精确率(Precision), 召回率(Recall)

标签: 白话 理解 准确 | 发表时间:2018-07-27 19:23 | 作者:flyfoxs
出处:http://www.iteye.com

本文重点是在白话,不是数学上面的严格定义. 那首先要有一个业务场景,就好比上学,学习数据库,就要用到学生成绩. 在这,我们的业务场景就是对100个西瓜进行分类(已知生熟各半)

 

下面是针对上面场景,对各个术语的解释

准确率(Accuracy): 对所有西瓜分类正确的比率.

精确率(Precision): 挑出来的熟西瓜,有多少是正确的.

召回率(Recall) : 50个熟西瓜,有多少被分来到熟西瓜这个类别.

 

下面我们来分析各个术语有什么应用场景:

Accuracy: 这个是我们最常用的,但是这个指标有一个缺点,就是当数据分来不均匀的时候,就没办法用于业务了. 比如, 当生西瓜只有2个,熟西瓜有98个的时候. 只要判断所有的都是熟西瓜,准确率就是98%.但是这个模型其实是不合理的.

 

Precision: 这个指标就是为吃瓜群众准备的了, 比如100个西瓜里面,我只需要挑选出2个西瓜,并且都是熟西瓜,那么这个Precision就是100%. 其他的西瓜,就可以都判断为生西瓜.

 

Recall: 这个指标就是为瓜农准备的了, 瓜农肯定是想100%把所有的熟西瓜挑出来,送到市场上卖, 有多少熟西瓜被挑选出来了,就是用Recall这个指标来衡量了.

 

如果是黑心瓜农,直接把所有的西瓜,都当成熟西瓜,那么Recall就是100%了. 想想宁可错杀一千,不能错过一个.就是只注意了Recall.

如果是良心瓜农的话,会兼顾Precision. 也就是尽可能的排除生西瓜.

 

 

下面是三个不同角色对应的场景举例:

  • 针对吃瓜群众, 只希望挑出2个熟西瓜.其他的不管(Precision=100%)
 

 

Precision =2/(2+0) 100.00%
Recall =2/(2+48) 4.00%
F1 =2*1*0.04/(1+0.04) 7.69%

 

 

  • 黑心瓜农,所有的熟西瓜一个也不能放过,至于有没有生西瓜混入,完全不管. 那就是可以把所有100个西瓜当成熟西瓜卖个消费者. (Recall = 100%)


 
Precision =50/(50+50) 50.00%
Recall =50/(50+0) 100.00%
F1 =2*0.5*1/(0.5+1) 66.67%

 

 

  • 良心瓜农,经验丰富,可以识别大部分的熟西瓜,当然也会有些失误混入了少量生西瓜.这个模型比较均衡, Precision 和Recall相对比较高. 



 

 

Precision =48/(48+2) 96.00%
Recall =48/(48+2) 96.00%
F1 =2*0.96*0.96/(0.96+0.96) 96.00%

 

 

 

各种指标的数学定义公式:



 



已有 0 人发表留言,猛击->> 这里<<-参与讨论


ITeye推荐



相关 [白话 理解 准确] 推荐:

白话理解: 准确率(Accuracy), 精确率(Precision), 召回率(Recall)

- - 数据库 - ITeye博客
本文重点是在白话,不是数学上面的严格定义. 那首先要有一个业务场景,就好比上学,学习数据库,就要用到学生成绩. 在这,我们的业务场景就是对100个西瓜进行分类(已知生熟各半). 下面是针对上面场景,对各个术语的解释. 准确率(Accuracy): 对所有西瓜分类正确的比率.. 精确率(Precision): 挑出来的熟西瓜,有多少是正确的..

白话BigPipe

- Sean Lee - 火丁笔记
所谓BigPipe,指的是Facebook开发的用来改善客户端响应速度的技术. 本质上讲,其实它并不是新事物,原理上等同于Yahoo在Best Practices for Speeding Up Your Web Site里提出的Flush the Buffer Early,不过BigPipe的实现更灵活,所以有必要了解一二.

白话MongoDB(一)

- Ease - 江边潮未尽,枫红一季秋
按照官方的说法,MongoDB是一种可扩展的高性能的开源的面向文档(document-oriented )的数据库,采用C++开发. 注意mongo不是mango(芒果),这个词是从humongous中截取出来的,其野心不言而明,直指海量数据存储. 和其他很多NoSQL不太一样,MongoDB背后有一个专门的商业公司在提供支持和推广,有点类似MySQL AB的模式.

白话Block Formatting Context

- MArCoRQ - UED TEAM,用户体验设计,web前端开发
一,啥是Block Formatting Context. 当涉及到可视化布局的时候,Block Formatting Context提供了一个环境,HTML元素在这个环境中按照一定规则进行布局. 一个环境中的元素不会影响到其它环境中的布局. 为了让我们有个感性的认识,举个不太合适的例子. 你可以把一个页面想象成大的集装箱,这个集装箱里装的货物就是HTML元素.

白话大数据

- - 互联网分析
这个时代,你在外面混,无论是技术还是产品还是运营还是商务,如果嘴里说不出“大数据”“云存储”“云计算”,真不好意思在同行面前抬头. 是千万级别的用户信息还是动辄XXXTB的数据量. 其实,大数据在我的眼里,不是一门技术,而是一种技能,从数据中去发现价值挖掘价值的技能. ”当我掷地有声用这句话开场时,正好一个妹子推门而入,听到这句话,微微一怔,低头坐下.

《出师表》白话文版!

- 刘 - 我们爱讲冷笑话
你亮叔我有跟你的吧几句:你爹出来混,半道上给挂了;现在地盘又分三块,益州好像咱也罩不住了,这世道眼瞅着要杯具了. 但是你爹留下的保镖还很忠心,出去砸场的那些二杆子也都不想要命了,这些都是看在你爸往日给钱给女人的份上,现在想报答罢了. 叔现在就希望你丫放机灵点,完成你爹的遗愿,让兄弟们也扬眉吐气;千万不要把自己当成不值钱的葱,把弟兄们的心给屈了.

如何准确看清用户需求?

- - 腾讯CDC
        市场营销,就是“通过改变影响用户产品购买决策的各种因素,实现争夺用户或激发用户消费的目的”,对产品运营人员来说,无非是解决“吸引新用户、掠夺竞品用户、留住现有用户、促使用户购买、促使用户购买更多”等实际问题,于是,产品运营人员需要去不断了解用户需求,改善市场策略,而市场调研是了解用户需求最常用的方法.

准确的java程序性能测试

- - ITeye博客
原创文章,转载请指明出处: http://aub.iteye.com/blog/2124974 , 尊重他人即尊重自己. 1.避免垃圾回收对结果造成的误差. 方案一:JVM启动时使用-verbose:gc观察垃圾回收动作,确认整个测试期间垃圾回收根本不会执行. 方案二:运行足够的次数和时间,这样测试程序能够充分的反应出运行期间分配与垃圾回收的开销(推荐).

Elasticsearch:准确值与全文本

- - 翟志军
概括地说,Elasticsearch将数据分成两类:准确值(Exact values)和全文本(Full text). 当然字符串也可以是准确值,如用户名或邮件地址. 准确值Foo与准确值foo是不同的. 准确值2014和准确值2014-09-15也是不同的. 另一方面,全文本(full text)指的是通常用人类语言写的文本数据,像一条tweet的文本或一封邮件的内容.

深圳第二代的白话化

- babyone - 一五一十推荐文章
作者:Huanghe | 评论(14) | 标签:时事观点. 白话,就是通俗说的广东话,或者是粤语. 这个语言在深圳的存在,可以作为一个白话在海外存在下去的一宿影. 可以提供一个活化石模型去研究白话是怎么能在海外存在下去的. 白话为什么会是海外华人使用最多的一个语言,这个问题的普遍回答就是早期的华人是广东人,然后就是香港人大量移居海外等等,但广东人和香港人这些概念,其实是包含了白话人,客家人和潮汕人这三大民系,为何最终白话取得绝对的优势并且使得白话这个概念和广东话等同起来呢.