[原]异常检测--综述

- - 工作笔记

异常点检测，有时也叫离群点检测，英文一般叫做Novelty Detection或者Outlier Detection，这里就对异常点检测算法做一个总结. 1. 异常点检测算法使用场景. 　　　　什么时候我们需要异常点检测算法呢. 一是在做特征工程的时候需要对异常的数据做过滤，防止对归一化等处理的结果产生影响.

异常检测机制

- - 奇虎360-addops

传统的异常检测系统通过设置一个固定的阈值来保证监控项处于正常水平，一旦超过设定的阈值，就会触发报警来提醒人们的注意. 静态阈值法适用于在一定范围内波动的监控项，比如磁盘使用率，CPU使用率等，但是如果遇到网络流量这种不具有明显上限，波动比较剧烈的情况，单纯利用静态阈值法如果设置的阈值比较小，会出现很多误报的情况，增加人工成本；而如果将阈值设置的比较大，又会出现漏报的情况.

其实之前介绍过3倍方差，只是，这里的3倍方差讲的是在时间序列异常检测中的应用. 一个很直接的异常判定思路是，拿最新3个数据点的平均值（tail_avg方法）和整个序列比较，看是否偏离历史总体平均水平太多，如果偏离太多，就报警. 和上述算法基本一致，只是比较对象不是整个序列，而是开始一个小时（其实这种这种思想可以推广，只要是时间序列刚开始的一段时间即可）的以内的数据，求出这段时间的均值和标准差和尾部数据（新产生的数据）用三本方差的方法比较即可.

使用sklearn进行异常检测

- - 标点符

sklearn提供了一些机器学习方法，可用于奇异（Novelty）点或异常（Outlier）点检测，包括OneClassSVM、Isolation Forest、Local Outlier Factor (LOF) 等. 其中OneClassSVM可用于Novelty Detection，而后两者可用于Outlier Detection.

Netflix异常检测工具Surus初探

- - 标点符

Surus是NetFlix开源的UDFs，是基于pig和hive的数据分析工具. Surus中的功能能够解决多种多样的问题，例如评分预测模型、异常检测与模式匹配等. 目前开源的UDF功能主要包括两个，包括ScorePMML和Robust Anomaly Detection (RAD). 预测模型的应用随处可见，然而这些应用都不相同，唯独相同的是模型的创建和部署是相同的.

时间序列异常检测算法梳理

- - 标点符

时间序列的异常检测问题通常表示为相对于某些标准信号或常见信号的离群点. 虽然有很多的异常类型，但是我们只关注业务角度中最重要的类型，比如意外的峰值、下降、趋势变化以及等级转换（level shifts）. 革新性异常：innovational outlier (IO)，造成离群点的干扰不仅作用于$X_T$，而且影响T时刻以后序列的所有观察值.

Libjingle库综述

- - C++博客_首页

国内现在很多语音聊天工具都是基于TURN方式实现的，包括YY、AK等等，这种方式对于服务器的性能要求很高，而且在用户量增大的时候，服务器压力也会越来越大，用户的语音质量也会受到很大影响. 而基于P2P方式实现的语聊服务器，就可以极大的避免这种情况的发生，而且用户的语音体验也会非常好. 通过上文( P2P的原理和常见的实现方式(为libjingle开路))我们知道，因为NAT设备没有固定标准的原因，导致并不能100%的实现P2P，但是根据现在通用的ICE&STUN的方式，P2P的成功率可以达到90%多.

RBAC综述(转)

- - 企业架构 - ITeye博客

摘要基于角色的访问控制（Role-Based Access Control）作为传统访问控制（自主访问，强制访问）的有前景的代替受到广泛的关注. 在RBAC中，权限与角色相关联，用户通过成为适当角色的成员而得到这些角色的权限. 在一个组织中，角色是为了完成各种工作而创造，用户则依据它的责任和资格来被指派相应的角色，用户可以很容易地从一个角色被指派到另一个角色.

如何基于Flink+TensorFlow打造实时智能异常检测平台？只看这一篇就够了

- - zhisheng的博客

本文转自 AI 前线公众号，作者 | 潘国庆编辑 | Natalie. Flink 已经渐渐成为实时计算引擎的首选之一，从简单的实时 ETL 到复杂的 CEP 场景，Flink 都能够很好地驾驭. 本文整理自携程实时计算负责人潘国庆在 QCon 全球软件开发大会（北京站）2019 的演讲，他介绍了携程如何基于 Flink 与 TensorFlow 构建实时智能异常检测平台，以解决规则告警系统准确率低、时效性低、规则配置复杂与耗费人力等诸多问题，实现了业务指标毫秒级延迟与智能化检测，同时依托 Flink 实现了强大的容错机制.

Big Data技术综述

- Ben - 《程序员》杂志官网

Big Data是近来的一个技术热点，但从名字就能判断它并不是什么新词. 历史上，数据库、数据仓库、数据集市等信息管理领域的技术，很大程度上也是为了解决大规模数据的问题. 被誉为数据仓库之父的Bill Inmon早在20世纪90年代就经常将Big Data挂在嘴边了. 然而，Big Data作为一个专有名词成为热点，主要应归功于近年来互联网、云计算、移动和物联网的迅猛发展.

[原]异常检测--综述

1. 异常点检测算法使用场景

2. 异常点检测算法常见类别

3.基于统计学的异常检测

（一）基于正态分布的一元离群点检测方法

（二）多元离群点的检测方法

4.基于矩阵分解的异常检测

（一）主成分分析（Principle Component Analysis）

（二）基于矩阵分解的异常点检测方法

（三）效果展示

5.基于神经网络Replicator Neural Networks

备注：

后向传播算法：

标准 BP 算法：

累积 BP 算法：

训练方法：

测试效果：

相关 [异常检测综述] 推荐：