更新于:04-14 11:43

有关[分析]分类推荐

mXtract:一款功能强大的内存数据提取&分析工具

于04-20 15:00 - Alpha_h4ck - 工具 mXtract 内存数据提取
mXtract是一款开源的Linux安全工具,该工具可从目标系统的内存中提取并分析数据. 从本质上来说,mXtract是一款防御端渗透测试工具,它的主要功能是扫描目标系统内存并尝试通过正则表达式来从中提取出私钥、IP和用户密码等敏感数据. 请记住,扫描结果跟正则表达式的质量息息相关…. Verbose模式扫描单个IP正则式,扫描单个数据段,显示整个扫描进程信息以及扫描的环境文件.

机器学习算法之主成分分析PCA

于03-05 18:21 - 标点符 - 数据
主成分分析(Principal components analysis,以下简称PCA)是最重要的降维方法之一. 在数据压缩消除冗余和数据噪音消除等领域都有广泛的应用. 一般我们提到降维最容易想到的算法就是PCA,下面我们就对PCA的原理做一个总结. 首先考虑一个问题:对于正交属性空间中的样本点,如何用一个超平面(直线的高维推广)对所有样本进行恰当的表达.

根因分析初探:一种报警聚类算法在业务系统的落地实施

于03-04 18:57 - 美团技术团队 -
众所周知,日志是记录应用程序运行状态的一种重要工具,在业务服务中,日志更是十分重要. 通常情况下,日志主要是记录关键执行点、程序执行错误时的现场信息等. 系统出现故障时,运维人员一般先查看错误日志,定位故障原因. 当业务流量小、逻辑复杂度低时,应用出现故障时错误日志一般较少,运维人员一般能够根据错误日志迅速定位到问题.

我曾经认识一位分析师 (转载)

于02-16 18:44 - xxx888 -
发信人: xxx888 (小小小), 信区: Joke. 标 题: 我曾经认识一位分析师. 发信站: 水木社区 (Sat Feb 16 18:44:40 2019), 站内. 【 以下文字转载自 Stock 讨论区 】. 发信人: xyy888 (小牙牙), 信区: Stock. 标 题: 我曾经认识一位分析师.

商业智能BI主流趋势下的竞品分析和运营思路浅析

于02-10 09:03 - cCcrazys - 产品运营 3年 中级 智能BI
本文主要从发展趋势的角度,作为评价维度,来比较几款竞品的差异,同时对于新趋势驱动下的产品运营提出一些个人浅显的思路和看法. 数据产品市场同质化严重,例如可视化领域,多个公司产品功能和界面设计都大致类似. 所以传统的对于功能架构和UI的竞品分析意义不大,作为快速增长的市场,web端产品的用户体验很容易模仿,而整体研发和运营战略则决定了核心竞争力.

HBase写吞吐场景资源消耗量化分析及优化

于01-16 17:18 - 有赞技术 - 安全 人工智能
HBase 是一个基于 Google BigTable 论文设计的高可靠性、高性能、可伸缩的分布式存储系统. 网上关于 HBase 的文章很多,官方文档介绍的也比较详细,本篇文章不介绍HBase基本的细节. 本文从 HBase 写链路开始分析,然后针对少量随机读和海量随机写入场景入手,全方面量化分析各种资源的开销, 从而做到以下两点:.

TorPCAP:Tor网络取证分析技术

于01-14 15:00 - secist - 资讯 tor TorPCAP
发往Tor网络的未加密网络流量,会通过运行Tor客户端计算机(如Tor浏览器)上的localhost TCP sockets来传送流量. 在本文中,我将向大家展示如何将具有localhost流量的PCAP文件,加载到 NetworkMiner 中并可视化匿名的Tor浏览. 我们称这种技术为TorPCAP.

[转]排名算法(二)--淘宝搜索排序算法分析

于12-31 16:36 - App_12062011 -
原文:https://blog.csdn.net/u011966339/article/details/78052569 . 淘宝搜索排序的目的是帮助用户快速的找到需要的商品. 从技术上来说,就是在用户输入关键词匹配到的商品中,把最符合用户需求的商品排到第一位,其它的依次排在后续相应的位置. 为了更好的实现这个目标,算法排序系统基本按三个方面来推进:.

U-boot引导内核流程分析

于12-23 00:00 - - geek
U-boot引导内核流程分析. 当U-boot完成重定位和初始化外设后,它将正式进入工作状态,可以加载内核镜像到DDR的链接地址中了,具体的地址也可以通过bootcmd这个环境变量来指定,内核镜像有两种加载方式:. 一种是通过tftp将镜像文件直接引导入DDR中内核的链接地址(对于s5pv210来说是30008000),这种方法很适合调试.

看我如何分析并渗透WebSocket和Socket.io

于12-02 13:00 - Covfefe - WEB安全 websocket 渗透
WebSocket是一种允许浏览器和服务器建立单个TCP连接然后进行全双工异步通信的技术. 由于它允许实时更新,而浏览器也无需向后台发送数百个新的HTTP polling请求,所以对于web程序来说,WebSocket非常流行. 这对于测试者来说是不好的,因为对WebSocket工具的支持不像HTTP那样普遍,有时候会更加复杂.

【Python量化】手把手教你用python做股票分析入门

于11-28 08:06 - -
python金融量化  已获得授权. 关注可了解更多的金融与Python干货. 目前,获取股票数据的渠道有很多,而且基本上是免费的,比如,行情软件有同花顺、东方财富等,门户网站有新浪财经、腾讯财经、和讯网等. Python也有不少免费的开源api可以获取交易行情数据,如pandas自带的库,tushare和baostock等.

智能视频分析系统_视频智能分析漫谈-博客-云栖社区-阿里云

于11-12 14:46 - -
  从世纪九十年代开始,美国的VSAM项目中进行视频监控的数据化研究以来,视频监控的智能化经过了二十年的发展,到现在已经发生了巨大的变化,智能分析技术也从传统的模式识别到机器学习再到现在家喻户晓的深度学习经历了多个阶段的发展. 而当前深度学习的逐渐成熟让很多曾经尚未到达实用阶段的应用逐渐具备了可用性,典型的如人脸识别,高密度的人员统计等;也让很多已经成熟的应用具有更高的准确度,如车牌、车型识别、行为识别等等.

[转]GeoHash原理分析

于11-02 09:50 - tenfyguo -
机机是个好动又好学的孩子,平日里就喜欢拿着手机地图点点按按来查询一些好玩的东西. 某一天机机到北海公园游玩,肚肚饿了,于是乎打开手机地图,搜索北海公园附近的餐馆,并选了其中一家用餐. 饭饱之后机机开始反思了,地图后台如何根据自己所在位置查询来查询附近餐馆的呢. 苦思冥想了半天,机机想出了个方法:计算所在位置P与北京所有餐馆的距离,然后返回距离<=1000米的餐馆.

[译] OpenCV vs Dlib 人脸检测比较分析

于10-24 00:00 - - dev
点击我爱计算机视觉标星,更快获取CVML新技术. 人脸检测是计算机视觉最典型的应用之一,早期OpenCV的logo就是Haar人脸检测的示意图. 很多人的第一个OpenCV学习目标就是跑通Haar级联人脸检测,Dlib库在业内开始流行很大程度上是因为其HOG-SVM人脸检测比OpenCV Haar的好,而近年来OpenCV和Dlib均已包含基于深度学习的人脸检测算法实现.

App Store Top 1000 关键词分析

于10-08 09:20 - 标点符 - 网络营销 应用市场
做这个分析的主要目的是分析用户的搜索习惯及用户的需求方向,寻找可能的机会. 以下分析是7月初进行的,数据比较老,供参考. 在Top 1000的关键词中,82% 是品牌词,足见品牌(口碑)对应App的下载量还是非常的重要. 而另外18%的非品牌词也展现了一些打造品牌的机会(用户在该品类下还没有产生思维定势,新的App还存在一定的机会),以下为另外18%的非品牌关键词:.

日益增加的移动诈骗攻击分析简报

于10-05 15:00 - Alpha_h4ck - 终端安全 资讯 移动设备安全 网络诈骗
移动设备,早就已经成为了攻击者的主要目标,因此移动端诈骗攻击的活动愈加频繁也就不足为奇了. 目前,有大约58%的数字交易活动是通过移动端设备发起的,而且现在的网络攻击活动中有1/3也是针对移动端设备的. 在美国就更加严重了,每年全球针对移动端的诈骗攻击增长率约为24%,但美国的同类攻击增长率每年约为44%,你们说惨不惨….

Databus架构分析与初步实践(for mysql) | 网易乐得技术团队

于09-21 14:40 - -
Databus是一个低延迟、可靠的、支持事务的、保持一致性的数据变更抓取系统. 由LinkedIn于2013年开源. Databus通过挖掘数据库日志的方式,将数据库变更实时、可靠的从数据库拉取出来,业务可以通过定制化client实时获取变更并进行其他业务逻辑. 数据传输能保证顺序性和至少一次交付的高可用性.

限流降级神器-哨兵(sentinel)原理分析

于09-20 20:43 - -
Sentinel 是阿里中间件团队开源的,面向分布式服务架构的轻量级高可用流量控制组件,主要以流量为切入点,从流量控制、熔断降级、系统负载保护等多个维度来帮助用户保护服务的稳定性. 大家可能会问:Sentinel 和之前常用的熔断降级库 Netflix Hystrix 有什么异同呢. Sentinel官网有一个对比的文章,这里摘抄一个总结的表格,具体的对比可以点此 链接 查看.

使用Python进行相关性分析

于09-17 18:34 - 标点符 - 数据科学 程序开发 Python
在数据分析时,经常会针对两个变量进行相关性分析. 在Python中主要用到的方法是pandas中的corr()方法. corr():如果由数据框调用corr函数,那么将会计算每个列两两之间的相似度,返回DataFrame. corr(other):如果由序列调用corr方法,那么只是该序列与传入的序列之间的相关度,返回一个数值型,大小为相关度.

[分享发现] 汉语中的词频及笔画数分布规律探析

于09-15 12:59 - metaquant -
一篇汉字词频与笔画数规律的数据分析小文,和大家交流,也请大佬们多指教,V2EX 不能很好的显示数学公式,所以贴上自己的博文地址和 GitHub 仓库地址:. 博文地址: https://md.metaquant.org/2018/words.html. notebook 地址: https://github.com/sorrowise/chinese_data_analysis/blob/master/chinese_data_analysis_CH.ipynb.

流行 iOS Apps 被发现将用户位置数据发送给第三方数据分析公司

于09-08 20:04 - -
GuardianApp 的安全研究人员 发现,数十款流行 iOS Apps 被发现会将用户位置数据发送给第三方数据分析公司. 这些应用都需要位置数据才能正常工作,它们是气象、交友或健身类应用,而与第三方公司分享数据可以为免费应用产生收入. 这些应用收集的数据包括低功耗蓝牙信标数据,GPS 经维度数据,Wi-Fi SSID 和 BSSID,部分应用还收集加速计,广告标识符,电池状态和蜂窝网络信息等.

Uber 的实时数据分析系统架构 - 网站架构札记

于09-03 15:44 - -
Uber 实时系统的 Use case:. 举一个更详细些的例子,UberEATS 是 Uber 的外卖服务. 实时系统也为这个功能估算送餐时间. 所有来自乘客和司机的事件 event ,由 Kafka 收集. Kafka 使用 Pub-sub 的订阅发布模式. Uber 整个系统中各个 microservice 之间的通信也通过了 Kafka.

金融数据分析与挖掘具体实现方法 -1 - 汪凡 - 博客园

于08-29 07:07 - -
有人让我写一下关于数据挖掘在金融方面的应用,再加上现在金融对数据方面的要求不断提高,准备用两篇随笔来做个入门总结. 首先,在看这篇随笔以前稍微补充一点金融方面的知识,因为我不是金融专业的,以下补充知识来自互联网与个人整理,欢迎批评指正并补充说明. 1 先来了解一下什么是金融市场呢. 通常狭义的金融市场特指有价证券(股票、债券)发行和流通的场所.

Kylin在马蜂窝数据分析团队的应用实战

于08-24 14:13 - -
AI 前线导读:马蜂窝大数据平台自 2017 年下半年引入 Apache Kylin 以来,极大的提升了数据分析师对于数据探索的效率. 因为使用了 Apache Kylin,数据分析师可以直接查询大数据、无需排队、亚秒级响应,整体开发效率提高了 10 倍以上. 更多优质内容请关注微信公众号“AI 前线”(ID:ai-front).

Spark数据挖掘-基于 LSA 隐层语义分析理解APP描述信息(2) - clebeg的个人空间 - 开源中国

于08-11 18:55 - -
Spark数据挖掘-基于 LSA 隐层语义分析理解APP描述信息(2). Spark 通过调用 RowMatrix 的 computeSVD 方法会得到三个重要的矩阵 U、S、V , 而且:原始矩阵 近似等于 U * S * V. V: 每一行表示单词,列表示概念,矩阵的值表示单词在概念里面的重要程度.

Spark数据挖掘-基于 LSA 隐层语义分析理解APP描述信息(1) - clebeg的个人空间 - 开源中国

于08-11 18:55 - -
Spark数据挖掘-基于 LSA 隐层语义分析理解APP描述信息(1). 结构化数据处理比较直接,然而非结构化数据(比如:文本、语音)处理就比较具有挑战. 对于文本现在比较成熟的技术是搜索引擎,它可以帮助人们从给定的词语中快速找到包含关键词的文本. 但是,一些情况下人们希望找到某一个概念的文本,而不关心文本里面是否包含某个关键词.

广东移动:终端行业分析报告

于08-09 23:45 - DinK - 智能手机 分析报告 广东移动 终端行业 终端行业分析报告
1)相较于第一季度,第二季度市场略有缩小. 2)华为表现不俗,市场占比,用户忠诚度均优于其他品牌. 3)选择在6-12月内的换机用户比例有较大幅度增长. 4)华为、苹果、OPPO、VIVO四大品牌中超50%的用户忠诚于原品牌. 5)用户更爱换至安卓机,流向苹果用户数量减少. (一)手机市场总洞察:第二季度销量下滑,华为超过苹果,iPhone以及OPPO机型表现出色  .

Linux IO 监控与深入分析 - Jamin Zhang

于06-20 20:43 - -
Linux IO 监控与深入分析. 接昨天电话面试,面试官问了系统 IO 怎么分析, 当时第一反应是使用 iotop 看系统上各进程的 IO 读写速度, 然后使用 iostat 看 CPU 的 %iowait 时间占比,(%iowait:CPU等待输入输出完成时间的百分比,%iowait的值过高,表示硬盘存在I/O瓶颈).

Nginx 502 Bad Gateway问题分析与踩过的坑 - 凝雨 - Yun

于06-11 10:48 - -
我相信使用Nginx的都会遇到过502 504 这种bad gateway错误,下面我把碰到这个问题分析过程记录并分享出来. 从字面上的意思理解,nginx从upstream没有接受到信息,第一感觉就是连接被close. 超时的话一般错误信息是 timeout. 下面是尝试解决这个问题尝试过的手段.

(转)服务器性能指标(一)——负载(Load)分析及问题排查

于05-21 21:03 - -
原创: Hollis Hollis. 负载(load)是linux机器的一个重要指标,直观了反应了机器当前的状态. 来看下负载的定义是怎样的:. It conventionally appears in the form of three numbers which represent the system load during the last one-, five-, and fifteen-minute periods.(wikipedia).