更新于:07-09 10:57

有关[分析]分类推荐

Linux IO 监控与深入分析 - Jamin Zhang

于06-20 20:43 - -
Linux IO 监控与深入分析. 接昨天电话面试,面试官问了系统 IO 怎么分析, 当时第一反应是使用 iotop 看系统上各进程的 IO 读写速度, 然后使用 iostat 看 CPU 的 %iowait 时间占比,(%iowait:CPU等待输入输出完成时间的百分比,%iowait的值过高,表示硬盘存在I/O瓶颈).

Nginx 502 Bad Gateway问题分析与踩过的坑 - 凝雨 - Yun

于06-11 10:48 - -
我相信使用Nginx的都会遇到过502 504 这种bad gateway错误,下面我把碰到这个问题分析过程记录并分享出来. 从字面上的意思理解,nginx从upstream没有接受到信息,第一感觉就是连接被close. 超时的话一般错误信息是 timeout. 下面是尝试解决这个问题尝试过的手段.

(转)服务器性能指标(一)——负载(Load)分析及问题排查

于05-21 21:03 - -
原创: Hollis Hollis. 负载(load)是linux机器的一个重要指标,直观了反应了机器当前的状态. 来看下负载的定义是怎样的:. It conventionally appears in the form of three numbers which represent the system load during the last one-, five-, and fifteen-minute periods.(wikipedia).

[原]文本分析论文资料

于05-11 15:38 - u011239443 -
《一揽子高效文本分类技巧》论文阅读. 计算字符串相似度在机器学习领域是一个非常基本的操作,主要用在信息检索,自然语言处理,生物信息学等领域. 本算法支持Levenshtein Distance,Longest Common SubString,String Subsequence Kernel,Cosine,simhash_hamming五种相似度计算方式.

presto、druid、sparkSQL、kylin的对比分析,如性能、架构等,有什么异同? - 知乎

于05-09 16:02 - -
这几个框架都是OLAP大数据分析比较常见的框架,各自特点如下:. presto:facebook开源的一个java写的分布式数据查询框架,原生集成了Hive、Hbase和关系型数据库,Presto背后所使用的执行模式与Hive有根本的不同,它没有使用MapReduce,大部分场景下比hive快一个数量级,其中的关键是所有的处理都在内存中完成.

用 Python 进行股票分析,有什么好的入门书籍或者课程吗?

于04-19 14:00 - 景略集智 -
虽然这个问题也有些年头了,但相信现在仍然会有不少朋友对如何用Python分析股票很感兴趣,所以今天我们就分享一篇美国数据科学专家William Koehrsen 利用Python股票分析工具Stocker的实战教程. 相信本文会对你在这个问题上有不少启发. 对于数据科学研究来说,海量数据和免费的开源工具包很容易得到.

CBoard 分析工具选型 · yzhang921/CBoard Wiki · GitHub

于04-13 17:50 - -
数据可视化是BI生命周期里面非常重要的一个环节,当前数据可视化的几种常见模式如下:. 商业BI套件 能够提供BI生命周期全套的解决方案,业界比较知名BI套件老牌的有IBM的Cognos、SAP的BO、Oracle的BIEE,以及新生军Tableau、QlikView等等,这些产品前端可视化都做得非常强大,报表设计、Dashboard设计、Report邮件发送、OLAP分析都不在话下.

消息中间件选型分析——从Kafka与RabbitMQ的对比来看全局

于04-03 23:31 - - 技术杂记 转载 RabbitMQ Kafka
有很多网友留言:公司要做消息中间件选型,该如何选. 消息选型的确是一个大论题,实则说来话长的事情又如何长话短说. 对此笔者专门撰稿一篇内功心法: 如何看待消息中间件的选型,不过这篇只表其意未表其行,为了弥补这种缺陷,笔者最近特意重新撰稿一篇,以供参考. 温馨提示:本文一万多字,建议先马(关注)后看.

Java 堆内存溢出梗概分析

于03-30 10:13 - -
原文:Java Out of Memory Heap Analysis. 链接: https://dzone.com/articles/java-out-of-memory-heap-analysis. 译者:dreamanzhao, 无若. 任何使用过基于 Java 的企业级后端应用的软件开发者都会遇到过这种低劣、奇怪的报错,这些报错来自于用户或是测试工程师: java.lang.OutOfMemoryError:Java heap space.

开源的BI交互式多维报表设计和分析工具cboard

于03-08 09:16 - -
Support to connect one of the most popular open source multi-dimensional analysis of products Saiku2, and will be able to selectively create data and graphics.

运营商是怎么分析出数据通道中特定 App 的数据流量的? - 知乎

于01-26 11:47 - -
主要是通过DPI(Deep Packet Inspection)来实现的,一般称之为「深度报文检测」或「深度包检测」. 从字面意思来讲,所谓「深度」是相对于普通的报文检测而言的. 普通的报文检测仅分析IP包的层4以下5元素:源地址、目的地址、源端口、目的端口及协议类型. 而DPI除了对以上5元素进行分析外,增加了应用层分析,用来识别各种应用及其内容.

关于Python数据分析,这里有一条高效的学习路径

于01-21 20:29 - -
谷歌的数据分析可以预测一个地区即将爆发的流感,从而进行针对性的预防;淘宝可以根据你浏览和消费的数据进行分析,为你精准推荐商品;口碑极好的网易云音乐,通过其相似性算法,为不同的人量身定制每日歌单……. 数据正在变得越来越常见,小到我们每个人的社交网络、消费信息、运动轨迹……,大到企业的销售、运营数据,产品的生产数据,交通网络数据…….

利用WireShark对听音乐的过程中传送的数据包进行分析

于01-17 13:00 - wujiaming123 - 工具 Wireshark 数据包
相信现在的每一个人都在网络上听过音乐,那么,在我们听音乐的过程中,究竟发生了什么呢. 下面我就利用 WireShark 给大家分析一下. 打开wireshark,选择本地连接进行监听. 之后,打开一个音乐软件,随便点击一首歌曲,然后播放这首歌曲. 等待音乐播放了十几秒之后,停止wireshark的监听,现在wireshark已经监听到许多的数据包了,如下图.

为什么70%的成功者都是性格内向?分析太到位

于01-05 20:22 - -
世界上70% 以上的成功者其实是性格内向的人. 内向对一个人的成功是有一定的影响因素,爱因斯坦、比尔盖茨、巴菲特、村上春树等都是内向性格的人, 内向性格的人为什么容易成功. 成功人士是能言善辩,面对大众款款而谈,在大多数人眼中外向的人似乎比内向的人更容易成功. 然而据调查显示,成功者中内向者所占比例大大高于外向性格.

使用python+机器学习方法进行情感分析(详细步骤) - 51CTO.COM

于01-05 17:49 - -
【限时免费】年底最强一次云计算大会,看传统、社区、互联网企业如何碰撞. 不是有词典匹配的方法了吗?怎么还搞多个机器学习方法. 因为词典方法和机器学习方法各有千秋. 机器学习的方法精确度更高,因为词典匹配会由于语义表达的丰富性而出现很大误差,而机器学习方法不会. 无论是主客观分类还是正负面情感分类,机器学习都可以完成任务.

分布式事务中间件 TCC-Transaction 源码分析 —— 项目实战

于01-02 00:00 - - geek
摘要: 原创出处 http://www.iocoder.cn/TCC-Transaction/http-sample/「芋道源码」欢迎转载,保留摘要,谢谢. 本文主要基于 TCC-Transaction 1.2.3.3 正式版. 4.2 Confirm / Cancel 阶段. 微信公众号:【芋道源码】有福利:.

智能投放系统之场景分析最佳实践

于12-29 22:23 - 美团点评技术团队 -
新美大平台作为业内最大的O2O的平台,以短信/push作为运营手段触达用户的量级巨大,每日数以千万计. 美团点评线上存在超过千万的POI,覆盖超过2000城市、2.5万个后台商圈. 在海量数据存在的前提下,实时投放的用户在场景的选择上存在一些困难,所以我们提供对场景的颗粒化查询和智能建议,为用户解决三大难题:.

缓存击穿问题分析

于12-26 14:54 - ludizhang -
缓存一般作为RDS的前置组件,将常用的资源缓存,用来减少RDS的读取压力,也是诸多系统常用的一种方案,如果允许访问缓存失败直接访问数据库,然后再将数据回写到缓存中,那么就会存在缓存击穿的问题,. 缓存击穿:缓存中的数据未被命中,进而请求直接对数据库进行查询,当大量的类似查询瞬间出现,就会出现数据库的压力爆炸甚至引起数据库的雪崩,本质就是一种缓存失效引发的极端问题.

Word2vec之情感语义分析实战(part3)--利用分布式词向量完成监督学习任务

于12-16 18:55 - u010665216 -
这篇博客将基于前面一篇博客 Part2做进一步的探索与实战. demo代码与数据: 传送门. 前面我们训练了单词的语义理解模型. 如果我们深入研究就会发现,Part2中训练好的模型是由词汇表中单词的特征向量所组成的. 这些特征向量存储在叫做syn0的numpy数组中:. 很明显这个numpy数组大小为(16490,300)分别代表词汇表单词数目及每个单词对应的特征数.

推荐系统之用户行为分析

于12-14 08:00 - - dev
基于用户行为的推荐,在学术界名为协同过滤算法. 协同过滤就是指用户可以齐心协力,通过不断地和网站互动,使 自己的推荐列表能够不断过滤掉自己不感兴趣的物品,从而越来越满足自己的需求. 用户行为在个性化推荐系统中一般分两种——显性反馈行为(explicit feedback)和隐性反馈 行为(implicit feedback).

如何开始数据分析

于12-11 20:06 - 精算狗 - IT技术 数据分析
菜鸟数据科学家、分析师,以及刚刚接触数据科学的管理人员,通常有这样的疑问. 他们的老板都在承受着压力,得证明花在系统上去收集、存储及组织资料的钱(更不用说还有那些花在数据科学家身上的钱)是有回报的. 他们偶尔很幸运——待解决的问题可能非常明确,而且被深入研究过(例如,预测哪个客户可能会取消手机合约).

集中式日志分析平台

于12-09 07:29 - -
传统的Web开发中,日志可能并不被重视,只有应用出现问题后,才会适时性的去看一眼. 而且日志的储存方式也很简单,直接写入一个文本文件或者扔到数据库中就了事了. 这样对于单机应用来说没有什么不可以的,可是当系统架构分布式后,官网、论坛、社交、交易等各个大大小小的子系统越来越多,再加上操作系统、应用服务、业务逻辑等等,日志的管理与查看就越发的麻烦,面对大量的日志数据而且又是分布在各个不同的机器甚至不同的机房,如果我们还是按照传统的方式登录到某一台机器上去查看日志,然后再汇总起来,再做个跨机房的排序,那这样感觉就太糟糕了.

App数据分析到底要分析什么

于12-07 08:00 - - bigdata
按大众化的分法,产品的生命周期(PLC, Product Lifetime Cycle)分为初创期、成长期、成熟期、衰退期,在产品的每个阶段,数据分析的工作权重和分析重点有所区别,下面按阶段结合案例来聊聊. 初创期的重点在于验证产品的核心价值,或者说验证产品的假设:通过某种产品或服务可以为特定的人群解决某个问题.

获取某微信公众号所有文章且进行分析 - 简书

于11-27 11:18 - -
获取微信公众号所有历史文章链接地址. 微信公众平台上面的公众号很多,里面各种文章都有,很多很杂乱. 不过在这些文章中,肯定是会存在自己所认为的. 所以如果我自己能够编写出一个程序,用来获取自己喜欢的. 某个微信公众号上的文章,获取文章的. 点赞量,然后加以简单的数据分析,那么最终得到的文章列表,肯定就会是比较好的文章了.

Spark Streaming 1.6 流式状态管理分析 - 简书

于11-26 09:25 - -
Spark 1.6发布后,官方声称流式状态管理有10倍性能提升. 这篇文章会详细介绍Spark Streaming里新的流式状态管理. 在流式计算中,数据是持续不断来的,有时候我们要对一些数据做跨周期(Duration)的统计,这个时候就不得不维护状态了. 而状态管理对Spark 的 RDD模型是个挑战,因为在spark里,任何数据集都需要通过RDD来呈现,而RDD 的定义是一个不变的分布式集合.

使用 Tensorflow 构建 CNN 进行情感分析实践 - 腾讯云社区 - 腾讯云

于10-18 17:21 - -
Web挖掘中的情感分析类问题,其实是一个分类问题. 而CNN可以用来处理分类任务,就是在最终的softmax函数计算属于各个类的概率,并归属到概率最大的类. 本次实验参照的是Kim Yoon的论文Convolutional Neural Networks for Sentence Classification.

Python做文本情感分析之情感极性分析 - 简书

于10-18 17:09 - -
「NLP」最为目前及其火热的一个领域,已经逐渐渗透进越来越多产业的各项业务中,不知死活的胖子决定对常用的应用功能挨个进行尝试,死活不论……. 「情感极性分析」是对带有感情色彩的主观性文本进行分析、处理、归纳和推理的过程. 按照处理文本的类别不同,可分为基于新闻评论的情感分析和基于产品评论的情感分析.

分析师:自动驾驶汽车或许能帮助降低房价

于10-10 17:55 - 小狐狸 - 资讯编译
【TechWeb报道】10月10日消息,据圣迭戈联合论坛报报道,近几个月来,加州议员们采取了各种各样的措施,以降低美国的住房成本,但效果有限. 一些分析人士预计,无人驾驶汽车或许能帮助降低房价. 圣地亚哥房地产分析师Gary London最近发布的一份报告显示,由GPS、雷达和传感软件控制的自动驾驶汽车可以通过限制停车空间需求来降低住房建设成本.

不学点数据分析怎么混

于10-08 14:49 - shendao - 极客互联
今天简单分享一下数据分析的学习心得. 何谓数据分析:用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化的开发数据的功能,发挥数据的作用. 数据分析的目的是把隐藏在一批杂乱无章的数据背后的信息集中和提炼出来,总结出所研究对象的规律. 数据分析分为:描述性数据分析,探索性数据分析,验证性数据分析.

运营支撑系统(BSS)在面向物联网IoT业务场景的模型简要分析和设计

于09-17 21:33 - lottons88 -
BSS运营支撑系统(主要指电信运营商),通常都是为了支撑个人客户的业务运营. 虽然在业务运营上也面向集团客户,但是总体上来说,业务的特性总结归纳为2C的业务场景. 而当前运营商在面向物联网的业务运营下,主要是以2B的业务场景. 运营商实际并不会直接面向最终的客户,而是通过其他业务的运营企业的合作或者买卖关系提供,即是一种B2B2C的场景.