更新于:04-03 16:00

有关[分析]分类推荐

人脸检测与识别的趋势与再

于04-22 00:00 - - dev
最近因为种种原因,这方面的知识有得到大家的认可和对其有很大的兴趣,所以今天想再一次分享这知识,让已明白的人更加深入理解,让初学者有一个好的开端与认知,谢谢大家的支持. 现在打开谷*公司的搜索器,输入 “face detect”,估计大家都能够想到,都是五花八门的大牛文章,我是羡慕啊. (因为里面没有我的一篇,我们实验室的原因,至今没有让我发一篇有点权威的文章,我接下来会写4张4A纸的检讨,去自我检讨下为什么.

[译] 使用 APK Analyzer 你的 APK

于04-21 00:00 - - dev
本文来自“天天P图攻城狮”公众号(ttpic_dev). 本文是对 《Analyze Your Build with APK Analyzer》 的翻译. Android Studio 2.2包含了APK Analyzer,通过它我们能够直观地看到APK的组成. 使用APK Analyzer不仅能够减少你花在debug上的时间,而且还能减少你的APK大小.

Android OOM案例

于04-14 19:07 - 美团点评技术团队 -
在Android(Java)开发中,基本都会遇到 java.lang.OutOfMemoryError(本文简称OOM),这种错误解决起来相对于一般的Exception或者Error都要难一些,主要是由于错误产生的root cause不是很显而易见. 由于没有办法能够直接拿到用户的内存dump文件,如果错误发生在线上的版本,分析起来就会更加困难.

[原]自学大数据:Hive基于搜狗搜索的用户日志行为

于08-29 14:58 - shifenglov -
”大数据时代“,“大数据/云计算”,“大数据平台”,每天听到太多的大数据相关的词语,好像现在说一句话不跟大数据沾边都不好意思说自己是做IT的. 可能这与整个IT圈子的炒作也有关联,某一个方面来看其实就是一营销术语. 很多朋友就想问,我想做大数据,但是没有这个条件,没有这个数据量,没有那么多业务场景,没有那多集群可以吗.

Flume+Spark+Hive+Spark SQL离线系统

于07-27 03:36 - ymh198816 -
前段时间把Scala和Spark一起学习了,所以借此机会在这里做个总结,顺便和大家一起分享一下目前最火的分布式计算技术Spark. 当然Spark不光是可以做离线计算,还提供了许多功能强大的组件,比如说,Spark Streaming 组件做实时计算,和Kafka等消息系统也有很好的兼容性;Spark Sql,可以让用户通过标准SQL语句操作从不同的数据源中过来的结构化数据;还提供了种类丰富的MLlib库方便用户做机器学习等等.

支付风控模型

于03-27 00:00 - - bigdata
接上一篇 支付风控数据仓库建设. 支付风控涉及到多方面的内容,包括反洗钱、反欺诈、客户风险等级分类管理等. 其中最核心的功能在于对实时交易进行风险评估,或者说是欺诈检测. 如果这个交易的风险太高,则会执行拦截. 由于反欺诈检测是在交易时实时进行的,在要求不能误拦截的同时,还有用户体验上的要求,即不能占用太多时间,一般要求风控操作必须控制在100ms以内,对于交易量大的业务,10ms甚至更低的性能要求都是必须的.

ElasticSearch聚合API

于04-11 03:18 - migrant620 - 搜索 Elasticsearch 分析 聚合
说完了ES的索引与检索,接着再介绍一个ES高级功能API – 聚合(Aggregations),聚合功能为ES注入了统计分析的血统,使用户在面对大数据提取统计指标时变得游刃有余. 同样的工作,你在hadoop中可能需要写mapreduce或hive,在mongo中你必须得用大段的mapreduce脚本,而在ES中仅仅调用一个API就能实现了.

[Java] Java 多线程案例

于03-19 10:48 - xsank -
现要从 hbase中导出 2016 年整年的,大约 10w只股票行情数据,数据总量约 100t. 汇总到 hdfs中供需求方使用. 已知数据量规模大概是 100t,那么单台机器处理肯定不是不行的,先不说大多数磁盘都没这么大,即便磁盘有这么大,单台机器处理对于内存和 cpu 要求也很高,所以我们将问题一般化,使用数量有限的低配机器.

追踪了783家创业公司五个月,了64.7万条数据,我们发现了10个有趣的现象

于03-10 08:36 - -
我们团队做了一个商业情报追踪和分析的工具,叫做NiucoData,中文名是纽扣数据. 在漫长的开发和测试中,我们先后添加了783家知名或半知名的创业公司用于测试数据(这是随机添加的小部分数据,只占我们我们数据库的0.001%,因此不具备广泛性,仅作参考). 从去年9月开始到今年2月,一共是5个月的时间,我们追踪到了大约六十万条信息.

常见邮件发送失败原因以及解决方法

于02-20 01:44 - 阿拉扫思密达 -
本文来自:http://www.maikongjian.com/style/info/shownews2.asp?id=439. 一.发到 sina.com 的邮件会被退回. 我发到 sina 的邮件会被退回,并提示"remote server said: 553 Spam Mail http://mail.sina.com.cn/FAQ.html";错误,怎么办.

JavaScript 启动性能瓶颈与解决方案

于02-13 14:28 - 王下邀月熊_Chevalier - javascript v8 性能优化
JavaScript 启动性能瓶颈分析与解决方案 翻译自 Addy Osmani 的. JavaScript Start-up Performance,从属于笔者的 Web 前端入门与工程实践. 本文已获得原作者授权,为InfoQ中文站特供稿件,首发地址为 这里;如需转载,请与InfoQ中文站联系.

中国移动企业短信通平台EMPP协议

于02-08 12:02 - herman_liu76 -
中国移动企信通地址:http://sms.sh.chinamobile.com/qxt/index.jsp.     最近要为手上一个项目设计短信发送,简单分析了一下,最终将使用中国移动企信通作为工具.     需要采用硬件设备,还要上机架,进行软件安装与配置,非常繁琐,并且成本比较高.     听某使用mas机的项目反映,延时比较严重,从几分钟,甚至出现过十几分钟的情况.

Adrian Stephens:预测2017 年移动通讯行业趋势

于01-02 05:12 - DinK - 电信产业 行业资讯 Adrian Stephens IEEE 802.11 移动通讯
本文作者是 IEEE 802.11 无线局域网工作组主席 Adrian Stephens,在即将迈入全新的 2017 年之际,他对未来移动通讯行业进行了一些预测,包括 Wi-Fi 网络的发展对未来 5G、物联网等领域里所产生的影响和应用前景. 对于业内人士来说,预测行业趋势总是一件值得去做的事情,因为你可以据此判断自己是否足够了解所处的行业.

关于产品的数据体系

于12-23 07:41 - shendao - 极客互联
今晚听了【产品壹佰讲堂】诸葛io产品总监于晓松关于《如何建设产品的数据分析体系》的分享,有些许感悟,记录如下:. 产品是一种抽象化标准化的解决方案,同时也是一种商业模式. 那么,与之对应的,一款成功的产品,就必须同时满足两个条件:一是帮助用户解决问题,创造价值,二是帮助企业赚钱或获取其他收益. 简单概括下,就是一款成功的产品必须同时具备用户价值和商业价值.

IOS崩溃日志

于12-21 07:16 - 苏小妖 - iphone ios xcode objective-c
  IOS分析定位崩溃问题有很多种方式,但是发布到AppStore的应用如果崩溃了,我们该怎么办呢. 通常我们都会在系统中接入统计系统,在系统崩溃的时候记录下崩溃日志,下次启动时将日志发送到服务端,比较好的第三方有umeng之类的. 今天我们来讲一下通过崩溃日志来分析定位我们的bug.   分析崩溃日志的前提是我们需要有 dYSM文件,这个文件是我们用archive打包时生成的 .xcarchive后缀的文件包.

师预测:增强现实设备将会取代iPhone

于12-17 15:57 - 黄晓闷 - 新闻
  Gene Munster 是一位在华尔街知名度相当高的苹果分析师,但是他的预测报告向来不怎么样. 比如,这位老兄曾坚持多年预测苹果“很快”会推出传说中的 iTV. 然而三年又三年,这么多年过去了一个苹果电视的零件都看不到影子. 好在,Gene Munster 已经决定不当分析师了,所以在离职之前,他有一番语重心长的话要对苹果说.

专访 GrowingIO 创始人张溪梦,数据可以发现哪些“惊天秘密

于12-17 18:02 - - Fintech
张溪梦,GrowingIO 创始人兼 CEO,曾是一位脑肿瘤外科医生,随后“弃医从文”,选择投身互联网大潮. 在美国,他曾担任 LinkedIn(领英)美国商业分析部高级总监,曾被评为“世界前十位前沿数据科学家”. 2015年,他回国创业,建立 GrowingIO. 作为“增长黑客”理论在中国的实践者,他试图通过对用户行为的精细分析,对互联网产品进行针对性的快速迭代,从而使客户出现指数型的增长.

使用python抓取并京东商品评论数据

于12-15 13:56 - 蓝鲸 - Python 数据抓取 爬虫
本篇文章是python爬虫系列的第三篇,介绍如何抓取京东商城商品评论信息,并对这些评论信息进行分析和可视化. 下面是要抓取的商品信息,一款女士文胸. 这个商品共有红色,黑色和肤色三种颜色, 70B到90D共18个尺寸,以及超过700条的购买评论. 京东商品评论信息是由JS动态加载的,所以直接抓取商品详情页的URL并不能获得商品评论的信息.

APK文件工具:AppMon

于11-22 06:01 - clouds - 工具 APK分析 APPMON
对手机恶意软件研究人员来说,有很多APP行为分析工具可以选择,在这里,我要向大家推荐的是AppMon,它可以通过二进制指令获取app程序运行记录,并显示调用函数和相关参数. AppMon使用了多平台动态框架环境Frida,Frida是一款基于python + javascript 的hook框架,适应android\ios\linux\win\osx等平台的脚本交互环境.

RTSP协议

于11-16 22:40 - caoshangpa -
        RTSP(Real Time Streaming Protocol)实时流传输协议,是TCP/IP协议体系中的一个基于文本的应用层协议,由哥伦比亚大学、网景和RealNetworks公司提交的IETF RFC2326标准. 该协议定义了一对多应用程序如何有效地通过IP网络传送多媒体数据.

交互设计师如何做竞品

于11-13 18:36 - shendao - 极客互联
今天我们来聊聊竞品分析,它并不是像人们认为的那样——有统一的模板,因为针对不同的岗位,做的竞品分析是不同的. 所以我的文章标题是: 交互设计师如何做竞品分析. 竞品分析是对产品、交互从业人员最基本的技能要求之一,很多刚入行的产品汪、交互喵首先要做的都是竞品分析,一来可以考考你的底子,二来可以锻炼你的逻辑思维.

使用R进行统计——回归

于11-08 14:16 - 蓝鲸 - R 回归分析
首先导入数据并创建名为lr_data的数据表. #读取并创建数据表 lr_data=data.frame(read.csv('lr_data.csv',header = 1)). 查看导入数据表的维度,结果显示456行,4列. #查看数据表维度 dim(lr_data) [1] 456 4.

数据平台系统架构

于11-05 07:49 - hyy044101331 -
      大数据技术是近几年发展比较繁荣的技术方向,出了很多优秀的开源项目,也有越来越多的公司投入大量人力在其中. 认识到数据的重要性,数据分析平台系统也成为数据平台重点建设的项目,数据分析被广泛应用到电商、金融、教育、医疗领域. 开源的OLAP数据分析引擎:. 1.2 wedata系统架构图. 已有 0 人发表留言,猛击->> 这里<<-参与讨论.

提升订单转化率,做好这五大数据就够了

于10-28 00:00 - - tuicool
电商平台的数据分析,应该关注五大关键数据指标和三个关键思路. 五大关键数据指标是活跃用户量、转化、留存、复购、GMV;. 三个关键思路是商品运营、用户运营和产品运营. 下面我会详细展开来讲具体分析方法. 现在很多电商运营团队缺少精细化运营和数据驱动的经验和意识,但是电商运营正在成为电商自身增长越来越重要的因素.

(转)关于施用full gc频繁的及解决

于10-21 05:10 - wbj0110 -
当频繁full gc时,jstack打印出堆栈信息如下:. 可以看到的确是在跑低价信息. 另外在应用频繁full gc时和应用正常时,也执行了如下2种命令:. sudo -u admin -H /opt/taobao/java/bin/jmap -histo:live `pgrep` > #your file path#(live会产生full gc).

深入解物联网操作系统(架构/功能/实例

于10-18 00:00 - - geek
1.       物联网的主要特点.                        i.             连接. 所谓连接,指的是各种各样的终端设备,都能够通过某种网络技术,连接到一个统一的网络上. 下一代的基础通信网络,包括未来的5G,通信网络架构重构等,为物联网提供泛连接网络是核心目标.

一篇文读懂19款数据软件,解救选择困难症

于10-18 03:56 - 小码哥 - 他山之石 数据库
欧阳辰,超过15年的软件开发和设计经验,目前就职于小米公司,负责小米广告平台的架构研发. 曾为微软公司工作10年,担任高级软件开发主管. 热爱架构设计和高可用性系统,特别对于大规模互联网软件的开发,具有丰富的理论知识和实践经验. 数据分析(Data Analytics)从来都不是一个寂寞的领域,每一个时代都赋予其新的内容.

如何在半小时搭建一个简单的日志平台

于09-28 03:43 - (●'◡'●) - IT技术 日志 架构
人们常常说数据如金,可是,能被利用起的数据,才是“金”. 而互联网的数据,常常以日志的媒介的形式存在,并需要从中提取其中的”数据”. 从这些数据中,我们可以做用户画像(每个用户都点了什么广告,对哪些开源技术感兴趣),安全审计,安全防护(如果1小时内登录请求数到达一定值就报警),业务数据统计(如开源中国每天的博客数是多少,可视化编辑格式和markdown格式各占比例是多少)等等.

师称iPhone 7要取代单反 你觉得如何

于09-17 13:19 - khatmu1988 - 新闻
  每次 iPhone 面世,总是会有一些设备将会步入“死亡”. 比如说 iPod 碰上了 CD 随身听,比如说 iPhone 埋没了 “dumb”手机,那么遭遇 iPhone 7 系列后会变成“过去式”的设备会有哪些呢. 也许会是耳机插孔,但是专家也提到,高端的单反相机也很有可能会因为 iPhone 7 Plus 的到来遭遇“危机”.

营销高手经验谈:谷歌工具是怎样毁了市场营销的

于08-12 12:45 - Admin - 精选 观点 Google 互联网 公司
美国Tech Crunch博主、营销专家塞缪尔·斯科特(Samuel Scott)8月7日撰文,指出Google Analytics(谷歌分析)工具误导网络营销从业者,并分析Google Analytics误导网络营销的具体方式. 那些生活在高科技世界里,并把“社会化媒体营销”、“Facebook营销”以及“内容营销”这种词语挂在嘴边的营销人员,其实并不真正地理解营销策略、营销渠道与营销内容之间的基本区别.