更新于:06-11 13:30

有关[分析]分类推荐

爱奇艺短视频分类技术解析

于06-12 11:38 - 爱奇艺技术产品团队 -
近年来,短视频领域一直广受关注,且发展迅速. 每天有大量UGC短视频被生产、分发和消费,为生产系统带来了巨大的压力,其中的难点之一就是为每个短视频快速、准确地打上标签. 为了解决人工编辑的时效和积压问题,自动化标签技术成为各大内容领域公司都非常关注的关键课题. 短视频大规模层次分类作为内容理解技术的一个重要方向,为爱奇艺的短视频智能分发业务提供着强力支持,其输出被称为“类型标签”.

大数据分析界的“神兽”Apache Kylin有多牛? – lxw的大数据田地

于05-26 09:24 - -
1.Apache Kylin是什么. 在现在的大数据时代,越来越多的企业开始使用Hadoop管理数据,但是现有的业务分析工具(如Tableau,Microstrategy等)往往存在很大的局限,如难以水平扩展、无法处理超大规模数据、缺少对Hadoop的支持;而利用Hadoop做数据分析依然存在诸多障碍,例如大多数分析师只习惯使用SQL,Hadoop难以实现快速交互式查询等等.

拼团玩法分析:社交电商爆红背后的获客思路

于05-23 11:50 - 人人秀 - 产品运营 1年 初级 拼团 社交电商
拼团这个玩法为什么有这么大的魔力,可以吸引这么多企业投入巨大的人力物力发展. 近期关注电商行业的朋友们一定经常看到这种新闻:. 苏宁易购启动2019年货购物节,同时苏宁小店即将上线社区拼团服务,并要在全国招募100000个团长. 京东小程序悄然上线了“友家铺子”,定位于“京东官方推出的社区购物平台”,主攻二三线城市社区团购市场;.

[译]Go性能分析工具工具和手段

于05-22 16:37 - - Go
翻译自 Basics of benchmarking, profiling and tracing with Go,作者对Go性能分析的工具和手段做了一个很好的总结. 这篇文档提供了Go提供的测量性能和收集运行时信息的工具的概览. 它不是一个关于基准测试、性能分析和跟踪的详细教程. 所以这篇文档也可以看成是一篇备忘录.

电商营销工具之优惠券设计思路分析

于05-17 16:28 - 人人秀 - 产品设计 1年 优惠券设计 初级
本文结合实际经验,与大家分享一下优惠券相关产品的设计思路,一起来看看~. 又到了一年618,现在的你是不是已经在各大电商平台开始囤积各种优惠券,什么满减券、折扣券、整点券等,先不管券到底能干嘛,先统统领了再说. 于是手机各种定时抢券,等到购物的时候发现,领的券99%都不能用,不是商品不符合就是券已过期.

7000 字深度总结:运营必备的 15 个数据分析方法

于04-29 20:19 - Alice - 数据分析 2年 GrowingIO 初级
这篇文章来自 GrowingIO 联合创始人 & 运营副总裁陈明先生,全文总结了 15 个运营必备的数据分析方法论. 不论是刚刚入行的萌新,还是深耕多年的老司机,这篇深度总结,都值得你再次回顾. 提起数据分析,大家往往会联想到一些密密麻麻的数字表格,或是高级的数据建模手法,再或是华丽的数据报表. 其实,“ 分析 ”本身是每个人都具备的能力,比如根据股票的走势决定购买还是抛出;依照每日的时间和以往经验选择行车路线;购买机票、预订酒店时,比对多家的价格后做出最终选择.

mXtract:一款功能强大的内存数据提取&分析工具

于04-20 15:00 - Alpha_h4ck - 工具 mXtract 内存数据提取
mXtract是一款开源的Linux安全工具,该工具可从目标系统的内存中提取并分析数据. 从本质上来说,mXtract是一款防御端渗透测试工具,它的主要功能是扫描目标系统内存并尝试通过正则表达式来从中提取出私钥、IP和用户密码等敏感数据. 请记住,扫描结果跟正则表达式的质量息息相关…. Verbose模式扫描单个IP正则式,扫描单个数据段,显示整个扫描进程信息以及扫描的环境文件.

机器学习算法之主成分分析PCA

于03-05 18:21 - 标点符 - 数据
主成分分析(Principal components analysis,以下简称PCA)是最重要的降维方法之一. 在数据压缩消除冗余和数据噪音消除等领域都有广泛的应用. 一般我们提到降维最容易想到的算法就是PCA,下面我们就对PCA的原理做一个总结. 首先考虑一个问题:对于正交属性空间中的样本点,如何用一个超平面(直线的高维推广)对所有样本进行恰当的表达.

根因分析初探:一种报警聚类算法在业务系统的落地实施

于03-04 18:57 - 美团技术团队 -
众所周知,日志是记录应用程序运行状态的一种重要工具,在业务服务中,日志更是十分重要. 通常情况下,日志主要是记录关键执行点、程序执行错误时的现场信息等. 系统出现故障时,运维人员一般先查看错误日志,定位故障原因. 当业务流量小、逻辑复杂度低时,应用出现故障时错误日志一般较少,运维人员一般能够根据错误日志迅速定位到问题.

我曾经认识一位分析师 (转载)

于02-16 18:44 - xxx888 -
发信人: xxx888 (小小小), 信区: Joke. 标 题: 我曾经认识一位分析师. 发信站: 水木社区 (Sat Feb 16 18:44:40 2019), 站内. 【 以下文字转载自 Stock 讨论区 】. 发信人: xyy888 (小牙牙), 信区: Stock. 标 题: 我曾经认识一位分析师.

商业智能BI主流趋势下的竞品分析和运营思路浅析

于02-10 09:03 - cCcrazys - 产品运营 3年 中级 智能BI
本文主要从发展趋势的角度,作为评价维度,来比较几款竞品的差异,同时对于新趋势驱动下的产品运营提出一些个人浅显的思路和看法. 数据产品市场同质化严重,例如可视化领域,多个公司产品功能和界面设计都大致类似. 所以传统的对于功能架构和UI的竞品分析意义不大,作为快速增长的市场,web端产品的用户体验很容易模仿,而整体研发和运营战略则决定了核心竞争力.

HBase写吞吐场景资源消耗量化分析及优化

于01-16 17:18 - 有赞技术 - 安全 人工智能
HBase 是一个基于 Google BigTable 论文设计的高可靠性、高性能、可伸缩的分布式存储系统. 网上关于 HBase 的文章很多,官方文档介绍的也比较详细,本篇文章不介绍HBase基本的细节. 本文从 HBase 写链路开始分析,然后针对少量随机读和海量随机写入场景入手,全方面量化分析各种资源的开销, 从而做到以下两点:.

TorPCAP:Tor网络取证分析技术

于01-14 15:00 - secist - 资讯 tor TorPCAP
发往Tor网络的未加密网络流量,会通过运行Tor客户端计算机(如Tor浏览器)上的localhost TCP sockets来传送流量. 在本文中,我将向大家展示如何将具有localhost流量的PCAP文件,加载到 NetworkMiner 中并可视化匿名的Tor浏览. 我们称这种技术为TorPCAP.

[转]排名算法(二)--淘宝搜索排序算法分析

于12-31 16:36 - App_12062011 -
原文:https://blog.csdn.net/u011966339/article/details/78052569 . 淘宝搜索排序的目的是帮助用户快速的找到需要的商品. 从技术上来说,就是在用户输入关键词匹配到的商品中,把最符合用户需求的商品排到第一位,其它的依次排在后续相应的位置. 为了更好的实现这个目标,算法排序系统基本按三个方面来推进:.

U-boot引导内核流程分析

于12-23 00:00 - - geek
U-boot引导内核流程分析. 当U-boot完成重定位和初始化外设后,它将正式进入工作状态,可以加载内核镜像到DDR的链接地址中了,具体的地址也可以通过bootcmd这个环境变量来指定,内核镜像有两种加载方式:. 一种是通过tftp将镜像文件直接引导入DDR中内核的链接地址(对于s5pv210来说是30008000),这种方法很适合调试.

看我如何分析并渗透WebSocket和Socket.io

于12-02 13:00 - Covfefe - WEB安全 websocket 渗透
WebSocket是一种允许浏览器和服务器建立单个TCP连接然后进行全双工异步通信的技术. 由于它允许实时更新,而浏览器也无需向后台发送数百个新的HTTP polling请求,所以对于web程序来说,WebSocket非常流行. 这对于测试者来说是不好的,因为对WebSocket工具的支持不像HTTP那样普遍,有时候会更加复杂.

【Python量化】手把手教你用python做股票分析入门

于11-28 08:06 - -
python金融量化  已获得授权. 关注可了解更多的金融与Python干货. 目前,获取股票数据的渠道有很多,而且基本上是免费的,比如,行情软件有同花顺、东方财富等,门户网站有新浪财经、腾讯财经、和讯网等. Python也有不少免费的开源api可以获取交易行情数据,如pandas自带的库,tushare和baostock等.

智能视频分析系统_视频智能分析漫谈-博客-云栖社区-阿里云

于11-12 14:46 - -
  从世纪九十年代开始,美国的VSAM项目中进行视频监控的数据化研究以来,视频监控的智能化经过了二十年的发展,到现在已经发生了巨大的变化,智能分析技术也从传统的模式识别到机器学习再到现在家喻户晓的深度学习经历了多个阶段的发展. 而当前深度学习的逐渐成熟让很多曾经尚未到达实用阶段的应用逐渐具备了可用性,典型的如人脸识别,高密度的人员统计等;也让很多已经成熟的应用具有更高的准确度,如车牌、车型识别、行为识别等等.

[转]GeoHash原理分析

于11-02 09:50 - tenfyguo -
机机是个好动又好学的孩子,平日里就喜欢拿着手机地图点点按按来查询一些好玩的东西. 某一天机机到北海公园游玩,肚肚饿了,于是乎打开手机地图,搜索北海公园附近的餐馆,并选了其中一家用餐. 饭饱之后机机开始反思了,地图后台如何根据自己所在位置查询来查询附近餐馆的呢. 苦思冥想了半天,机机想出了个方法:计算所在位置P与北京所有餐馆的距离,然后返回距离<=1000米的餐馆.

[译] OpenCV vs Dlib 人脸检测比较分析

于10-24 00:00 - - dev
点击我爱计算机视觉标星,更快获取CVML新技术. 人脸检测是计算机视觉最典型的应用之一,早期OpenCV的logo就是Haar人脸检测的示意图. 很多人的第一个OpenCV学习目标就是跑通Haar级联人脸检测,Dlib库在业内开始流行很大程度上是因为其HOG-SVM人脸检测比OpenCV Haar的好,而近年来OpenCV和Dlib均已包含基于深度学习的人脸检测算法实现.

App Store Top 1000 关键词分析

于10-08 09:20 - 标点符 - 网络营销 应用市场
做这个分析的主要目的是分析用户的搜索习惯及用户的需求方向,寻找可能的机会. 以下分析是7月初进行的,数据比较老,供参考. 在Top 1000的关键词中,82% 是品牌词,足见品牌(口碑)对应App的下载量还是非常的重要. 而另外18%的非品牌词也展现了一些打造品牌的机会(用户在该品类下还没有产生思维定势,新的App还存在一定的机会),以下为另外18%的非品牌关键词:.

日益增加的移动诈骗攻击分析简报

于10-05 15:00 - Alpha_h4ck - 终端安全 资讯 移动设备安全 网络诈骗
移动设备,早就已经成为了攻击者的主要目标,因此移动端诈骗攻击的活动愈加频繁也就不足为奇了. 目前,有大约58%的数字交易活动是通过移动端设备发起的,而且现在的网络攻击活动中有1/3也是针对移动端设备的. 在美国就更加严重了,每年全球针对移动端的诈骗攻击增长率约为24%,但美国的同类攻击增长率每年约为44%,你们说惨不惨….

Databus架构分析与初步实践(for mysql) | 网易乐得技术团队

于09-21 14:40 - -
Databus是一个低延迟、可靠的、支持事务的、保持一致性的数据变更抓取系统. 由LinkedIn于2013年开源. Databus通过挖掘数据库日志的方式,将数据库变更实时、可靠的从数据库拉取出来,业务可以通过定制化client实时获取变更并进行其他业务逻辑. 数据传输能保证顺序性和至少一次交付的高可用性.

限流降级神器-哨兵(sentinel)原理分析

于09-20 20:43 - -
Sentinel 是阿里中间件团队开源的,面向分布式服务架构的轻量级高可用流量控制组件,主要以流量为切入点,从流量控制、熔断降级、系统负载保护等多个维度来帮助用户保护服务的稳定性. 大家可能会问:Sentinel 和之前常用的熔断降级库 Netflix Hystrix 有什么异同呢. Sentinel官网有一个对比的文章,这里摘抄一个总结的表格,具体的对比可以点此 链接 查看.

使用Python进行相关性分析

于09-17 18:34 - 标点符 - 数据科学 程序开发 Python
在数据分析时,经常会针对两个变量进行相关性分析. 在Python中主要用到的方法是pandas中的corr()方法. corr():如果由数据框调用corr函数,那么将会计算每个列两两之间的相似度,返回DataFrame. corr(other):如果由序列调用corr方法,那么只是该序列与传入的序列之间的相关度,返回一个数值型,大小为相关度.

[分享发现] 汉语中的词频及笔画数分布规律探析

于09-15 12:59 - metaquant -
一篇汉字词频与笔画数规律的数据分析小文,和大家交流,也请大佬们多指教,V2EX 不能很好的显示数学公式,所以贴上自己的博文地址和 GitHub 仓库地址:. 博文地址: https://md.metaquant.org/2018/words.html. notebook 地址: https://github.com/sorrowise/chinese_data_analysis/blob/master/chinese_data_analysis_CH.ipynb.

流行 iOS Apps 被发现将用户位置数据发送给第三方数据分析公司

于09-08 20:04 - -
GuardianApp 的安全研究人员 发现,数十款流行 iOS Apps 被发现会将用户位置数据发送给第三方数据分析公司. 这些应用都需要位置数据才能正常工作,它们是气象、交友或健身类应用,而与第三方公司分享数据可以为免费应用产生收入. 这些应用收集的数据包括低功耗蓝牙信标数据,GPS 经维度数据,Wi-Fi SSID 和 BSSID,部分应用还收集加速计,广告标识符,电池状态和蜂窝网络信息等.

Uber 的实时数据分析系统架构 - 网站架构札记

于09-03 15:44 - -
Uber 实时系统的 Use case:. 举一个更详细些的例子,UberEATS 是 Uber 的外卖服务. 实时系统也为这个功能估算送餐时间. 所有来自乘客和司机的事件 event ,由 Kafka 收集. Kafka 使用 Pub-sub 的订阅发布模式. Uber 整个系统中各个 microservice 之间的通信也通过了 Kafka.

金融数据分析与挖掘具体实现方法 -1 - 汪凡 - 博客园

于08-29 07:07 - -
有人让我写一下关于数据挖掘在金融方面的应用,再加上现在金融对数据方面的要求不断提高,准备用两篇随笔来做个入门总结. 首先,在看这篇随笔以前稍微补充一点金融方面的知识,因为我不是金融专业的,以下补充知识来自互联网与个人整理,欢迎批评指正并补充说明. 1 先来了解一下什么是金融市场呢. 通常狭义的金融市场特指有价证券(股票、债券)发行和流通的场所.

Kylin在马蜂窝数据分析团队的应用实战

于08-24 14:13 - -
AI 前线导读:马蜂窝大数据平台自 2017 年下半年引入 Apache Kylin 以来,极大的提升了数据分析师对于数据探索的效率. 因为使用了 Apache Kylin,数据分析师可以直接查询大数据、无需排队、亚秒级响应,整体开发效率提高了 10 倍以上. 更多优质内容请关注微信公众号“AI 前线”(ID:ai-front).