更新于:02-26 21:18
有关[分析]分类推荐
于03-04 13:58 - 京东云开发者 -
在日常生产生活中,我们常说,“安全第一”、“安全无小事”. 围绕着安全问题,在各行各业都有对各类常见安全问题的解决方案和突发安全问题的应急预案. 在互联网、软件开发领域,我们日常工作中对各类常见的安全问题又有哪些常见的解决方案呢. 在此,结合经典架构图做一个梳理. 下面,结合上述的经典架构图,对数据存储、微服务接口、外网数据传输及APP层可能出现的安全问题进行分析,并给出一些常见的应对措施.
于03-02 16:05 - 接地气的陈老师 - 数据分析 2年 初级 用户运营
数据分析师在进行数据驱动增长分析时,不但要用AARRR呈现增长结果,更要量化展现增长决策的全过程,从而发现更深层的问题. 这篇文章通过围绕六个模块深入整个分析模型,数据分析师们快来学习学习吧. 数据驱动增长,是很多公司对数据分析师的要求,可具体到操作上,大家就开始纠结了. 虽然增长黑客上白纸黑字写了AARRR五个大字,可真到分析的时候,就总被吐槽:.
于03-02 10:18 - 腾讯云开发者 -
导语 | We 分析是微信小程序官方推出的、面向小程序服务商的数据分析平台,其中画像洞察是一个非常重要的功能模块. 微信开发工程师钟文波将描述 We 分析画像系统各模块是如何设计,在介绍基础标签模块之后,重点讲解用户分群模块设计. 希望相关的技术实现思路,能够对你有所启发. We 分析是小程序官方推出的、面向小程序服务商的数据分析平台,其中画像洞察是一个重要的功能模块.
于02-24 00:00 - - dev
宇文湛泉,现任金融行业核心业务系统DBA,主要涉及Oracle、DB2、Cassandra、MySQL、GoldenDB、TiDB等数据库开发工作. 最近一两年里,每次做分布式数据库的内容分享活动时,总是会提及现在数据库的两个重要的存储结构,B-TREE和LSM-TREE. 因为,我觉得作为数据库的存储根基,无论是要选型,或者是用好一个数据库,清楚这两的差别和各自特点,都特别重要.
于08-31 10:52 - -
IP相关统计 统计IP访问量(独立ip访问数量). 查看某一时间段的IP访问量(4-5点). 查看访问最频繁的前100个IP. 查询某个IP的详细访问情况,按访问频率排序. 页面访问统计 查看访问最频的页面(TOP100). 查看访问最频的页面([排除php页面】(TOP100). 查看页面访问次数超过100次的页面.
于08-17 23:24 - laixintao - 程序开发笔记 bbr congestion control cubic cwnd
Debug 网络质量的时候,我们一般会关注两个因素:延迟和吞吐量(带宽). 延迟比较好验证,Ping 一下或者 mtr 一下就能看出来. 这篇文章分享一个 debug 吞吐量的办法. 看重吞吐量的场景一般是所谓的长肥管道(Long Fat Networks, LFN, rfc7323). 吞吐量没有达到网络的上限,主要可能受 3 个方面的影响:.
于07-14 13:25 - 大愚Talk -
好久没有给大家带来新的知识分享了,2022的第一篇(是的,你没看错. 第一篇)就给大家讲讲商品模型的演进过程吧. 希望对大家做的工作有所帮助~~. 我们来假设:现在需要从零开始做电商,毫无经验,也没有竞对可参考,你就是全球独一份. 站在技术的视角,要去做一个电商商品系统,毫无疑问你需要一个商品实体,同时为了方便用户在C端筛选浏览,继承自CMS思想(栏目-->文章模型),很容易想到给每类商品增加一个分类,把相似的商品归属到相同的类目下.
于06-23 08:00 - - Blog Blog
最近工作中遇到一个问题,某个请求的响应特别慢,因此我就希望有一种方法能够分析到底请求的哪一步耗时比较长,好进一步找到问题的原因. 在网络上搜索了一下,发现了一个非常好用的方法, curl 命令就能帮助分析请求的各个部分耗时情况. curl 命令提供了 -w 参数,这个参数在 manpage 是这样解释的:.
于04-02 18:00 - zhangshun - hive python
hive写入数据有2种模式,一种是insert into,一种是insert overwrite. 参考资料:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DML#LanguageManualDML-InsertingdataintoHiveTablesfromqueries.
于03-24 11:20 - 挖坑的张师傅 -
我们有一个线上的项目,刚启动完就占用了使用 top 命令查看 RES 占用了超过 1.5G,这明显不合理,于是进行了一些分析找到了根本的原因,下面是完整的分析过程,希望对你有所帮助. Linux 经典的 64M 内存问题. 堆内存分析、Native 内存分析的基本套路. tcmalloc、jemalloc 在 native 内存分析中的使用.
于03-07 00:00 - - dev
先举个例子,体温37.4度vs体温36.5度,只有2.5%的波动,可如果有人在测温点被发现体温37.4度,估计马上就被拉走做核酸. 因为人们不是怕2.5%的波动,而是怕新冠. 所以:指标波动不可怕,指标波动代表的业务场景才可怕. 脱离业务场景谈指标波动就是耍流氓. 在各种业务指标中,数据往往不是静止不变的,尤其是当一些核心的指标发生了变化、波动时,就需要判断这样的波动是否属于异常的情况.
于03-09 08:00 - -
信息安全体系构建中流量监听是一种常见的防护手段,从流量抓取到日志落地,从日志分析到威胁报警,相应产品基于流量分析模式,从最上层的处理逻辑来看是相近的,使用Suricata还是Snort处理流程类似接近,最粗放的方式去理解他们,这些系统都属于“大型字符串处理过滤系统”. 实际生产中可能会使多家厂商的产品配型开源产品使用,或自主开发,无论采用那种方案,我们都可抽象出一种共通的顶层流量数据处理模式,典型的流量过滤与日志分析处理流程.
于10-19 08:54 - -
产品经理的岗位职责之一是在市场中建立和维护产品的竞争优势,竞品分析是产品经理的一项常规工作,分析质量决定着决策质量,影响着对业务取长补短的效果. 但在竞品分析时,常遇到以下问题:. 没有养成日常习惯,分析时无从下手. 企图以此寻找需求或印证自己的观点. 由领导发起,找模板套公式,交作业. 分析维度杂乱浅显,结论无参考价值.
于09-13 15:54 - 晗大大 - 架构设计 退货包运费 保险
有赞微商城为商家提供了全行业全场景的电商解决方案,帮助商家在社交电商、直播电商等场景下快速布局. 在整个交易流程中,对退货时运费减免的支持已成为了电商场景的标配. 有赞也提供了 “退货包运费” 产品来满足消费者及商家在此场景下的诉求. 本文从“退货包运费”这个产品出发,分析保险业务的特征,介绍有赞保险业务系统的架构设计.
于09-10 09:38 - -
在这种亟需深入理解视频内容的大背景下,不同的表征形态涌现. 其中embedding表征常用的方法包括多模态预训练模型、基于用户行为的deep match模型等等,集团内在这方面有大量优秀的工作,使用embedding表征视频内容最大的问题在于不可解释性,只能完成机器对视频的理解. 使用标签对内容进行表征的优势在于,标签是一种高度概括的自然语言,不仅完成了机器对视频内容的理解,同时完成了人到视频内容的理解.
于03-12 00:00 - - dev
Doris 这类 MPP 架构的 OLAP 数据库,通常都是通过提高并发,来处理大量数据的. 本质上,Doris 的数据存储在类似 SSTable(Sorted String Table)的数据结构中. 该结构是一种有序的数据结构,可以按照指定的列进行排序存储. 在这种数据结构上, 以排序列作为条件进行查找,会非常的高效.
于08-25 21:45 - 钱魏Way - 数据 术→技巧 IP
第一次接触到IP,还是在十多年前使用统计系统时,当时的统计系统中有个指标是IP地址. 即记录每天有多少不同的IP访问您的网站,在后来是自己搭建统计系统时涉及到对IP地址省份、城市、区域的解析. 最近在推进风控项目时又有遇到,所以抽时间把相关的知识点做下简单的整理. IP地址(英语:IP Address,全称Internet Protocol Address).
于08-23 09:14 - -
2021年,Clickhouse 在日志存储与分析方面作为 ElasticSearch 和 MySQL 的替代方案. 原文作者:Anton Sidashin. 关于Clickhouse的文章,这段内容在互联网上仍然很流行,甚至被多次翻译. 现在已经过去两年多,同时 Clickhouse 的开发节奏.
于08-19 00:00 - - dev
整个数据分析体系,由数据采集、数据存储与计算、数据查询与分析和数据应用组成. 通过Sqoop读取RDBMS导入Hive. 用Flume来同步日志文件到Hive. 通过爬虫技术将网上数据爬取下来,存储到RDBMS,再由Sqoop 读取RDBMS,导入到Hive. 离线数据处理:利用Hive高可扩展的批处理能力承担所有的离线数仓的ETL和数据模型加工的工作.
于07-07 21:47 - 钱魏Way - 数据 术→技巧 法→原理 自然语言处理 语义分析
潜在语义分析(Latent Semantic Analysis),是语义学的一个新的分支. 传统的语义学通常研究字、词的含义以及词与词之间的关系,如同义,近义,反义等等. 潜在语义分析探讨的是隐藏在字词背后的某种关系,这种关系不是以词典上的定义为基础,而是以字词的使用环境作为最基本的参考. 他们认为,世界上数以百计的语言都应该有一种共同的简单的机制,使得任何人只要是在某种特定的语言环境下长大都能掌握那种语言.
于05-06 00:00 - - dev
这篇文章起源于 搬砖队大佬的精彩文章 WinDBg定位asp.net mvc项目异常崩溃源码位置,写的非常好,不过美中不足的是通览全文之后,总觉得有那么一点不过瘾,就是没有把当时抛异常前的参数给找出来. 为了能够让文章行云流水,我就按照自己的侦察思路吧,首先看一下现状:iis上的应用程序崩溃, catch 不到错误,windows日志中只记录了一个 AccessViolationException异常,如何分析.
于04-15 19:19 - 钱魏Way - 产品 术→技巧 研发 排序算法
很多内容网站都会根据用户的交互信息等对内容进行排序. 这里整理了一些比较知名的内容网站的排序规则,每个网站都有不同,在此过程中,我们不仅仅要了解其排序规则(公式),更多的期望了解公式背后的逻辑. Hacker News 是一家关于计算机黑客和创业公司的社会化新闻网站,由 Paul Graham 的创业孵化器 Y Combinator 创建.
于03-30 14:13 - -
现实社会中,很多业务产生的数据具有时序数据属性(在时间维度上顺序写入,同时包括大量时间区间查询统计的需求). 例如业务的FEED数据,物联网产生的时序数据(如气象传感器、车辆轨迹、等),金融行业的实时数据等等. PostgreSQL的UDF和BRIN(块级索引)很适合时序数据的处理. 《PostgreSQL 按需切片的实现(TimescaleDB插件自动切片功能的plpgsql schemaless实现)》.
于03-08 08:00 - 设计 达人 - 交互设计 UE UI UX
前言:做竞品分析包含了太多方面,本文主要是针对交互设计师如何做竞品分析进行分享. 竞品分析的对象一般是和自家产品存在直接/间接竞争,或者用户人群、产品定位和功能存在重叠的产品. 作为交互设计师,我们研究竞品分析时需要从产品概况、功能、流程和交互等方面全方位的分析. 并从竞品中得到对应的启发,将其复用到我们自家的产品中,这也是竞品分析的意义所在.
于03-08 10:43 - 晴天 - 分析评测 2年 初级 竞品分析 设计师
导语:在我们的设计工作中,竞品分析是很重要的. 通过竞品分析可以帮助我们了解与验证我们的设计,为我们带来设计灵感与设计思考,辅助我们产出更好的设计策略与设计方案. 但是,竞品分析如果做的不正确,浪费时间的同时对于设计也不会有什么帮助. 那么,设计师应该如何正确的做竞品分析呢. 在平时的工作中,有拿不准的设计形式时我会请教我的导师,她经常会告诉我行业内的top级产品是怎么做的.
于02-24 06:50 - Flink_China -
本文由李劲松、胡争分享,社区志愿者杨伟海、李培殿整理. 主要介绍在数据湖的架构中,CDC 数据实时读写的方案和原理. 文章主要分为 4 个部分内容:. 常见的 CDC 分析方案. 为何选择 Flink + Iceberg. 一、常见的 CDC 分析方案. 我们先看一下今天的 topic 需要设计的是什么.
于02-16 17:24 - 汪仔9776 - 分析评测 1年 初级 百词斩 竞品分析
导语:本文作者通过对百词斩和墨墨背单词这两款产品进行多维度的分析对比,了解其内在的产品逻辑,分析二者之间的差异性,对比它们的基础结构和功能特点,带大家深入了解了单词类APP未来的发展方向. 我国政府鼓励教育行业积极应用新技术,鼓励发展在线教育,加深科技与教育的融合. 近年来,随着我国国民经济的持续发展,居民可支配收入稳步上涨.
于01-05 00:00 - - tuicool
自己的小网站跑在阿里云的 ECS 上面, 偶尔也去分析分析自己网站服务器日志,看看网站的访问量. 于是收集,整理一些服务器日志分析命令,大家可以试试. 1、查看有多少个IP访问:. 2、查看某一个页面被访问的次数:. 3、查看每一个IP访问了多少个页面:. awk '{++S[$1]} END {for (a in S) print a,S[a]}' log_file > log.txt
sort -n -t ' ' -k 2 log.txt 配合sort进一步排序.
于12-29 10:32 - Q的博客 -
注:本文原创,转发需标明作者及原文链接. 【0广告微信公众号:Q的博客】. 本系列共三篇文章, 本文是系列第2篇——进阶篇,详细讲解 MAT 各种工具的 核心功能、用法、适用场景,并在具体实战场景下讲解帮大家学习如何针对各类内存问题. JVM 内存分析工具 MAT 的深度讲解与实践——入门篇》 介绍 MAT 产品功能、基础概念、与其他工具对比、Quick Start 指南.
于12-27 21:38 - -
中国金融监管部门再次约谈蚂蚁集团后,指这家互联网金融巨头存在“违规监管套利”等四大问题,要求集团“回归支付本源”,从五方面整顿改造. 分析认为,政府对互联网平台的监管指向日渐清晰,并通过向蚂蚁开刀以一儆百,让互联网金融业者为加速整改做好准备. 中国人民银行、银保监会、证监会和外汇局26日联合约谈蚂蚁集团,中国人民银行副行长潘功胜今天代表四部门对外介绍情况时指出,蚂蚁存在的四大问题:包括公司治理机制不健全;法律意识淡漠,藐视监管合规要求,存在违规监管套利行为;利用市场优势地位排斥同业经营者;损害消费者合法权益,引发消费者投诉等.