更新于:10-06 10:15

有关[技术]标签推荐

用户画像TGI指标

于10-26 08:22 - 钱魏Way - 数据 术→技巧 指标 用户画像
对于TGI指数,百科是这样解释的——TGI指数,全称Target Group Index,可以反映目标群体在特定研究范围内强势或者弱势. TGI指数计算公式 = 目标群体中具有某一特征的群体所占比例 / 总体中具有相同特征的群体所占比例 * 标准数100. 举个例子,假设一家外语学校里面有家烧烤店,每天晚上男生和女生顾客都是50%,你觉得男生还是女生更倾向于光顾这个烧烤店呢.

用户体系搭建之ID-Mapping

于09-28 09:17 - 钱魏Way - 数据 术→技巧 图计算 用户画像 风控
在推进用户画像和风险控制时,遇到的最大的问题是用户身份信息的混乱:. 相同用户,不同渠道下账号不相同,如微信小程序和APP. 同个用户,在不同的设备商登录. ID-Mapping是大数据分析中非常基本但又关键的环节,ID-Mapping通俗的说就是把几份不同来源的数据,通过各种技术手段识别为同一个对象或主题,例如同一台设备(直接),同一个用户(间接),同一家企业(间接)等等,可以形象地理解为用户画像的“拼图”过程.

服务高可用之限流

于09-10 08:10 - 钱魏Way - 术→技巧 研发 API
在不同场景下限流的定义也各不相同,可以是每秒请求数、每秒事务处理数、网络流量. 通常我们所说的限流指的是限制到达系统并发请求数,使得系统能够正常的处理部分用户的请求,来保证系统的稳定性. 限流的英文是Rate limit(速率限制),维基百科中的定义比较简单. 我们编写的程序可以被外部调用,Web 应用通过浏览器或者其他方式的 HTTP 方式访问,接口的访问频率可能会非常快,如果我们没有对接口访问频次做限制可能会导致服务器无法承受过高的压力挂掉,这时候也可能会产生数据丢失.

数据分析该知道的IP地址知识

于08-25 21:45 - 钱魏Way - 数据 术→技巧 IP
第一次接触到IP,还是在十多年前使用统计系统时,当时的统计系统中有个指标是IP地址. 即记录每天有多少不同的IP访问您的网站,在后来是自己搭建统计系统时涉及到对IP地址省份、城市、区域的解析. 最近在推进风控项目时又有遇到,所以抽时间把相关的知识点做下简单的整理. IP地址(英语:IP Address,全称Internet Protocol Address).

线性回归实战:波士顿房价预测

于08-07 20:11 - 钱魏Way - 数据 术→技巧 线性回归
了解线性回归的原理后,为了更好的掌握相关的技能,需要进入实战,针对线性回归常见的方法有:Scikit和Statsmodels. 美国波士顿房价的数据集是sklearn里面默认的数据集,sklearn内置的数据集都位于datasets子模块下. 一共506套房屋的数据,每个房屋有13个特征值. ZN: 住宅用地所占比例.

游戏排名算法:Elo、Glicko、TrueSkill

于08-07 12:58 - 钱魏Way - 数据 术→技巧 排序算法
Elo等级分制度(英语:Elo rating system)是指由匈牙利裔美国物理学家Arpad Elo创建的一个衡量各类对弈活动水平的评价方法,是当今对弈水平评估公认的权威标准,且被广泛用于国际象棋、围棋、足球、篮球等运动. 网络游戏的竞技对战系统也采用此分级制度. ELO等级分制度是基于统计学的一个评估棋手水平的方法.

潜在语义分析LSA初探

于07-07 21:47 - 钱魏Way - 数据 术→技巧 法→原理 自然语言处理 语义分析
潜在语义分析(Latent Semantic Analysis),是语义学的一个新的分支. 传统的语义学通常研究字、词的含义以及词与词之间的关系,如同义,近义,反义等等. 潜在语义分析探讨的是隐藏在字词背后的某种关系,这种关系不是以词典上的定义为基础,而是以字词的使用环境作为最基本的参考. 他们认为,世界上数以百计的语言都应该有一种共同的简单的机制,使得任何人只要是在某种特定的语言环境下长大都能掌握那种语言.

为了效率不应该做的7件事

于06-19 09:39 - 钱魏Way - 术→技巧 管理 职业素养
把自己弄得忙忙碌碌,但回头看碌碌无为. 无意看到这篇文章,感觉对自己非常有用,记录下来自勉. 设想一下有一个不停工作的小业务员,努力工作并不能帮助他战胜成千上万的竞争对手. 一个企业家最多可以每周7天每天工作24小时,他的竞争对手可以花更多的钱,建立一个更大的团队,花更多的时间在这个项目上. 但是为什么有一些小的初创公司完成了大公司不能完成的事情.

盲盒是变相赌博OR智商税?

于06-04 12:18 - 钱魏Way - 术→技巧 营销 盲盒
盲盒顾名思义,就是看不见内容的盒子,其内部放置着不同的物品,消费者凭运气抽中商品. 小小的盒子里装着不同样式的玩偶,在拆封之前永远不知道里面是什么,正是这种随机化的体验,让用户欲罢不能. 盲盒营销最早可以追溯到明治末期的日本,其“前身”是日本百货公司在新年期间用来促销的福袋,福袋促销的方式通常用来作为商品尾货处理,用户既能获得趣味性体验,商家也可以成功清理库存.

从源码中来,到业务中去,React性能优化终极指南

于05-27 11:03 - youdao - 技术分享 大前端 react
前言:我们从React源码入手,结合有道精品课大前端的具体业务,运用三大原则对系统进行外科手术式的优化. 同时介绍React Profiler这款工具如何帮我们定位性能瓶颈前言:我们从React源码入手,结合有道精品课大前端的具体业务,运用三大原则对系统进行外科手术式的优化. 同时介绍React Profiler这款工具如何帮我们定位性能瓶颈.

通过SQL定义用户浏览Session

于05-26 19:42 - 钱魏Way - 数据 术→技巧 SQL
PC时代,用户问页面时,我们会先检查用户的Cookie中是否存在SessionId,如果不存在,则会通过随机数的方式生成一个SessionId存入Cookie中. 如果存在,我们会更新这个Cookie的失效时间(30分钟后). 即只要用户访问的间隔在30分钟内则被认为是同一个Seesion,超过30分钟则会生成一个新的SeesionId,将浏览定义为一个新的Session.

有道精品课实时数据中台建设实践

于05-21 15:00 - youdao - 技术分享 大数据 有道精品课
来源:有道技术团队(ID: youdaotech). 本期文章中,有道精品课技术团队将和大家分享有道精品课 数据中台的架构演进过程以及 Doris 作为一个 MPP 分析型数据库是如何为不断增长的业务体量提供有效支撑并进行数据赋能的. 本文以我们在实时数仓选型的经验为切入点,进一步着重分享使用 Doris 过程中遇到的问题,以及我们针对这些问题所做出的调整和优化.

抖音推荐机制与算法的研究

于05-13 18:58 - 钱魏Way - 数据 术→技巧 营销 抖音 推荐算法
最近公司的部分运营工作涉及到的抖音短视频的宣传. 为了达到更好的效果,于是对抖音的推荐机制进行了简单的整理和研究. 通过数据的分析,我们发现在传播效果方面,抖音>小红书>微信朋友圈>新浪微博. 究其原因是内容分发的逻辑存在非常大的差异. 微信朋友圈、新浪微博:订阅模式,用户仅能看到好友或关注者的信息.

知名网站热门排序算法分析

于04-15 19:19 - 钱魏Way - 产品 术→技巧 研发 排序算法
很多内容网站都会根据用户的交互信息等对内容进行排序. 这里整理了一些比较知名的内容网站的排序规则,每个网站都有不同,在此过程中,我们不仅仅要了解其排序规则(公式),更多的期望了解公式背后的逻辑. Hacker News 是一家关于计算机黑客和创业公司的社会化新闻网站,由 Paul Graham 的创业孵化器 Y Combinator 创建.

Vue 3 组件开发:搭建基于SpreadJS的表格编辑系统(环境搭建)

于04-12 11:16 - 葡萄城技术团队 - 前端 葡萄城开发技术 vue.js spreadjs vite
Vue是一套用于构建用户界面的渐进式框架,与其它大型 JS 框架不同,Vue 被设计为可以自底向上逐层应用,更易上手,还便于与第三方库或既有项目整合,因此,Vue完全能够为复杂的单页应用提供驱动. 2020年09月18日,Vue.js 3.0 正式发布,作者尤雨溪将其描述为:更快、更小、更易于维护.

Optuna自动调参使用指南

于02-22 19:03 - 钱魏Way - 数据 术→技巧 lightgbm 超参数
在日常工作中用到的比较多的还是树回归模型,由于LightGBM不需要的类别数据进行预处理所以用得特别多,中间涉及到超参数优化时通常使用随机参数优化方法. 在 算法模型自动超参数优化方法中有提到了Optuna,平时工作中也会使用到,今天主要对如何使用Optuna进行整理. Optuna是一种机器学习自动超参优化框架,前支持的模型:.

风险控制:信用评分卡模型

于01-27 20:13 - 钱魏Way - 器→工具 开源项目 数据 术→技巧 机器学习
评分卡模型又叫做信用评分卡模型,最早由美国信用评分巨头FICO公司于20世纪60年代推出,在信用风险评估以及金融风险控制领域中广泛使用. 银行利用评分卡模型对客户的信用历史数据的多个特征进行打分,得到不同等级的信用评分,从而判断客户的优质程度,据此决定是否准予授信以及授信的额度和利率. 相较资深从业人员依靠自身的经验设置的专家规则,评分卡模型的使用具有很明显的优点:.

浅谈Forrester零信任架构评估的7个技术维度

于06-08 14:10 - Doraemon - 网络安全 Forrester 技术维度 零信任
零信任是由Forrester Research的分析师John Kindervag在2009开发,并在2010年正式提出的. 在过去的10年间,随着云计算、移动互联等技术发展以及全球范围内部威胁的不断涌现,零信任越来越为产业界所接受. Google从2011年开始探索和实践零信任,并在2014年发表了BeyondCorp系列研究论文,成为零信任大规模实施的典范.

技术面试中,什么样的问题才是好问题?

于02-12 15:38 - 四火 - Hiring and Interview Recommended 候选人 技术 问题
其实很久以前就想谈一谈这个话题了,但是最近才有了足够的动机. 因为从最近参加的很多 debrief 来看,我认为身边大多数的软件工程师面试中,在通过技术问题来考察候选人这方面,很多都做得不够好. 比方说,我看到对于一些经验丰富的软件工程师候选人的面试,一些面试官依然是草率地扔出一道算法题让做了事,并且认为能不能够比较清晰完整地将代码写出来,是工程师级别裁定的最重要的标准.

乐心医疗的 Kubernetes 云平台建设实践

于11-15 15:44 - UCloud技术市场团队 - 技术分享
Kubernetes 自 2014 年被 Google 开源以来,很快便成为了容器编排领域的标准. 因其支持自动化部署、大规模可伸缩和容器化管理等天然优势,已经被广泛接纳. 但由于 Kubernetes 本身的复杂性,也让很多企业的 Kubernetes 探索之路充满挑战. 从最初的自建 Kubernetes 到后来迁移至 UK8S 平台,整个过程遇到了哪些问题并如何解决的呢.

实时计算框架 Flink 在教育行业的应用实践

于10-12 14:56 - UCloud技术市场团队 - 技术分享
如今,越来越多的业务场景要求 OLTP 系统能及时得到业务数据计算、分析后的结果,这就需要实时的流式计算如 Flink 等来保障. 例如,在 TB 级别数据量的数据库中,通过 SQL 语句或相关 API 直接对原始数据进行大规模关联、聚合操作,是无法做到在极短的时间内通过接口反馈到前端进行展示的. 若想实现大规模数据的 “即席查询”,就须用实时计算框架构建实时数仓来实现.

HTTP的前世今生

于10-01 19:21 - 陈皓 - 技术读物 程序设计 系统架构 网络安全 HTTP
HTTP (Hypertext transfer protocol) 翻译成中文是超文本传输协议,是互联网上重要的一个协议,由欧洲核子研究委员会CERN的英国工程师 Tim Berners-Lee v发明的,同时,他也是WWW的发明人,最初的主要是用于传递通过HTML封装过的数据. 0.9和1.0这两个版本,就是最传统的 request – response的模式了,HTTP 0.9版本的协议简单到极点,请求时,不支持请求头,只支持 GET 方法,没了.

HTTPS劫持研究

于08-10 13:00 - Kriston - 网络安全 HTTPS劫持 技术研究 电信
这篇文章描述了我们对哈萨克斯坦政府实施的电信级HTTPS劫持的分析. 哈萨克斯坦政府最近开始使用一个假的根证书颁发机构,对包括Facebook,Twitter和Google等网站在内的HTTPS连接进行中间人(MitM)攻击,在此文中,我们给出了还在进行中的研究的初步结果,以及哈萨克劫持系统中新的技术细节.

四大模块,带你了解阿里大数据产品技术架构

于04-22 19:21 - 华仔 - 产品设计 3年 中级 产品技术架构 大数据
本文笔者将从数据采集层、数据计算层、数据服务层、数据应用层四大层次来带大家了解阿里大数据的产品技术架构. 2014年,马云提出:“人类正从IT时代走向DT时代”. 如果说在IT时代是以自我控制、自我管理为主,那么到了DT (Data Technology)时代,则是以服务大众、激发生产力为主. 以互联网(或者物联网)、云计算、大数据和人工智能为代表的新技术革命正在渗透至各行各业,悄悄地改变着我们的生活.

十大常用软件架构模式简介

于04-18 22:15 - HuihuangZhang - IT技术 其他
大型的企业级系统是如何设计的呢. 大型软件开发前,我们必须选择一种合适的架构,它既要提供我们想要的功能,质量也要过关. 因此,在应用不同的架构之前,我们有必要熟悉一下这些架构. 针对软件架构中给定上下文的常见问题,架构模式是一种通用的、可复用的解决方案. 它与软件设计模式相似,但范围更广. 在这篇文章中,我将简要地说明一下10种常用的架构模式,以及它们的用法和利弊.

用户端智能的应用实践

于03-25 12:06 - bang - 技术文章
去年团队在用户端上进行了一些简单的智能应用探索实践,这里记录梳理下. 现在很多“智能”,是普通推荐算法借深度学习的风包装的,核心也就是决策树/随机森林/SVM这些90年代已经提出的算法,我们这里的实践也是这样. 在用户端上,智能应用最广泛的目前两个点:个性化和多媒体识别,我们主要实践是在个性化上,从原来所有用户都用同一套或几套规则,换成根据推荐算法给每个用户制定符合他个性化特征的不同规则.

微软变了!招程序员的流程完全改了

于01-05 19:42 - 伯小乐 - 职场 微软 技术面试 面试
【伯乐在线导读】:在微软新 CEO 萨蒂亚·纳德拉的领导下,微软试图改革公司文化,让整个公司朝着同一个方向发展. 为此,微软在 2016 年开始研究「替代面试框架(Alternative Interview Framework)」. 这是一种在开发部门进行面试的新方式,目的是减少偏见,更好地测试求职者在工作中实际需要的技能.

AI产品再出发:给产品和CEO们的建议!

于12-23 11:26 - LineLian - 产品经理 3年 AI技术 中级 用户画像构建
基于用户画像的商品和服务能够提升平台服务体验并促进服务的个性化、精准化实现,本篇文章为大家详细地讲解了如何运用AI技术构建用户画像. 在帮独角兽企业做产品咨询顾问工作的过程中,多有CEO说:“诗路我要买数据,哪里有卖数据的,我想用我2千万用户的手机号去碰撞数据”. 我常问您要用手机号碰撞数据,碰撞出来的用户偏好还是第三方的,也不是您平台的用户行为,更不能在你的场景业务形成交易落地.

让SpringBoot启动更快一点

于11-21 22:10 - 唐尤华 - 基础技术 springboot
这是 2018 Spring One Platform 中的一场会议. 看完会议视频,我自己动手试了一下. 还没有观看视频的朋友推荐看一下,非常有意思. ↓我使用的是 OpenJDK 11. ❯ java --version openjdk 11.0.1 2018-10-16 OpenJDK Runtime Environment 18.9 (build 11.0.1+13) OpenJDK 64-Bit Server VM 18.9 (build 11.0.1+13, mixed mode).

使用Thread Pool不当引发的死锁

于10-23 17:18 - 一杯哈希不加盐 - 基础技术 多线程 死锁 线程池
多线程锁定同一资源会造成死锁. 线程池中的任务使用当前线程池也可能出现死锁. RxJava 或 Reactor 等现代流行库也可能出现死锁. 死锁是两个或多个线程互相等待对方所拥有的资源的情形. 举个例子,线程 A 等待 lock1,lock1 当前由线程 B 锁住,然而线程 B 也在等待由线程 A 锁住的 lock2.