[技术]标签资讯

Google搜索引擎架构Caffeine

于12-04 22:09 - 钱魏Way - 产品术→技巧 Google 搜索引擎

什么是 Google Caffeine. Google Caffeine 是 Google 搜索引擎的一次架构重构，旨在满足不断增长的互联网内容和用户实时搜索需求. 它替代了 Google 早期的分层索引系统，转而采用更加实时的索引机制，使搜索结果更加快速和新鲜. 发布时间：Google 于 2009 年 8 月发布 Caffeine 项目 Beta 版本，并于 2010 年 6 月正式启用.

互联网公司的管理神话破灭

于02-04 17:21 - 评论尸 - #技术与商业互联网企业管理字节跳动腾讯

价值观，OKR，花名，弹性工作制等……. 在过去的 20 年里，互联网行业为企业管理界贡献了许多花活儿，这其中有些是中国互联网原创的，也有不少是从硅谷学习而来属于全球互联网行业通行. 当互联网行业处于黄金上升期的时候，几乎每家成功的互联网企业都要或多或少的对外输出一下自己的企业管理方法论，有的是通过创始人演讲，有的是通过出书，也有类似腾讯和阿里巴巴这样的，直接以被投企业家俱乐部的形式来影响自己投资的创业企业.

国内高铁票价的计算规则

于12-23 22:16 - 钱魏Way - 产品术→技巧价格出行

高铁（包括 G、D 字头列车和一部分 C 字头列车）票价的计算是一个比较复杂的问题. 它取决于线路的速度等级、里程、递远递减以及折扣等方面. 以下的讨论均不包含既有线动车组以及除京津城际线以外的城际铁路动车组的情况；. 为不致混淆，本文中“高铁”指除第 1 条情形以外“开行 G、D 字头列车的线路”，不指代“G 字头列车”.

互联网黑灰产产业链初探

于06-17 09:58 - 钱魏Way - 术→技巧运营

黑灰产的英文翻译是Black Market，被定义为通过人工方式或者技术手段实施的操纵网络信息内容，获取违法利益、破坏网络生态秩序的行为. 对很多人来说，黑灰产的代名词就是“薅羊毛”. 实际上，除了薅羊毛，每个行业都存在一些典型的黑灰产欺诈场景. 黑灰产的最大特点但就是逐利. 只要是能产生利益的地方几乎逃不开黑灰产的觊觎.

探索性数据分析详解

于04-18 22:54 - 钱魏Way - 数据术→技巧数据分析

探索性数据分析（Exploratory Data Analysis，简称EDA）是指对已有的数据（特别是调查或观察得来的原始数据）在尽量少的先验假定下进行探索，通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法. 探索性数据分析（EDA）与传统统计分析（Classical Analysis）的区别：.

别焦虑了，这才是中国各行业平均工资的真相

于12-05 17:25 - DT财经 - 信息技术西藏金融业青海 dt

不久前，国家统计局发布了《中国统计年鉴 2022》，年鉴中记录了 2021 年我国各地区和各行业的年平均工资. 近 10 年来各行业年平均工资有什么变化. 哪些行业、哪些地区高薪且工资增速快. 2012-2021 年整体年平均工资变化. 总的来看，非私营单位的年平均工资大幅高于私营单位的年平均工资.

网站速度终极优化

于11-18 16:05 - 土木坛子 - 信息技术博客网站优化

最近尝试再次优化提升网站的访问速度. 利用了CDN厂商Cloudflare的Page rules，创建了三条页面规则，将后台登录页面免除缓存外，其它页面全部都缓存在Cloudflare的全球CDN数据中心. 这样全球访客访问本网站的时候，除了第一次要从源主机上索取生成页面，其它都不再需要，直接从最近的CDN数据中心获取，这样既减轻了网站主机的资源消耗压力，又直接提升了访客的访问速度.

使用Excel搭建推荐系统

于11-13 23:06 - 钱魏Way - 器→工具工具软件数据术→技巧机器学习

在上一篇重新认识Excel的文章中，提到了Excel无所不能，然后就想到了曾经看到的这篇关于如何使用Excel搭建推荐引擎的文章. 于是找了出来做了下简单的翻译（只翻译了重点部分）. 在互联网上有无限的货架空间，找到你想看的东西可能会让人筋疲力尽. 幸运的是，与决策疲劳作斗争是 Netflix 的工作……而且他们很擅长.

通俗易懂理解数据库概念

于11-13 23:33 - 钱魏Way - 数据术→技巧研发数据库

在Quora上曾经有个问题： Computer Programming: How would you explain a database in three sentences to your 8-year-old nephew被搬到了知乎上. 数据就像各种各样中药，在没有数据库之前，中药就是一包包这样杂乱无章地堆放着（unorganized data），找也不好找（inaccessible）.

营销中的本手、妙手和俗手

于09-14 23:28 - 钱魏Way - 术→技巧营销增长黑客

2022新高考Ⅰ卷语文作文带来和很多讨论，这个题目还是非常值得讨论的，结合自己的工作经历，我把本手、妙手和俗手联想到了营销方案. 作文材料：“本手、妙手、俗手”是围棋的三个术语. 本手是指合乎棋理的正规下法；妙手是指出人意料的精妙下法；俗手是指貌似合理，而从全局看通常会受损的下法. 对于初学者而言，应该从本手开始，本手的功夫扎实了，棋力才会提高.

技术管理者的 4 个基本思考点

于08-27 10:53 - admin - 架构和远方团队管理技术管理组织建设

技术团队管理者在日常工作中可能经常会遇到如下一些状况：. 高强度加班后，小伙伴状态不好，导致更多的问题出现. 从第 1 点状况演变成第 5 种状况，第 5 点状况继续推动第 1 种状态的持续加强，从而导致整个团队的状态极差，陷入 BUG 多 –> 延期 –> 加班 –> BUG 更多 –> 更多的延期的死循环.

在中国，真正达到月收入1万以上的有多少

于04-06 07:12 - DT财经 - 就业本科生信息技术杭州西藏

作者 | 菜乙己、董道力. 数据 | 董道力. 编辑 | 张晨阳、唐也钦. 设计 | 戚桐珲. 2018 年，上海相亲角，有一位老大爷自称侄子高学历、年收三百万，并直言 " 月入 1 万如讨饭 "，引来大量网友自嘲式认领 " 乞丐 " 身份. 今年 2 月，" 月收入一万 " 的鄙视链降临到了二线城市，有一位网友发帖声称，月收入一万在郑州 " 只能生存没法生活 "，还完房贷、减去日常生活开支，没剩多少钱，日子过得紧紧巴巴.

微前端框架核心技术揭秘

于02-22 10:02 - tisontang - 技术干货其他前端开发微前端

2016年由ThoughtWorks提出了一种类似微服务的概念“微前端”（Micro Frontend），其后该概念在web领域逐渐落地，在前端技术领域出现了繁多的微前端框架. 本文将向你介绍有关微前端的概念、意义，带你走近微前端框架，揭秘那些“不为人知”的巧妙技术实现. 虽然它在2016年就被提出，但是直至今天，我们仍然只能描述它的轮廓，无法给它清晰下定义.

微前端框架核心技术揭秘

于02-22 10:02 - 否子戈 - 技术干货前端开发微前端

App深度链接与延迟深度链接

于01-18 13:17 - 钱魏Way - 数据术→技巧研发 Android APP

在App投放推广中，唤醒用户是常见的运营策略. 想要让用户重新活跃起来，转化用户的行为，必须从场景上还原用户的路径，从根本上找到用户增长的奥秘. 在这个广告漫天的时代，相信大多数用户在使用App的时候都遇到类似的场景：在使用某资讯类App的时候，浏览到了淘宝的商品广告，当你点击该广告内容时，自动打开了你手机上已经安装的淘宝App并且定位到了该商品的详情页.

Android/iOS判断是否使用代理或VPN

于01-07 18:57 - 钱魏Way - 数据术→技巧研发 Android APP

针对APP的黑产，我们提到部分用户会通过改变IP来绕过风控策略. 更改IP比较方便的方法是使用代理IP或VPN. 在检测APP安全性是需要对是否使用代码和VPN做判断. Android判断是否使用代理IP. Android判断是否使用VPN. iOS判断是否使用代理IP. Django实战：投票系统搭建.

本机号码一键登录原理与应用

于11-26 19:54 - 钱魏Way - 产品术→技巧研发注册登录

很多APP的目前都支持“本机号码一键登录”功能. 本机号码一键登录是基于运营商独有网关认证能力推出的账号认证产品. 用户只需一键授权，即可实现以本机号码注册/登录，相比先前的短信验证码流程体验更优. 目前市面上有很多厂商提供三网验证的服务，只不过是对三大运营商的包装. 要了解具体的原理可直接看三大运营商相关的介绍.

使用zimg搭建图片服务器

于11-20 08:30 - 钱魏Way - 器→工具开源项目术→技巧研发运维

一般的大型网站都会将图片存放在专门的服务器，这样可以很好的提升网站的性能. 比较简单的方式是采用云厂商提供的服务，比如七牛云、又拍云等. 今天要介绍的是一款开源的实现方案zing. zimg是一套国人针对图片处理服务器而设计开发的开源程序，目的是解决图片服务中如下三个问题：. 大流量：对于一些中小型网站来说，流量问题就是成本问题，图片相对于文本来说流量增加了一个数量级，省下的每一个字节都是白花花的银子.

即时通讯协议之Qunar

于11-09 22:37 - 钱魏Way - 术→技巧研发即时通讯

Qunar 由于业务上对 IM 系统的需求，以及对 IM 需要支持的功能和扩展，结合市面上已有的 IM 的实现，实现了自己的一套完善的办公 IM 和客服 IM 系统. 具备了以下几个重要特点：实时性，可靠性，一致性，安全性，扩展性，高并发. Startalk是去哪儿开源的一款通用的，高性能的企业级im套件.

用户画像TGI指标

于10-26 08:22 - 钱魏Way - 数据术→技巧指标用户画像

对于TGI指数，百科是这样解释的——TGI指数，全称Target Group Index，可以反映目标群体在特定研究范围内强势或者弱势. TGI指数计算公式 = 目标群体中具有某一特征的群体所占比例 / 总体中具有相同特征的群体所占比例 * 标准数100. 举个例子，假设一家外语学校里面有家烧烤店，每天晚上男生和女生顾客都是50%，你觉得男生还是女生更倾向于光顾这个烧烤店呢.

用户体系搭建之ID-Mapping

于09-28 09:17 - 钱魏Way - 数据术→技巧图计算用户画像风控

在推进用户画像和风险控制时，遇到的最大的问题是用户身份信息的混乱：. 相同用户，不同渠道下账号不相同，如微信小程序和APP. 同个用户，在不同的设备商登录. ID-Mapping是大数据分析中非常基本但又关键的环节，ID-Mapping通俗的说就是把几份不同来源的数据，通过各种技术手段识别为同一个对象或主题，例如同一台设备（直接），同一个用户（间接），同一家企业（间接）等等，可以形象地理解为用户画像的“拼图”过程.

服务高可用之限流

于09-10 08:10 - 钱魏Way - 术→技巧研发 API

在不同场景下限流的定义也各不相同，可以是每秒请求数、每秒事务处理数、网络流量. 通常我们所说的限流指的是限制到达系统并发请求数，使得系统能够正常的处理部分用户的请求，来保证系统的稳定性. 限流的英文是Rate limit（速率限制），维基百科中的定义比较简单. 我们编写的程序可以被外部调用，Web 应用通过浏览器或者其他方式的 HTTP 方式访问，接口的访问频率可能会非常快，如果我们没有对接口访问频次做限制可能会导致服务器无法承受过高的压力挂掉，这时候也可能会产生数据丢失.

数据分析该知道的IP地址知识

于08-25 21:45 - 钱魏Way - 数据术→技巧 IP

第一次接触到IP，还是在十多年前使用统计系统时，当时的统计系统中有个指标是IP地址. 即记录每天有多少不同的IP访问您的网站，在后来是自己搭建统计系统时涉及到对IP地址省份、城市、区域的解析. 最近在推进风控项目时又有遇到，所以抽时间把相关的知识点做下简单的整理. IP地址（英语：IP Address，全称Internet Protocol Address）.

线性回归实战：波士顿房价预测

于08-07 20:11 - 钱魏Way - 数据术→技巧线性回归

了解线性回归的原理后，为了更好的掌握相关的技能，需要进入实战，针对线性回归常见的方法有：Scikit和Statsmodels. 美国波士顿房价的数据集是sklearn里面默认的数据集，sklearn内置的数据集都位于datasets子模块下. 一共506套房屋的数据，每个房屋有13个特征值. ZN: 住宅用地所占比例.

游戏排名算法：Elo、Glicko、TrueSkill

于08-07 12:58 - 钱魏Way - 数据术→技巧排序算法

Elo等级分制度（英语：Elo rating system）是指由匈牙利裔美国物理学家Arpad Elo创建的一个衡量各类对弈活动水平的评价方法，是当今对弈水平评估公认的权威标准，且被广泛用于国际象棋、围棋、足球、篮球等运动. 网络游戏的竞技对战系统也采用此分级制度. ELO等级分制度是基于统计学的一个评估棋手水平的方法.

潜在语义分析LSA初探

于07-07 21:47 - 钱魏Way - 数据术→技巧法→原理自然语言处理语义分析

潜在语义分析（Latent Semantic Analysis），是语义学的一个新的分支. 传统的语义学通常研究字、词的含义以及词与词之间的关系，如同义，近义，反义等等. 潜在语义分析探讨的是隐藏在字词背后的某种关系，这种关系不是以词典上的定义为基础，而是以字词的使用环境作为最基本的参考. 他们认为，世界上数以百计的语言都应该有一种共同的简单的机制，使得任何人只要是在某种特定的语言环境下长大都能掌握那种语言.

为了效率不应该做的7件事

于06-19 09:39 - 钱魏Way - 术→技巧管理职业素养

把自己弄得忙忙碌碌，但回头看碌碌无为. 无意看到这篇文章，感觉对自己非常有用，记录下来自勉. 设想一下有一个不停工作的小业务员，努力工作并不能帮助他战胜成千上万的竞争对手. 一个企业家最多可以每周7天每天工作24小时，他的竞争对手可以花更多的钱，建立一个更大的团队，花更多的时间在这个项目上. 但是为什么有一些小的初创公司完成了大公司不能完成的事情.

盲盒是变相赌博OR智商税？

于06-04 12:18 - 钱魏Way - 术→技巧营销盲盒

盲盒顾名思义，就是看不见内容的盒子，其内部放置着不同的物品，消费者凭运气抽中商品. 小小的盒子里装着不同样式的玩偶，在拆封之前永远不知道里面是什么，正是这种随机化的体验，让用户欲罢不能. 盲盒营销最早可以追溯到明治末期的日本，其“前身”是日本百货公司在新年期间用来促销的福袋，福袋促销的方式通常用来作为商品尾货处理，用户既能获得趣味性体验，商家也可以成功清理库存.

从源码中来，到业务中去，React性能优化终极指南

于05-27 11:03 - youdao - 技术分享大前端 react

前言：我们从React源码入手，结合有道精品课大前端的具体业务，运用三大原则对系统进行外科手术式的优化. 同时介绍React Profiler这款工具如何帮我们定位性能瓶颈前言：我们从React源码入手，结合有道精品课大前端的具体业务，运用三大原则对系统进行外科手术式的优化. 同时介绍React Profiler这款工具如何帮我们定位性能瓶颈.

通过SQL定义用户浏览Session

于05-26 19:42 - 钱魏Way - 数据术→技巧 SQL

PC时代，用户问页面时，我们会先检查用户的Cookie中是否存在SessionId，如果不存在，则会通过随机数的方式生成一个SessionId存入Cookie中. 如果存在，我们会更新这个Cookie的失效时间（30分钟后）. 即只要用户访问的间隔在30分钟内则被认为是同一个Seesion，超过30分钟则会生成一个新的SeesionId，将浏览定义为一个新的Session.

有关[技术]标签推荐

Google搜索引擎架构Caffeine

互联网公司的管理神话破灭

国内高铁票价的计算规则

互联网黑灰产产业链初探

探索性数据分析详解

别焦虑了，这才是中国各行业平均工资的真相

网站速度终极优化

使用Excel搭建推荐系统

通俗易懂理解数据库概念

营销中的本手、妙手和俗手

技术管理者的 4 个基本思考点

在中国，真正达到月收入1万以上的有多少

微前端框架核心技术揭秘

微前端框架核心技术揭秘

App深度链接与延迟深度链接

Android/iOS判断是否使用代理或VPN

本机号码一键登录原理与应用

使用zimg搭建图片服务器

即时通讯协议之Qunar

用户画像TGI指标

用户体系搭建之ID-Mapping

服务高可用之限流

数据分析该知道的IP地址知识

线性回归实战：波士顿房价预测

游戏排名算法：Elo、Glicko、TrueSkill

潜在语义分析LSA初探

为了效率不应该做的7件事

盲盒是变相赌博OR智商税？

从源码中来，到业务中去，React性能优化终极指南

通过SQL定义用户浏览Session

一些链接

订阅