单品页统一服务系统架构未公开细节

标签： | 发表时间：2018-06-17 12:29 | 作者：

出处：https://mp.weixin.qq.com

本文是《京东商品详情页服务闭环实践》中未公开的一些细节，是15年内部培训的PPT，目前的内容也不过时，还适用现有系统架构设计。PPT下载地址： https://pan.baidu.com/s/1K-Djkf6IFZ7qSEIlNqYPAw。
架构

单品页依赖服务众多，分布在各个部门。问题：

服务质量没有监控数据
出现问题不能及时降级
接口调用分散化
域名重复解析，没有长连接的优势

架构总体原则

设计上无状态
使用nginx+lua+tomcat7架构
充分利用localcache（proxycache or shared_dict orjava guava cache）
使用localtwemproxy做redis分片，且缓存分离（重要业务与其他业务分离）
分离线程池，核心业务与非核心业务分离，且有线程池监控和开关
异步化更新
Redis集群使用主从架构
使用unixdomain socket减少连接数
使用keepalive长连接
考虑好开关
缓存时间、是否调用后端服务、托底（托底恢复采用指数/随机数恢复机制）

Twemproxy+Redis

使用localtwemproxy做redis分片，且缓存分离（重要业务与其他业务分离）Redis集群使用集中式主从架构/ 考虑复制缓冲区大小
考虑使用unix domain socket/ 套接字放内存文件系统

考虑使用HashTag
Redis考虑缓存驱逐策略：maxmemory-policy allkeys-lru maxmemory-samples 10

Nginx keep alive

使用长连接，并限制长连接数量

Nginx timeout

设置超时

Nginx proxy cache

使用内存文件系统进行 Nginx Proxy Cache

注意响应头对cache时间的影响

Parameters of caching can also beset directly in the response header. This has higher priority than setting ofcaching time using the directive.

•The“X-Accel-Expires” header field sets caching time of a response in seconds. Thezero value disables caching for a response. If the value starts with the @ prefix,it sets an absolute time in seconds since Epoch, up to which the response maybe cached.•Ifthe header does not include the “X-Accel-Expires” field, parameters of cachingmay be set in the header fields “Expires” or “Cache-Control”.•Ifthe header includes the “Set-Cookie” field, such a response will not be cached.•Ifthe header includes the “Vary” field with the special value “*”,such a response will not be cached (1.7.7). If the header includes the “Vary”field with another value, such a response will be cached taking into accountthe corresponding request header fields (1.7.7).

数据有问题不要缓存

Nginx DNS

proxy_pass时使用Local DNS解析

可能解析到多个server（nslookup），会自动next upstream
Nginx plus支持upstream的动态解析

Nginx Gzip

根据自己需求设置gzip_comp_level、gzip_min_length、gzip_types

Nginx upstream

upstream检查

upstream策略 ip_hash

upstream策略 hash key [consistent]

consistent_key是根据流量负载动态计算的，如根据ip计算：

local newval, err = ip_log:incr(ip, 1)

local toDelay = false

-- 单IP恶意请求分流到固定机组

if newval > 50 then

toDelay = true

ngx_var.consistent_key = ngx_var.consistent_key .. '_' .. newval

--要在set_uri前执行,否则执行不到

end

Nginx Real ip

Nginx client header

限定请求头和请求体大小，在proxy pass到后端服务时不传输请求头和请求体，减少网络交互。

Nginx limit

limit request
limit connection / limit rate
ip白名单/黑名单
user-agent白名单/黑名单
Token限流
漏桶算法令牌桶算法(JavaGuava rate limit)
Delay限速

参考聊聊高并发系统之限流特技-1、聊聊高并发系统之限流特技-2。

Nginx+Lua shared_dict

使用共享字典做local cache

Nginx+Lua 接口合并

请求时使用method参数表示请求哪个服务

数据过滤逻辑前置，不合法直接403(防止XSS)

封装调用逻辑，参数顺序等固定，提升缓存命中率

通过Nginx子请求（ngx.location.capture_multi）进行合并
只对原子接口进行Cache
通过一层代理重试或者记录UMP日志

Nginx+Lua 记录日志

记录日志还可以通过

Java 架构

异步非阻塞事件模型

从Servlet3开始支持异步模型，Tomcat7/Jetty8开始支持，相同的概念是Jetty6的Continuations。我们可以把处理过程分解为一个个的事件。

通过这种将请求划分为事件方式我们可以进行更多的控制。如，我们可以为不同的业务再建立不同的线程池进行控制：

即我们只依赖tomcat线程池进行请求的解析，对于请求的处理我们交给我们自己的线程池去完成；这样tomcat线程池就不是我们的瓶颈，造成现在无法优化的状况。

通过使用这种异步化事件模型，我们可以提高整体的吞吐量，不让慢速的A业务处理影响到其他业务处理。慢的还是慢，但是不影响其他的业务。

通过这种将请求划分为事件方式我们可以进行更多的控制。如，我们可以为不同的业务再建立不同的线程池进行控制：

Java Tomcat

start.sh

export JAVA_OPTS="-Djava.library.path=/usr/local/lib -server -XX:-UseConcMarkSweepGC -XX:+UseCMSCompactAtFullCollection -XX:CMSInitiatingOccupancyFraction=80 -XX:+CMSParallelRemarkEnabled -XX:SoftRefLRUPolicyMSPerMB=0 -XX:MaxDirectMemorySize=512m -Xss256k -XX:NewRatio=1 -XX:SurvivorRatio=6 -Xms16384m -Xms16384m -XX:MaxPermSize=256m -Djava.awt.headless=true -Dsun.net.client.defaultConnectTimeout=60000 -Dsun.net.client.defaultReadTimeout=60000 -Djmagick.systemclassloader=no -Dnetworkaddress.cache.ttl=300 -Dsun.net.inetaddr.ttl=300 -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=$CATALINA_BASE/logs -XX:ErrorFile=$CATALINA_BASE/logs/java_error_%p.log"

-XX:+UseConcMarkSweepGC 表示使用CMS

-XX:+CMSParallelRemarkEnabled 表示并行remark

-XX:+UseCMSCompactAtFullCollection 表示在FGC之后进行压缩，因为CMS默认不压缩空间的。

-XX:CMSInitiatingOccupancyFraction=80 设置阀值为80%，默认为68%。

-XX:SoftRefLRUPolicyMSPerMBsoftly reachable objects will remain alive for some amount of time after thelast time they were referenced. The default value is one second of lifetime perfree megabyte in the heap

-XX:NewRatio年轻代(包括Eden和两个Survivor区)与年老代的比值(不包括持久代)

-XX:SurvivorRatio Eden区与Survivor区的大小比值

server.xml

<Connector port="1601" asyncTimeout="10000" acceptCount="10240" maxConnections="10240" acceptorThreadCount="1" minSpareThreads="5" maxThreads="5" redirectPort="8443" processorCache="1024" URIEncoding="UTF-8" protocol="org.apache.coyote.http11.Http11NioProtocol" enableLookups="false"/>

以Tomcat 6为例，其Connector有几个关键配置：

BIO实现：

acceptCount：在超过最大连接数时，可接受的排队数量；超过这个值就直接拒绝连接；默认100；

maxThreads：tomcat可创建的最大线程数，没线程处理一个请求，它决定了tomcat最大线程阀值；默认200；

minSpareThreads：最小备用线程数，即tomcat一启动就创建的线程数；默认25；(使用Executor时配置)

maxQueueSize：最大备用线程数，一旦创建的线程超过这个值tomcat就会关闭不活动的线程；默认Integer.MAX_VALUE；(使用Executor时配置)

NIO实现（继承如上的配置）：

acceptorThreadCount：接受连接的线程数；默认1，可以根据CPU核数调整；如果没有问题默认1个即可，基本不需要改；

pollerThreadCount：运行选择事件的线程个数；默认每核一个；

processorCache：协议处理器缓存Http11NioProcessor对象的个数，目的是提高性能，默认200，建议其值接近maxThreads；

对于tomcat7的相关配置可以参考官网http://tomcat.apache.org/tomcat-7.0-doc/config/http.html；核心差不多。

Java servlet3

Java thread pool

线程池并发执行任务获取数据

异步更新缓存

Java cache

local cache guava

批量接口时，对单个数据进行缓存；首先查询单个缓存，然后对miss数据进行批量获取，最后合并为结果

其他

域名分区：客户端同域连接限制，进行域名分区：c.3.cn c1.3.cn c2.3.cn

充分使用CPU，比如绑定CPU核数
考虑减少连接数
考虑使用内存文件系统
考虑大内存或企业级SSD
全部使用弹性云

完。PPT下载地址： https://pan.baidu.com/s/1K-Djkf6IFZ7qSEIlNqYPAw。

======广告======

亿级流量网站架构核心技术——跟开涛学搭建高可用高并发系统

作者：张开涛　著

当当广告

购买

京东基础架构建设之路

作者：京东商城基础架构部

当当广告

购买

京东数据中心构建实战

作者：吕科等

当当广告

购买

单品页统一服务系统架构未公开细节

- -

京东商品详情页服务闭环实践》中未公开的一些细节，是15年内部培训的PPT，目前的内容也不过时，还适用现有系统架构设计. 单品页依赖服务众多，分布在各个部门. 域名重复解析，没有长连接的优势. 使用nginx+lua+tomcat7架构. 充分利用localcache（proxycache or shared_dict orjava guava cache）.

日处理 20 亿数据，实时用户行为服务系统架构实践

- - IT瘾-dev

携程实时用户行为服务作为基础服务，目前普遍应用在多个场景中，比如猜你喜欢（携程的推荐系统）、动态广告、用户画像、浏览历史等等. 以猜你喜欢为例，猜你喜欢为应用内用户提供潜在选项，提高成交效率. 旅行是一项综合性的需求，用户往往需要不止一个产品. 作为一站式的旅游服务平台，跨业务线的推荐，特别是实时推荐，能实际满足用户的需求，因此在上游提供打通各业务线之间的用户行为数据有很大的必要性.

HBase 系统架构

- - 博客园_首页

HBase是Apache Hadoop的数据库，能够对大型数据提供随机、实时的读写访问. HBase的目标是存储并处理大型的数据. HBase是一个开源的，分布式的，多版本的，面向列的存储模型. 5 可在廉价PC Server搭建大规模结构化存储集群. HBase是Google BigTable的开源实现，其相互对应如下：.

Facebook 的系统架构

- Ivan - 博客园新闻频道

　　来源：http://www.quora.com/What-is-Facebooks-architecture （由Micha?l Figuière回答）. 　　根据我现有的阅读和谈话，我所理解的今天Facebook的架构如下：. Web 前端是由 PHP 写的. Facebook 的 HipHop [1] 会把PHP转成 C++并用 g++编译，这样就可以为模板和Web逻贺业务层提供高的性能.

Digg.com 的系统架构

- - 标点符

在过去的几年间，我们一直致力于重构Digg的架构，现在我们称之为“Digg V4”.本文我们将全面介绍Digg的使用的系统和技术. 首先，我们来看下Digg给大众用户提供的服务吧：. 人们通过浏览器或者其他应用来访问这些Digg服务. 一些有Digg账户的用户，可以得到“我的新闻”. 每位用户可以得到的我们称之为“热门新闻”.

系统架构师JD

- - CSDN博客架构设计推荐文章

国内大型的物流企业，专业从事国内公路运输和航空运输代理. Foss项目的架构设计，包括需求分析，模块设计，系统结构设计，关键功能的开发，技术难题的解决，对团队质量输出的把控等等. 1、熟悉WebLogic/Websphere/JBoss等一个以上大型应用服务器，熟悉Linux及应用服务器集群. 2、具有丰富J2EE架构设计经验，具有大型基于J2EE体系结构的项目规划、系统架构设计、开发经验.

Android 系统架构分析

- - CSDN博客移动开发推荐文章

Android：开源的 Linux + Google 的封闭软件 + 私有的基带 + 运营商锁定 = 开放的 Android 手机. iPhone：开源的 BSD + 苹果的闭源软件 + 私有的基带 + 运营商锁定 = 封闭的苹果 iPhone. 一个平庸的应用商店，开发者依靠广告赚钱，商店并非独此一家，用户找不到好软件.

twitter系统架构分析

- - 企业架构 - ITeye博客

twitter系统架构分析. （一）twitter的核心业务. twitter的核心业务，在于following和be followed：. （1）following-关注. 进入个人主页，会看到你follow的人发表的留言（不超过140个字），这是following的过程；. （2）followed-被关注.

支付宝系统架构

- - 编程语言 - ITeye博客

支付宝的开源分布式消息中间件–Metamorphosis(MetaQ). Metamorphosis (MetaQ) 是一个高性能、高可用、可扩展的分布式消息中间件，类似于LinkedIn的Kafka，具有消息存储顺序写、吞吐量大和支持本地和XA事务等特性，适用于大吞吐量、顺序消息、广播和日志数据传输等场景，在淘宝和支付宝有着广泛的应用，现已开源.

单品页统一服务系统架构未公开细节

亿级流量网站架构核心技术——跟开涛学搭建高可用高并发系统

京东基础架构建设之路

京东数据中心构建实战

相关 [统一服务系统架构] 推荐：

单品页统一服务系统架构未公开细节

日处理 20 亿数据，实时用户行为服务系统架构实践

HBase 系统架构

Facebook 的系统架构

Digg.com 的系统架构

系统架构师JD

Android 系统架构分析

twitter系统架构分析

支付宝系统架构

相关文章

订阅

单品页统一服务系统架构未公开细节

亿级流量网站架构核心技术——跟开涛学搭建高可用高并发系统

京东基础架构建设之路

京东数据中心构建实战

相关 [统一 服务 系统架构] 推荐：

相关文章

订阅

相关 [统一服务系统架构] 推荐：