实用技巧:Spring Cloud中,如何优雅下线微服务?
在生产环境中,服务的上下线是不可避免的,我们希望能够优雅地下线微服务。本文基于Spring Boot 2.x + Spring Cloud Finchley讲解实际项目中优雅下线服务的四种方式,并探讨各方式的优缺点。
注:Spring Boot 1.x + Spring Cloud Edgware及之前的方式相同,但配置有区别,本文不做讨论。
方式一:kill java进程【不建议】
使用方式:
|
|
该方式借助的是Spring Boot应用的Shutdown hook,应用本身的下线也是优雅的,但如果你的服务发现组件使用的是Eureka,那么默认最长会有90秒的延迟,其他应用才会感知到该服务下线, 这意味着:该实例下线后的90秒内,其他服务仍然可能调用到这个已下线的实例。因此,该方式是 不够优雅的 。
方式二: /shutdown
端点【不建议】
Spring Boot提供了 /shutdown
端点,可以借助它实现优雅停机。使用方式:
-
在想下线应用的
applicationyml
中添加如下配置,从而启用并暴露/shutdown
端点:12345678management:endpoint:shutdown:enabled: trueendpoints:web:exposure:include: shutdown -
发送POST请求到
/shutdown
端点1curl -X http://你想停止的服务地址/actuator/shutdown
该方式本质和方式一是一样的,也是借助Spring Boot应用的Shutdown hook去实现的。
方式三: /pause
端点【生产可用,但有一点缺陷】
Spring Boot应用提供了 /pause
端点,利用该端点可实现优雅下线。
使用方式:
-
在想下线应用的
application.yml
中添加配置,从而启用并暴露/pause
端点:123456789101112management:endpoint:# 启用pause端点pause:enabled: true# 启用restart端点,之所以要启用restart端点,是因为pause端点的启用依赖restart端点的启用。详见:https://cloud.spring.io/spring-cloud-static/Finchley.SR2/single/spring-cloud.html#_endpointsrestart:enabled: trueendpoints:web:exposure:include: pause,restart -
发送POST请求到
/actuator/pause
端点:1curl -X POST http://你想停止的服务实例地址/actuator/pause -
执行后的效果类似下图:
如图所示,该应用在Eureka Server上的状已被标记为
DOWN
, 但是应用本身其实依然是可以正常对外服务的。在Spring Cloud中,Ribbon做负载均衡时,只会负载到标记为UP
的实例上。利用这两点,你可以:先用pause端点,将要下线的应用标记为DOWN,但不去真正停止应用;然后过一定的时间(例如90秒,或者自己做个监控,看当前实例的流量变成0后)再去停止应用,例如kill 应用
,当然如果你足够变态,kill -9 也可以
。
缺点&局限
缺点 | 描述 |
---|---|
不同的版本配置不大一样 | 早期的Spring Cloud版本中,,pause端点是不依赖restart端点的,后来一个pull request导致pause端点必须依赖restart端点…个人给官方提issue,官方最后选择了继续依赖,我也是醉了…… |
无法和Eureka的健康检查配合使用 | 如果你的服务发现组件用的是Eureka,并且你的应用开启了健康检查( eureka.client.healthcheck.enabled = true , 那么 /pause 端点无效!!! |
方式四: /service-registry
端点【生产可用】
使用方式:
-
在想下线应用的
application.yml
中添加配置,从而暴露/service-registry
端点:12345management:endpoints:web:exposure:include: service-registry发送POST请求到
/actuator/service-registry
端点:12curl -X "POST" "http://localhost:8000/actuator/service-registry?status=DOWN" \-H "Content-Type: application/vnd.spring-boot.actuator.v2+json;charset=UTF-8"实行后的效果类似如下图:
由图可知,使用
/service-registry
端点可实现类似/pause
端点的效果。
缺点
暂时没有发现缺点。
拓展一下
在实际项目中,你可以做一个运维工具:
- 运维工具读取服务发现组件中的所有服务。
- 有一天你想下线某个服务的时候,就点击该示例的“优雅下线” 按钮,该按钮会请求到想要下线的服务的
/pause
端点或者service-registry
端点(看你能不能容忍/pause
端点的缺点),这样就可以把该实例在Eureka上标记为DOWN,流量过一段时间后就不会打到这个实例上。 - 做一个流量检测工具(例如QPS统计,这种百度随便找下,最简单的一个过滤器 + map就可以做了),如果检测到当前实例确实已经没有流量进入,就在运维工具上点击另一个按钮,例如停止。真正停止应用。
- 当然,如何停止应用又是另一个问题了,例如你可以请求实例的shutdown端点(Spring Boot提供了优雅下线的端点),或者用脚本kill,或者如果是容器可以借助一些探针……