2023-02-27  阅读(41)
原文作者:Java日知录 原文地址:https://javadaily.cn

导读:本篇作为SpringCloud Alibaba微服务实战系列的第五篇,主要内容是使用Sentinel给微服务加上限流熔断功能,防止异常情况拖垮应用服务。系列文章,欢迎持续关注。

202302272258513742.png

简介

Sentinel是面向分布式服务框架的轻量级流量控制框架,主要以流量为切入点,从流量控制,熔断降级,系统负载保护等多个维度来维护系统的稳定性。在SpringCloud体系中,sentinel主要是为了替换原Hystrix的功能,与Hystrix相比,sentinel的隔离级别更加精细,提供的Dashboard可以在线更改限流熔断规则,而且使用也越加方便。要了解更多详细信息请移步至Sentinel官网。

基础准备

要使用Sentinel提供的限流熔断能力,需要先做如下准备:

  • 安装Sentinel 这部分内容我已经在第一期SpringCloud Alibaba微服务实战一 - 基础环境准备中提过,大家可以翻阅查看。
  • 引入Sentinel 在需要配置限流熔断服务的POM文件中引入Sentinel组件
    <!--Sentinel-->
    <dependency>
    	<groupId>org.springframework.cloud</groupId>
    	<artifactId>spring-cloud-starter-alibaba-sentinel</artifactId>
    </dependency>
  • 自定义资源@SentinelResource我们只需要在相关方法上加上@SentinelResource注解,让其可以成为sentinel识别的资源即可。如:
    @GetMapping("/account/getByCode/{accountCode}")
    @SentinelResource(value = "getByCode")
    public ResultData<AccountDTO> getByCode(@PathVariable(value = "accountCode") String accountCode){
    	log.info("get account detail,accountCode is :{}",accountCode);
    	AccountDTO accountDTO = accountService.selectByCode(accountCode);
    	return ResultData.success(accountDTO);
    }
  • 在配置文件中添加sentinel的服务端地址
    server:
      port: 8010
    spring:
      application:
        name: account-service
      cloud:
        nacos:
          discovery:
            server-addr: 192.168.0.107:8848/
        sentinel:
          transport:
          # sentinel服务端地址
            dashboard: 192.168.0.107:8858
          # 取消延迟加载
          eager: true

经过以上几步我们准备好了使用Sentinel的基础环境,接下来我们看看限流熔断的具体配置。

限流

概念说明

生产者accout-service是一个核心服务,我们通过压测得出服务的最大负载能力为60。如果某个时间account-service的请求数飙升达到了600,那服务肯定就直接gg了。所以为了保护我们的accout-service,我们会给它配置一个限流规则,如果每秒钟有超过60的请求那不好意思我直接丢掉不处理了,然后丢给消费者一个异常,想拖垮我,哼,没门!。

202302272258522413.png

总而言之,限流是通过限制调用方对自己的调用,起到保护自己系统的效果。

限流配置

理想是丰满的,现实是骨感的。由于本人对Jmeter之类的压测工具不是很精通所以为了方便测试,我们就将accout-service的QPS单机阈值设置成5,如果每秒QPS超过5,直接丢弃。

202302272258529754.png

这里的资源名就是我们使用@SentinelResource注解自定义的资源。

打开浏览器,快速刷新浏览器,当每秒请求数超过5时会看到如下错误:

202302272258538455.png

在后端服务日志中你会看到如下的错误日志:

    2019-12-10 14:22:31,948 ERROR [dispatcherServlet]:175 - Servlet.service() for servlet [dispatcherServlet] in context with path [] threw exception [Request processing failed; nested exception is java.lang.reflect.UndeclaredThrowableException] with root cause
    com.alibaba.csp.sentinel.slots.block.flow.FlowException: null

不要慌,这说明我们的目的达到了,限流成功!

自定义异常

我们可以通过@SentinelResource中添加blockHandler参数,给其添加自定义异常方法。如:

    @GetMapping("/account/getByCode/{accountCode}")
    @SentinelResource(value = "getByCode",blockHandler = "handleException")
    public ResultData<AccountDTO> getByCode(@PathVariable(value = "accountCode") String accountCode){
    	log.info("get account detail,accountCode is :{}",accountCode);
    	AccountDTO accountDTO = accountService.selectByCode(accountCode);
    	return ResultData.success(accountDTO);
    }
    /**
     * 自定义异常策略
     * 返回值和参数要跟目标函数一样,参数可以追加BlockException
     */
    public ResultData<AccountDTO> handleException(String accountCode,BlockException exception){
    	log.info("flow exception{}",exception.getClass().getCanonicalName());
    	return ResultData.fail(900,"达到阈值了,不要再访问了!");
    }

注意,自定义的异常方法的参数和返回值要跟目标方法一样,参数可以追加BlockException

效果如下:

202302272258545766.png

比之前的那个错误页优雅多了有木有!

持久化配置

由于Sentinel的配置默认是放在内存中的,每当应用重启或者sentinel重启都会丢失数据,我们这里使用Nacos作为配置中心持久化限流配置。

  • 修改pom文件,引入sentinel-datasource-nacos组件
    <dependency>
    	<groupId>com.alibaba.csp</groupId>
    	<artifactId>sentinel-datasource-nacos</artifactId>
    </dependency>
  • 修改application.yml,配置sentinel的数据源
    spring:
      cloud:
        sentinel:
          datasource:
            ds:
              nacos:
                server-addr: 10.0.10.48:8848
                data-id: ${spring.application.name}-sentinel
                group-id: DEFAULT_GROUP
                rule-type: flow
  • 在nacos中建立限流配置account-service-sentinel(配置格式设置成json)
    [
        {
            "resource": "getByCode",
            "limitApp": "default",
            "grade": 1,
            "count": 3,
            "strategy": 0,
            "controlBehavior": 0,
            "clusterMode": false
        }
    ]

可以看到上面配置规则是一个数组类型,数组中的每个对象是针对每一个保护资源的配置对象,每个对象中的属性解释如下:

resource:资源名,即限流规则的作用对象
limitApp:流控针对的调用来源,若为 default 则不区分调用来源
grade:限流阈值类型(QPS 或并发线程数);0代表根据并发数量来限流,1代表根据QPS来进行流量控制
count:限流阈值
strategy:调用关系限流策略
controlBehavior:流量控制效果(直接拒绝、Warm Up、匀速排队)
clusterMode:是否为集群模式

  • 进入sentinel查看dashboard,发现sentinel自动获取nacos的配置

    202302272258551187.png

  • 频繁刷新浏览器调用接口,验证接口是否正常限流

熔断

概念说明

消费者order-service需要先调用product-service获取具体的product,然后再处理其他的业务逻辑。但是这个product-service接口不是很稳定,经常抛出异常;或者是响应缓慢,导致order-service的响应变慢;如果置之不理,order-service可能会被product-service拖垮。这时候为了保护order-service,我们需要对product-service接口进行熔断。

202302272258558738.png

image.png

一言以蔽之:熔断是通过限制自己对外部系统的调用, 起到节约响应时间、维护链路稳定的作用。

熔断配置

Sentinel中的熔断降级有三个降级策略:

  • RT(平均响应时间):当资源的平均响应时间超过阈值之后,资源进入准降级状态。接下来如果持续进入 5 个请求,它们的 RT 都持续超过这个阈值,那么在接下的时间窗口之内,对这个方法的调用都会自动抛出 DegradeException 异常。在下一个时间窗口到来时, 会接着再放入5个请求, 再重复上面的判断.
  • 异常比例 当资源的每秒异常总数占通过量的比值超过阈值之后,资源进入降级状态,即在接下的时间窗口之内,对这个方法的调用都会自动地抛出DegradeException异常。异常比率的阈值范围是 [0.0, 1.0],代表 0% - 100%。
  • 异常数 当资源近 1 分钟的异常数目超过阈值之后会进行熔断。

首先我们对原接口进行改造,让其直接抛出Runtimeexception

    @GetMapping("/product/getByCode/{productCode}")
    @SentinelResource(value = "/product/getByCode",fallback = "fallbackHandler")
    public ResultData<ProductDTO> getByCode(@PathVariable String productCode){
    	log.info("get product detail,productCode is :{}",productCode);
    	ProductDTO productDTO = productService.selectByCode(productCode);
    	throw new RuntimeException("error");
    //        return ResultData.success(productDTO);
    }

这里我们将product-service设置如下的熔断规则:

202302272258567999.png

如果/product/getByCode的异常率超过50%,那么接下来2秒内直接触发熔断降级,默认情况会抛出DegradeException异常,如:

    2019-12-10 19:35:53,764 ERROR [dispatcherServlet]:175 - Servlet.service() for servlet [dispatcherServlet] in context with path [] threw exception [Request processing failed; nested exception is java.lang.reflect.UndeclaredThrowableException] with root cause
    com.alibaba.csp.sentinel.slots.block.degrade.DegradeException: null

自定义异常

自定义熔断异常跟限流异常类似,我们使用fallback属性指定自定义异常的方法,如:

    @SentinelResource(value = "/product/getByCode",fallback = "fallbackHandler")
    public ResultData<ProductDTO> getByCode(@PathVariable String productCode){
     ...
    }
    /**
     * 自定义熔断异常
     * 返回值和参数要跟目标函数一样
     */
    public ResultData<ProductDTO> fallbackHandler(String productCode){
    	return ResultData.fail(800,"服务被熔断了,不要调用!");
    }

注意,自定义的异常方法的参数和返回值要跟目标方法一样

效果如下:

2023022722585728710.png

持久化配置

  • 引入sentinel-datasource-nacos组件,跟限流一样配置即可
  • 修改application.yml,配置sentinel的数据源
    spring:
      cloud:
        sentinel:
          datasource:
            ds:
              nacos:
                server-addr: 192.168.0.106:8848
                data-id: ${spring.application.name}-sentinel-degrade
                group-id: DEFAULT_GROUP
                rule-type: degrade
  • 在nacos中建立配置文件product-service-sentinel-degrade,做如下配置
    [
        {
        "resource": "/product/getByCode",
        "count": 0.5,
        "grade": 1,
        "passCount": 0,
        "timeWindow": 2
      }
    ]

可以看到上面配置规则是一个数组类型,数组中的每个对象是针对每一个保护资源的配置对象,每个对象中的属性解释如下:

resource:资源名,即降级规则的作用对象
count:阈值
grade:降级模式 0:RT 1:异常比例 2:异常数
timeWindow:时间窗口(单位秒)

  • 进入sentinel查看dashboard,发现sentinel自动获取nacos的配置

    2023022722585785711.png

血与泪

大家在使用sentinel过程中如果出现Failed to fetch metric from的错误,具体表现如下:

    Failed to fetch metric from <http://192.168.136.1:8719/metric?startTime=1563865044000&endTime=1563865050000&refetch=false>
     (ConnectionException: Connection refused: no further information)

这个时候你需要去检查下sentinel控制台的服务列表,确认是否跟你ip一致。(我之前是装过虚拟机,sentinel一直抓取的是我虚拟的ip,不知道为什么。。。)

2023022722585842012.png

如果发现监听的地址不对的话,可以在sentinel客户端配置中加入客户端ip配置

    spring:
      cloud:
        sentinel:
          transport:
            client-ip: 192.168.0.108

至此我们已经给我们的微服务加上了限流熔断保护,再也不用担心异常流量的冲击,下游系统不稳定导致自身服务不可用了。那么本期的“SpringCloud Alibaba微服务实战五 - 限流熔断”篇也就该结束啦,咱们下期有缘再见!


Java 面试宝典是大明哥全力打造的 Java 精品面试题,它是一份靠谱、强大、详细、经典的 Java 后端面试宝典。它不仅仅只是一道道面试题,而是一套完整的 Java 知识体系,一套你 Java 知识点的扫盲贴。

它的内容包括:

  • 大厂真题:Java 面试宝典里面的题目都是最近几年的高频的大厂面试真题。
  • 原创内容:Java 面试宝典内容全部都是大明哥原创,内容全面且通俗易懂,回答部分可以直接作为面试回答内容。
  • 持续更新:一次购买,永久有效。大明哥会持续更新 3+ 年,累计更新 1000+,宝典会不断迭代更新,保证最新、最全面。
  • 覆盖全面:本宝典累计更新 1000+,从 Java 入门到 Java 架构的高频面试题,实现 360° 全覆盖。
  • 不止面试:内容包含面试题解析、内容详解、知识扩展,它不仅仅只是一份面试题,更是一套完整的 Java 知识体系。
  • 宝典详情:https://www.yuque.com/chenssy/sike-java/xvlo920axlp7sf4k
  • 宝典总览:https://www.yuque.com/chenssy/sike-java/yogsehzntzgp4ly1
  • 宝典进展:https://www.yuque.com/chenssy/sike-java/en9ned7loo47z5aw

目前 Java 面试宝典累计更新 400+ 道,总字数 42w+。大明哥还在持续更新中,下图是大明哥在 2024-12 月份的更新情况:

想了解详情的小伙伴,扫描下面二维码加大明哥微信【daming091】咨询

同时,大明哥也整理一套目前市面最常见的热点面试题。微信搜[大明哥聊 Java]或扫描下方二维码关注大明哥的原创公众号[大明哥聊 Java] ,回复【面试题】 即可免费领取。

阅读全文