在集中式环境中服务的机器台只有一台,这样对于服务不仅存在服务单点故障问题而且还存在流量问题。为了解决这个问题,就引入的分布式与集群概念。
分布式:一个业务分拆多个子业务,部署在不同的服务器上
集群:同一个业务,部署在多个服务器上
1、 dubbo 服务治理
当请求来临时,如何从多个服务器中,选择一个有效、合适的服务器,这个集群所需要面对一问题。所以在集群里面就引申出负载均衡(LoadBalance),高可用(HA),路由(Route)等概念。我们来看一下 dubbo 在进行服务调用的时候是如何处理的。
这张集群容错包含以下几个角色:
Invoker
:对Provider
(服务提供者) 的一个可调用 Service 接口的抽象,Invoker
封装了Provider
地址及Service
接口信息。Cluster
:Directory
中的多个Invoker
伪装成一个Invoker
,对上层透明,伪装过程包含了容错逻辑,调用失败后,重试另一个Directory
:代表多个Invoker
,可以把它看成List<Invoker>
,但与 List 不同的是,它的值可能是动态变化的,比如注册中心推送变更Router
: 负责从多个Invoker
中按路由规则选出子集,比如读写分离,应用隔离等LoadBalance
:LoadBalance
负责从多个Invoker
中选出具体的一个用于本次调用,选的过程包含了负载均衡算法,调用失败后,需要重选.
2、负载均衡
下面我们来分析一下 LoadBalance, 也就是负载均衡。我们可以来看一下 维基百科, 对于负载均衡的描述。
在计算中,负载平衡1提高了跨多个计算资源的工作负载分布,例如计算机、计算机集群、网络链接、中央处理器或磁盘驱动器。负载平衡的目的是优化资源使用,最大化吞吐量,最小化响应时间,避免任何单一资源的过载。使用负载平衡而不是单个组件的多个组件可以通过冗余来提高可靠性和可用性。负载平衡通常涉及专用的软件或硬件,比如多层交换机或域名系统服务器进程。
负载平衡与渠道结合的不同之处在于,负载平衡分裂之间的交通网络上的网络接口插座(OSI模型层4)基础上,而通道结合意味着一个部门之间的交通物理接口在一个较低的水平,每包(OSI模型层3)或在一个数据链路(OSI模型层2)基础与最短路径等协议桥接。
3、dubbo LoadBalance
以下是 dubbo 中 负载均衡的定义:
public interface LoadBalance {
/**
* select one invoker in list.
*
* @param invokers invokers.
* @param url refer url
* @param invocation invocation.
* @return selected invoker.
*/
@Adaptive("loadbalance")
<T> Invoker<T> select(List<Invoker<T>> invokers, URL url, Invocation invocation) throws RpcException;
}
负载平衡的其实就是根据不同的策略从 Invoker 列表中选择中一个适合的 Invoker 来进行远程调用。
我们来看一下 dubbo 里面的 LoadBalance 类图:
3.1 RandomLoadBalance
RandomLoadBalance : 随机,按权重设置随机概率。
在一个截面上碰撞的概率高,但调用量越大分布越均匀,而且按概率使用权重后也比较均匀,有利于动态调整提供者权重。
3.2 RoundRobinLoadBalance
RoundRobinLoadBalance:轮循,按公约后的权重设置轮循比率。
存在慢的提供者累积请求的问题,比如:第二台机器很慢,但没挂,当请求调到第二台时就卡在那,久而久之,所有请求都卡在调到第二台上。
3.3 LeastActiveLoadBalance
LeastActiveLoadBalance :最少活跃调用数,相同活跃数的随机,活跃数指调用前后计数差。
使慢的提供者收到更少请求,因为越慢的提供者的调用前后计数差会越大。
3.4 ConsistentHashLoadBalance
- 一致性 Hash ,相同参数的请求总是发到同一提供者。
- 当某一台提供者挂时,原本发往该提供者的请求,基于虚拟节点,平摊到其它提供者,不会引起剧烈变动。
- 算法参见:http://en.wikipedia.org/wiki/Consistent_hashing
- 缺省只对第一个参数 Hash,如果要修改,请配置
<dubbo:parameter key="hash.arguments" value="0,1" />
- 缺省用 160 份虚拟节点,如果要修改,请配置
<dubbo:parameter key="hash.nodes" value="320" />
4、LoadBalance 算法
负载均衡算法有几种经典实现,已经是老生常谈了,总结后主要有如下几个:
- 轮询(Round Robin)
- 加权轮询(Weight Round Robin)
- 随机(Random)
- 加权随机(Weight Random)
- 源地址哈希(Hash)
- 一致性哈希(ConsistentHash)
- 最小连接数(Least Connections)
- 低并发优先(Active Weight)
dubbo 默认支持 1、2、3、7 这4种负载均衡策略,如果你需要使用另外 4 种负载均衡策略。可以使用 dubbo 的 SPI 机制来扩展 LoadBalance。具体可以参考 dubbo 负载均衡扩展
参考文章:
1.http://en.wikipedia.org/wiki/Load_balancing_(computing)
2.http://dubbo.apache.org/books/dubbo-user-book/demos/loadbalance.html
3.https://www.cnkirito.moe/rpc-cluster/
Java 面试宝典是大明哥全力打造的 Java 精品面试题,它是一份靠谱、强大、详细、经典的 Java 后端面试宝典。它不仅仅只是一道道面试题,而是一套完整的 Java 知识体系,一套你 Java 知识点的扫盲贴。
它的内容包括:
- 大厂真题:Java 面试宝典里面的题目都是最近几年的高频的大厂面试真题。
- 原创内容:Java 面试宝典内容全部都是大明哥原创,内容全面且通俗易懂,回答部分可以直接作为面试回答内容。
- 持续更新:一次购买,永久有效。大明哥会持续更新 3+ 年,累计更新 1000+,宝典会不断迭代更新,保证最新、最全面。
- 覆盖全面:本宝典累计更新 1000+,从 Java 入门到 Java 架构的高频面试题,实现 360° 全覆盖。
- 不止面试:内容包含面试题解析、内容详解、知识扩展,它不仅仅只是一份面试题,更是一套完整的 Java 知识体系。
- 宝典详情:https://www.yuque.com/chenssy/sike-java/xvlo920axlp7sf4k
- 宝典总览:https://www.yuque.com/chenssy/sike-java/yogsehzntzgp4ly1
- 宝典进展:https://www.yuque.com/chenssy/sike-java/en9ned7loo47z5aw
目前 Java 面试宝典累计更新 400+ 道,总字数 42w+。大明哥还在持续更新中,下图是大明哥在 2024-12 月份的更新情况:
想了解详情的小伙伴,扫描下面二维码加大明哥微信【daming091】咨询
同时,大明哥也整理一套目前市面最常见的热点面试题。微信搜[大明哥聊 Java]或扫描下方二维码关注大明哥的原创公众号[大明哥聊 Java] ,回复【面试题】 即可免费领取。