在集中式环境中服务的机器台只有一台,这样对于服务不仅存在服务单点故障问题而且还存在流量问题。为了解决这个问题,就引入的分布式与集群概念。
分布式:一个业务分拆多个子业务,部署在不同的服务器上
集群:同一个业务,部署在多个服务器上
1、 dubbo 服务治理
当请求来临时,如何从多个服务器中,选择一个有效、合适的服务器,这个集群所需要面对一问题。所以在集群里面就引申出负载均衡(LoadBalance),高可用(HA),路由(Route)等概念。我们来看一下 dubbo 在进行服务调用的时候是如何处理的。
这张集群容错包含以下几个角色:
Invoker
:对Provider
(服务提供者) 的一个可调用 Service 接口的抽象,Invoker
封装了Provider
地址及Service
接口信息。Cluster
:Directory
中的多个Invoker
伪装成一个Invoker
,对上层透明,伪装过程包含了容错逻辑,调用失败后,重试另一个Directory
:代表多个Invoker
,可以把它看成List<Invoker>
,但与 List 不同的是,它的值可能是动态变化的,比如注册中心推送变更Router
: 负责从多个Invoker
中按路由规则选出子集,比如读写分离,应用隔离等LoadBalance
:LoadBalance
负责从多个Invoker
中选出具体的一个用于本次调用,选的过程包含了负载均衡算法,调用失败后,需要重选.
2、 目录服务
下面我们来分析一下 Directory, 也就是目录服务。我们可以来看一下 维基百科, 对于目录服务的描述。
在计算中,目录服务或名称服务将网络资源的名称映射到它们各自的网络地址。它是一个共享的信息基础设施,用于定位、管理、管理和组织日常项目和网络资源,这些资源包括卷、文件夹、文件、打印机、用户、组、设备、电话号码和其他对象。目录服务是网络操作系统的关键组件。目录服务器是提供此类服务的服务器。网络上的每个资源都被目录服务器视为对象。关于特定资源的信息存储为与该资源或对象相关联的属性集合。
目录服务为网络定义一个名称空间。名称空间用于为每个对象分配名称(惟一标识符)。目录通常有一组规则来决定如何命名和识别网络资源,这通常包括一个要求,标识符是唯一的和明确的。在使用目录服务时,用户不需要记住网络资源的物理地址;提供一个名称来定位资源。有些目录服务包括访问控制条款,限制了对授权用户的目录信息的可用性。
3、Directory
下面我们来看一下 Directory 接口的定义:
public interface Directory<T> extends Node {
/**
* get service type.
*
* @return service type.
*/
Class<T> getInterface();
/**
* list invokers.
*
* @return invokers
*/
List<Invoker<T>> list(Invocation invocation) throws RpcException;
}
集群调用的时候可以通过目录服务的list
方法获取到 Invoker 列表,它有两种具体的实现:
3.1、StaticDirectory
StaticDirectory :静态目录,它的 Invoke 列表是通过构造器传入。服务消费方在引用服务的时候把多注册中心暴露的 Invoke 以构造器的形式传入到 StaticDirectory,然后再由 Cluster 伪装为一个 Invoke 提供给服务消费方调用。
StaticDirectory 的 list 方法直接返回所有 invoker 集合。
3.2、RegistryDirectory
RegistryDirectory:注册目录服务,实现 NotifyListener 接口。当有服务注册到注册中心上面,会动态更新到注册目录服务里面。
消费方调用某个远程服务,会向注册中心订阅这个服务的所有服务提供方。当服务提供方的数据有变动时就会回调消费方RegistryDirectory#notify
把传入的所有服务提供方的 URL 地址转换为 Invoker 列表。
这样就起到了服务治理中的服务自动发现。