2023-08-08  阅读(3)
原文作者:Ressmix 原文地址:https://www.tpvlog.com/article/170

从本章开始,我将讲解在生产环境部署Elasticsearch集群的一些核心关注点、调优方案、问题解决方案。

一般来说,如果我们刚开始使用Elasticsearch,都是先在自己的笔记本上,安装一个Elasticsearch节点,然后开始学习和试用其中的功能。但是如果我们要将Elasticsearch部署到生产环境中,还需要考虑很多东西,比如部署的机器内存、CPU、磁盘、JVM等各种资源和配置。

本章,我就聊一聊生产环境中的Elasticsearch集群规划。

一、集群规划

1.1 内存

Elasticsearch是非常消耗内存的,而且消耗的主要不是JVM内存,而是Filesystem OS Cache。如果读者还记得《持久化原理》这一章的内容,就知道Elasticsearch底层是基于Lucene的,而Lucene又会基于磁盘文件来读写和保存索引数据。Lucene会尽量将频繁访问的segment缓存在Filesystem OS Cache中,以提升磁盘文件读写的性能。

所以说, Elasticsearch的性能主要取决于机器除了分配给jvm heap以外的内存,这些剩下的内存会留给ES的segment文件做缓存

在生产环境中使用Elasticsearch,如果数据量达到亿级,那么建议每台机器的内存配置要给到64G。

1.2 CPU

Elasticsearch对于CPU的要求比较低一些,一般64G内存的机器,配个8~16核CPU就可以了。

1.3 磁盘

Elasticsearch对于磁盘的要求是比较高的,尤其是那些涉及大量写操作的ES集群,比如日志分析系统,这类系统很容易因为磁盘的读写性能造成整个集群的性能瓶颈。

deadline/noop scheduler

如果我们能够使用SSD固态硬盘,而不是机械硬盘,那么当然是最好的,SSD的性能比普通机械硬盘高很多倍。但是使用SSD硬盘的话,需要注意正确配置I/O scheduler。当我们将数据写入磁盘时,IO scheduler会决定什么时候数据才会真正的写入磁盘,而不是停留在os cache中。

在大多数机器上,默认的IO schedulercfq——completely fair queuing。cfq机制会给每个进程都分配一些时间片(time slice),然后优化每个进程的数据如何写入磁盘中,优化的思路主要是根据磁盘的物理布局来决定如何将数据写入磁盘,从而提升写入磁盘的性能。

但是cfq这种机制,对于SSD来说是不太高效的,因为SSD跟机械硬盘是不一样的,SSD不涉及到机械磁盘旋转和磁头读取这种传统的读写机制。对于SSD来说,应该用 deadline/noop schedulerdeadline scheduler会基于写操作被pending了多长时间来进行写磁盘优化,而noop scheduler就是一个简单的FIFO机制。

所以,对于生产环境,如果使用的是SSD固态硬盘,建议调整IO scheduler为 deadline/noop scheduler ,这样可以带来很大的性能提升,甚至可以达到数百倍。

RAID 0

此外,使用 RAID 0 也是一种提升磁盘读写速度的高效方式,无论是对于机械硬盘还是SSD都一样。RAID 0也叫做条带式存储机制(striping),在RAID各种级别中性能是最高的。RAID 0的基本原理,是把连续的数据分散存储到多个磁盘上进行读写,也就是对数据进行条带式存储。这样系统的磁盘读写请求就可以被分散到多个磁盘上并行执行,从而提供了磁盘IO性能。

最后,我们要避免跟网络相关的存储模式——network-attached storage,比如NAS。虽然很多供应商都说他们的NAS解决方案性能非常高,而且比本地存储的可靠性更高。但是实际上用起来会有很多性能和可靠性上的风险,一般因为网络传输会造成较高的延时,同时还有单点故障的风险。

1.4 网络

对于Elasticsearch,快速可靠的网络是非常重要的。因为高速网络通信可以让ES的节点间通信达到低延时的效果,高带宽也可以让shard分配、数据同步等操作更加快速。现代的数据中心网络对于大多数的集群来说,性能都足够高了,比如千兆网卡就可以满足Elasticsearch集群对网路的要求。

但是,要避免一个Elasticsearch集群横跨多个数据中心的情况,比如异地多机房部署一个ES集群。因为跨机房的传输会导致网络通信和数据传输性能较差,而ES集群是一种p2p模式的分布式系统架构,不是master/slave。

在ES集群中所有的node都是对等的,任意两个node间的互相通信都是很频繁和正常的,如果异地多机房部署,可能会导致node间频繁跨地域通信,通信延时会非常高,甚至造成集群运行频繁不正常。

二、容量规划

我们进行Elasticsearch集群规划时,需要确认使用多少台服务器,每台服务器的配置,能够支撑预计多大的数据量。但是这个东西不是一概而论的,要视具体的读写场景,根据读写QPS来确定。不过根据我的实际经验,对于很多的中小型公司来说,建议ES集群承载的数据量在10亿规模以内。

我这里给出一个容量规划示例:

  1. 预估希望能够承载的总数据量,比如10亿条document;
  2. 预估希望的搜索性能,比如达到ms级别;
  3. 计算数据所需的总内存:ES的内存开销主要有两部分——os cache和jvm heap,一般而言2:1分配就可以了。比如每条document的大小是250byte,那么10亿条总共就是250G,算上jvm heap,大约400G;由于最终落地磁盘时ES还有一些自身的数据需要缓存,再加上机器上的其它进程也需要消耗内存,所以总共分配600G。
  4. 计算机器数量:8核64G的机器,支撑600G总内存,分配10台就足够了,这样所有数据基本都可以被缓存,性能其实可以达到ms级别。

根据经验,对于10亿级的数据量,如果对于性能要求是秒级的,那么64G内存的机器,一般5台就够了,此时Elasticsearch不能缓存所有数据,很多数据的检索还是要走磁盘。

三、总结

本章,我介绍了在生产环境中部署Elasticsearch集群时,需要注意的机器CPU、内存、磁盘、网络的情况,同时对容量规划给出了建议。


Java 面试宝典是大明哥全力打造的 Java 精品面试题,它是一份靠谱、强大、详细、经典的 Java 后端面试宝典。它不仅仅只是一道道面试题,而是一套完整的 Java 知识体系,一套你 Java 知识点的扫盲贴。

它的内容包括:

  • 大厂真题:Java 面试宝典里面的题目都是最近几年的高频的大厂面试真题。
  • 原创内容:Java 面试宝典内容全部都是大明哥原创,内容全面且通俗易懂,回答部分可以直接作为面试回答内容。
  • 持续更新:一次购买,永久有效。大明哥会持续更新 3+ 年,累计更新 1000+,宝典会不断迭代更新,保证最新、最全面。
  • 覆盖全面:本宝典累计更新 1000+,从 Java 入门到 Java 架构的高频面试题,实现 360° 全覆盖。
  • 不止面试:内容包含面试题解析、内容详解、知识扩展,它不仅仅只是一份面试题,更是一套完整的 Java 知识体系。
  • 宝典详情:https://www.yuque.com/chenssy/sike-java/xvlo920axlp7sf4k
  • 宝典总览:https://www.yuque.com/chenssy/sike-java/yogsehzntzgp4ly1
  • 宝典进展:https://www.yuque.com/chenssy/sike-java/en9ned7loo47z5aw

目前 Java 面试宝典累计更新 400+ 道,总字数 42w+。大明哥还在持续更新中,下图是大明哥在 2024-12 月份的更新情况:

想了解详情的小伙伴,扫描下面二维码加大明哥微信【daming091】咨询

同时,大明哥也整理一套目前市面最常见的热点面试题。微信搜[大明哥聊 Java]或扫描下方二维码关注大明哥的原创公众号[大明哥聊 Java] ,回复【面试题】 即可免费领取。

阅读全文