Java 面试宝典：分库分表后，如何解决 join 的问题？

详情

在拆分之前，我们系统中很多列表和详情所需要的数据大部分从多张表中获取的，这个时候我们使用 join 操作即可。但是分库分表后，这些表可能会被分散在多个库中，这个时候我们是无法进行 join 操作的。虽然 Sharding Sphere 支持跨库 join ，但是我们基于架构规范、安全、性能方面的考虑，我们都会强制禁止跨库 join 操作的。那怎么解决呢？有如下几种方案：

一、全局表 OR 数据冗余

为了避免 join 操作我们可以使用全局表，即一个表中存储所有需要查询的字段，这样我们就只需要查询这一张全局表了，而不需要执行 join 操作。比如在订单列表中，我们总是会显示用户名，这时我们可以在 t_order 表中冗余用户信息：

CREATE TABLE t_order (
    order_id INT PRIMARY KEY,
    user_id INT,
    user_name VARCHAR(100),  -- 冗余的用户信息
    product_id INT
);

这样在查询订单列表时就不需要关联用户表了。

这种方案虽然能够减少 join 操作，但是它会增加存储，同时在新增、修改操作时也会带来额外的操作。

二、应用层 join

由应用层来执行 join 操作，具体步骤如下：

分布查询：查询各个分片的数据。即在各个库中查询各自的相关字段的数据
数据汇总：在应用层将各个分片数据进行汇总
手动 join：在应用层对各个分片数据进行匹配、合并、汇总

例如：假设有两个表 t_order 和 t_user 分别存储在不同的数据库实例中，且我们需要查询某个用户的订单信息。

// 根据用户id 查询用户的订单数据
List<Order> orders = orderService.getOrdersByUserId(userId);

// 查询用户信息
User user = userService.getUserById(userId);

// 组装数据
orders.forEach(order -> order.setUser(user));

三、利用 ElasticSearch

将所有需要查询的字段全部纳入到 ElasticSearch 中，利用 ElasticSearch 的宽表思想，将多张表中我们所需要的字段组成一个文档，这样我们就可以利用 ElasticSearch 来做一些大数据检索和复杂搜索的场景了。

最后

对于简单的列表查询或者详情查询时，大明哥推荐采用应用层 join 组装数据。而针对大数据检索和复杂的搜索场景下，大明哥还是力推 ElasticSearch。

对于数据冗余，这个哪怕不分库分表，我们也是可以做一些必要的冗余，这样能够极大地减轻我们的开发，减少不必要的 join 操作。当然，我们冗余的字段最好是一些不怎么变更的字段，如果经常变化的字段是没有必要进行冗余的。

Java 面试宝典是大明哥全力打造的 Java 精品面试题，它是一份靠谱、强大、详细、经典的 Java 后端面试宝典。它不仅仅只是一道道面试题，而是一套完整的 Java 知识体系，一套你 Java 知识点的扫盲贴。

它的内容包括：

大厂真题：Java 面试宝典里面的题目都是最近几年的高频的大厂面试真题。
原创内容：Java 面试宝典内容全部都是大明哥原创，内容全面且通俗易懂，回答部分可以直接作为面试回答内容。
持续更新：一次购买，永久有效。大明哥会持续更新 3+ 年，累计更新 1000+，宝典会不断迭代更新，保证最新、最全面。
覆盖全面：本宝典累计更新 1000+，从 Java 入门到 Java 架构的高频面试题，实现 360° 全覆盖。
不止面试：内容包含面试题解析、内容详解、知识扩展，它不仅仅只是一份面试题，更是一套完整的 Java 知识体系。
宝典详情：https://www.yuque.com/chenssy/sike-java/xvlo920axlp7sf4k
宝典总览：https://www.yuque.com/chenssy/sike-java/yogsehzntzgp4ly1
宝典进展：https://www.yuque.com/chenssy/sike-java/en9ned7loo47z5aw

目前 Java 面试宝典累计更新 400+ 道，总字数 42w+。大明哥还在持续更新中，下图是大明哥在 2024-12 月份的更新情况：

想了解详情的小伙伴，扫描下面二维码加大明哥微信【daming091】咨询

同时，大明哥也整理一套目前市面最常见的热点面试题。微信搜[大明哥聊 Java]或扫描下方二维码关注大明哥的原创公众号[大明哥聊 Java] ，回复【面试题】即可免费领取。

阅读全文