炸！业界困难，跨库分页的几种常见方案

发布时间：2019-05-15 01:35:50 所属栏目：建站来源：58沈剑

导读：为什么必要研究跨库分页? 互联网许多营业都有分页拉取数据的需求，譬喻：微信动静过多时，拉取第N页动静; 京东下单过多时，拉取第N页订单; 赏识58同城，查察第N页帖子; 这些营业场景对应的动静表，订单表，帖子表分页拉取需求，都有这样一些配合的特点：

为了利便举例，假设一页只有5条数据，查询第200页的SQL语句为：

select * from T order by time offset 1000 limit 5;

步调一：查询改写

select * from T order by time offset 1000 limit 5;

改写为：

select * from T order by time offset 500 limit 5;

并投递给全部的分库，留意，这个offset的500，来自于全局offset的总偏移量1000，除以程度切分数据库个数2。

画外音：由于数据量较量大，数据随机性较强，不妨设如故切合“数据库分库-数据平衡定理”。

假如是3个分库，则可以改写为

select * from T order by time offset 333 limit 5;

假设这三个分库返回的数据(time, uid)如下：

炸！业界困难，跨库分页的几种常见方案

可以看到，每个分库都是返回的凭证time排序的一页数据。

步调二：找到所返回3页所稀有据的最小值

炸！业界困难，跨库分页的几种常见方案

故，三页数据中，time最小值来自第一个库，time_min=1487501123，这个进程只必要较量各个分库第一条数据，时刻伟大度很低。

画外音：这个time_min很是重要，后文每一个步调要都要用到time_min。

步调三：查询二次改写

第一次改写的SQL语句是

elect * from T order by time offset 333 limit 5;

第二次要改写成一个between语句：

第一个分库，第一次返回数据的最大值是1487501523

以是查询改写为：

select * from T order by time where time between time_min and 1487501523;

第二个分库，第一次返回数据的最大值是1487501323

以是查询改写为

select * from T order by time where time between time_min and 1487501323;

第三个分库，第一次返回数据的最大值是1487501553

以是查询改写为

select * from T order by time where time between time_min and 1487501553;

相对第一次查询，第二次查询前提放宽了，故第二次查询会返回比第一次查询功效集更多的数据，假设这三个分库返回的数据(time, uid)如下：

炸！业界困难，跨库分页的几种常见方案

可以看到：

步调四：在每个功效齐集假造一个time_min记录，找到time_min在全局的offset

炸！业界困难，跨库分页的几种常见方案

在第一个库中，time_min在第一个库的offset是333;

在第二个库中，(1487501133, uid_aa)的offset是333(按照第一次查询前提得出的)，故假造time_min在第二个库的offset是331;

画外音：从333往前推演。

在第三个库中，(1487501143, uid_aaa)的offset是333(按照第一次查询前提得出的)，故假造time_min在第三个库的offset是330;

画外音：从333往前推演。

综上，time_min在全局的offset是333+331+330=994。

（编辑：湖南网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

SEO排名难做的四大原因	在保持网站优化的同时
网站SEO优化的几个技巧	网站原创内容怎么写？