面试官:一张千万级别数据的表想做分页,如何优化?

介绍

当进行分页时,MySQL 并不是跳过 offset 行,而是取 offset+N 行,然后放弃前 offset 行,返回 N 行。例如 limit 10000, 20。mysql排序取出10020条数据后,仅返回20条数据,查询和排序的代价都很高。那当 offset 特别大的时候,效率就非常的低下,所以我们要对sql进行改写

使用书签

用书签记录上次取数据的位置,过滤掉部分数据

如下面语句

SELECT id, name, description FROM film ORDER BY name LIMIT 1000, 10;

可以改为

SELECT id, name, description FROM film WHERE name > 'begin' ORDER BY name LIMIT 10;

name为上次分页后的最大值,注意这种场景只适用于不存在重复值的场景。

延迟关联

延迟关联:通过使用覆盖索引查询返回需要的主键,再根据主键关联原表获得需要的数据

SELECT id, name, description FROM film ORDER BY name LIMIT 100,5;