回表查询为什么是随机 I/O？

回表查询为何是随机 i/o

很多人误以为回表查询是顺序 I/O，因为我们已知所查记录的主键，从而可以定位到对应记录的磁盘位置。但实际上这是错误的。

顺序 I/O 和随机 I/O 的关键区别在于数据布局。顺序 I/O 指的是数据紧密相邻地存储在一起，而随机 I/O 则指数据分散在不同的位置。绝大多数硬盘数据库使用 B+ 树作为索引，且 B+ 树中的页是在硬盘上随机分布的。因此，当需要读取多个页时，几乎总是需要随机 I/O。

以 MySQL Innodb 为例，每个页的大小为 16KB，而页在硬盘上的位置是随机的。当需要跨页查询时，磁头需要进行多次定位操作。因此，涉及多个页的查询被认为是随机 I/O。

相比之下，Hbase 的页大小为 64MB，比 MySQL 大了 4000 倍。Hbase 使用 LSM 树，这种数据结构充分利用了硬盘的顺序读写特性，从而提高了查询性能。

因此，回表查询虽然利用了索引信息，但由于涉及多个随机分布的页，仍然被视为随机 I/O。

以上就是回表查询为什么是随机 I/O？的详细内容，更多请关注其它相关文章！