回表查询为什么是随机 I/O?
回表查询为何是随机 i/o
很多人误以为回表查询是顺序 I/O,因为我们已知所查记录的主键,从而可以定位到对应记录的磁盘位置。但实际上这是错误的。
顺序 I/O 和随机 I/O 的关键区别在于数据布局。顺序 I/O 指的是数据紧密相邻地存储在一起,而随机 I/O 则指数据分散在不同的位置。绝大多数硬盘数据库使用 B+ 树作为索引,且 B+ 树中的页是在硬盘上随机分布的。因此,当需要读取多个页时,几乎总是需要随机 I/O。
以 MySQL Innodb 为例,每个页的大小为 16KB,而页在硬盘上的位置是随机的。当需要跨页查询时,磁头需要进行多次定位操作。因此,涉及多个页的查询被认为是随机 I/O。
相比之下,Hbase 的页大小为 64MB,比 MySQL 大了 4000 倍。Hbase 使用 LSM 树,这种数据结构充分利用了硬盘的顺序读写特性,从而提高了查询性能。
因此,回表查询虽然利用了索引信息,但由于涉及多个随机分布的页,仍然被视为随机 I/O。
以上就是回表查询为什么是随机 I/O?的详细内容,更多请关注其它相关文章!