百万数据量 MySQL 模糊搜索提速:如何在 512M 内存限制下优化查询速度?
百万数据量 mysql 模糊搜索提速
在 mysql 中,当数据量达到百万级时,执行模糊查询可能会变得非常缓慢。本文提供的解决方案无需借助第三方中间件,即可在 512m 的 java 堆内存限制下显着提升模糊搜索的速度。
基于索引表的方案
创建一个索引表,包含三列:"当前词"、"下一词"和"原记录主键 id"。其中,"当前词"和"下一词"表示搜索关键词中的连续单词,"原记录主键 id"指向满足条件的原始记录。
索引表结构
当前词 | 下一词 | 原记录主键 id |
---|---|---|
mysql | 一 | 1 |
一 | 千 | 1 |
千 | 万 | 1 |
万 | 的 | 1 |
... | ... | ... |
模 | 糊 | 1 |
糊 | 搜 | 1 |
搜 | 索 | 1 |
索 | null | 1 |
搜索算法
搜索关键词时,按顺序查询索引表,获得满足每个单词条件的原记录id。然后使用这些 id 在原始表中查找匹配记录。
例:搜索“模糊搜索”
SELECT 原记录主键ID FROM (SELECT 原记录主键ID FROM 索引表 WHERE 当前词 = '模' AND 下一词 = '糊') JOIN (SELECT 原记录主键ID FROM 索引表 WHERE 当前词 = '糊' AND 下一词 = '搜') USING(原记录主键ID) JOIN (SELECT 原记录主键ID FROM 索引表 WHERE 当前词 = '搜' AND 下一词 = '索') USING(原记录主键ID) JOIN (SELECT 原记录主键ID FROM 索引表 WHERE 当前词 = '索' AND 下一词 IS NULL) USING(原记录主键ID)
jvm 优化
为了充分利用有限的内存,建议使用如下的jvm 优化技术:
- 缩小永久代尺寸
- 设置metaspace 垃圾回收参数(-xx:metaspacesize、-xx:maxmetaspacesize)
- 使用压缩引用和指针
- 启用分代垃圾回收
以上就是百万数据量 MySQL 模糊搜索提速:如何在 512M 内存限制下优化查询速度?的详细内容,更多请关注其它相关文章!