MySQL清除表空间碎片
引言
MySQL在数据表使用很长时间后,表上的B-Tree索引可能会碎片化,会降低查询的效率。碎片化的索引可能会以很差或者无序的方式存储在磁盘上,这时就需要对表进行碎片化整理。
碎片产生原因
1、表的存储会出现碎片化,每当删除了一行内容,该段空间就会变为空白、被留空,而在一段时间内的大量删除操作,会使这种留空的空间变得比存储列表内容所使用的空间更大;
2、当执行插入操作时,MySQL会尝试使用空白空间,但如果某个空白空间一直没有被大小合适的数据占用,仍然无法将其彻底占用,就形成了碎片;
3、当MySQL对数据进行扫描时,它扫描的对象实际是列表的容量需求上限,也就是数据被写入的区域中处于峰值位置的部分;
例:一个表有1万行,每行10字节,会占用10万字节存储空间,执行删除操作,只留一行,实际内容只剩下10字节,但MySQL在读取时,仍看做是10万字节的表进行处理,所以,碎片越多,就会越来越影响查询性能。
查看表碎片大小
1、查看某个表的碎片大小
1 | SHOW TABLE STATUS LIKE '表名'; |
结果中’Data_free’列的值就是碎片大小
2、列出所有已经产生碎片的表
1 | select table_schema db, table_name, data_free, engine |
清除表碎片
1、MyISAM表
1 | OPTIMIZE TABLE 表名; |
2、InnoDB表
1 | ALTER TABLE 表名 ENGINE INNODB; |
这其实是一个NULL操作,表面上看什么也不做,实际上重新整理碎片了。当执行优化操作时,实际执行的是一个空的 ALTER 命令,但是这个命令也会起到优化的作用,它会重建整个表,删掉未使用的空白空间。
Engine不同,OPTIMIZE 的操作也不一样。MyISAM 因为索引和数据是分开的,所以 OPTIMIZE 可以整理数据文件,并重排索引。如果针对 INNODB 的表做 OPTIMIZE TABLE 的操作,系统将返回:Table does not support optimize, doing recreate + analyze instead。
OPTIMIZE 操作会暂时锁住表,而且数据量越大,耗费的时间也越长。它毕竟不是简单查询操作,所以把 OPTIMIZE 命令放在程序中是不妥当的。不管设置的命中率多低,当访问量增大的时候,整体命中率也会上升,这样肯定会对程序的运行效率造成很大影响,比较好的方式就是做个shell,定期检查MySQL中 information_schema
.TABLES
字段,查看 DATA_FREE 字段,大于0话就表示有碎片。
建议
清除碎片操作会暂时锁表,数据量越大,耗费的时间越长,可以做个脚本,定期在访问低谷时间执行,例如每月1号凌晨,检查 DATA_FREE 字段,大于自己认为的警戒值的话,就清理一次。