事情的起因是線上日志發現的mysql慢查詢。100萬數據量的標准,聯合查詢全部走索引的情況下,盡然要600多毫秒。很不解,但是將索引列由varchar(50)型改為bigint型後,數據提升了30倍。究其原因就索引樹上搜索時要進行大量的比較操作,而字符串的比較比整數的比較耗時的多。
所以建議一般情況下不要在字符串列建立索引,如果非要使用字符串索引,可以采用以下兩種方法:
1.只是用字符串的最左邊n個字符建立索引,推薦n<=10;比如index left(address,8),但是需要知道前綴索引不能在order by中使用,也不能用在索引覆蓋上。
2.對字符串使用hash方法將字符串轉化為整數,address_key=hashToInt(address),對address_key建立索引,查詢時可以用如下查詢where address_key = hashToInt(‘beijing,china’) and address = ‘beijing,china’;
例子
我在下列語句中發現了一個問題:
select * from region where city like "任丘%" limit 10;
select * from region where city like "商丘%" limit 10;
這兩個語句的結果是一樣的,
類似的情況如下:
select * from region where city like "臨安市%" limit 10;
select * from region where city like "六安市%" limit 10;
臨海市 龍海市
棗陽市 益陽市
溫州市 梧州市