1
zmal 2022-08-31 17:19:14 +08:00 1
这么多点击没人回答,估计是懒得回答吧,有点基础···
搜索下什么是“回表”。有 idx (`data_type`, `is_deleted` )时,where is_deleted = 0 AND data_type != 1 的 count(*)不需要回表,只通过索引就能完成统计。 区分度低的索引查询慢说的是有回表的情况。 |
2
sujin190 2022-08-31 17:34:51 +08:00 1
其实就是虽然都需要全表扫,但是你这个不需要查询除索引外的字段,所以直接在索引上统计就行,且不说索引数据量小了很多,而且大概率索引会在内存中,所以快一点很正常,你 SELECT 加个不在索引中的字段触发回表,你就会发现效率差不多了
区分度不高的列上加索引查询效率不明显,这个主要问题是这个字段添加过滤条件后,需要扫描的数据条数几乎和不加索引差距不大,所以并不能明显提高效率,更不要说你这个地方都没有添加任何过滤条件,无论怎么着都要扫描所有数据 |
3
rqxiao OP @zmal 不好意思 ,意思是 只要是走索引的 count(*) 就是比 全表扫描的 count(*) 快是吗。虽然两者有可能都是要找 5000w 条
|
4
rqxiao OP @sujin190 不好意思。意思是 count(*) 如果是 只走索引不回表 或者 全表扫描 ,虽然都有可能是 5000w 的记录数,但因为索引 b 树结构的特点(非叶子节点只存索引数据),和全表扫描比,走索引不回表这种情况明显的快是么。
|
5
ComTNT 2022-08-31 17:53:24 +08:00 2
推荐你本书,sql 优化核心原理,微信读书上有,第一章就能把你这个问题讲清楚,虽然这本书是基于 oralce 讲的,但是核心思想适用于大部分 db
|
7
sujin190 2022-08-31 17:59:33 +08:00 1
@rqxiao #4 是的,索引应该是只保存索引字段和主键的值,磁盘 IO 会少很多,而且一般来说索引应该会尽可能保存在内存中,这也可以快一点吧
|
8
LeegoYih 2022-08-31 18:07:39 +08:00
遇事不决看执行计划
set optimizer_trace="enabled=on"; select count(*) from tb_task where is_deleted = 0 and data_type != 1; select * from information_schema.optimizer_trace; set optimizer_trace="enabled=off"; |
9
CEBBCAT 2022-08-31 21:01:57 +08:00
这个排版真是无力吐槽……
|
10
LuckyLight 2022-08-31 22:05:45 +08:00
不得不说,很多文章都是误人子弟,不看实际场景就给结论都是耍流氓。“区分度不高的列上加索引 ,查询效率不明显” 也得看具体业务是什么。
|
11
GopherDaily 2022-08-31 23:51:35 +08:00
如果查询需要在字段都在 index 里面,可以避免回源。
用 Explain ,看到不理解的 google ,这是正道 |
12
reter 2022-09-01 00:02:41 +08:00 via Android
就我所看过数据库的文档,就算有了索引,数据库还会采集数据的元数据做辅助判断是否使用索引。用 explain 查看数据库实际的执行计划才是正解
|