目前 schema 设计的是每台设备每天建一个 index,比如 iot_env_info_1_2020.02.07 ,id 是时间戳(@timestamp )。在 index template 里面 alias 所有 info_env_info*为 info_env_info 。
物联网比较常用的查询是显示设备最新一条数据。最简单查询就是按@timestamp
对 iot_env_info_1*排倒序,size=1,就完事了。
还有一种写法,是用_cat/indices/info_env_info_1*?format=json&s=index:desc,先看这个设备建立了哪些索引,按名称排倒序,取出第一个。然后对这个特定的索引按时间戳排倒序取出第一条。
理论上后者需要查询的数据更少,但是比较尴尬的是_cat 这个 API 不支持分页,取出的是全量索引,一年 365 天,存个几年之后这个返回数据量还是有点大,费内存…
个人对 es 的排序机制不是很明确,请教一下用第一种写法在数据量大的时候性能下降明显么?不太想做无谓的优化。
1
tairan2006 OP 当然最简单的还是直接缓存设备最新一条数据到 redis 里,这个就不用说了( ̄▽ ̄")
|
2
misaka19000 2021-02-07 13:44:55 +08:00
改成按月拆分索引
|
3
tairan2006 OP @misaka19000 这样也行,10 秒采集一次的话,单索引一个月也就 26 万左右,Emmm
|
4
misaka19000 2021-02-07 13:53:26 +08:00
@tairan2006 #3 才 26 万数据?那整一个索引得了
|
5
misaka19000 2021-02-07 13:53:49 +08:00
一个索引一年也才 300 万数据
|
6
luofan004 2021-02-07 13:55:42 +08:00
@misaka19000 +1
|
7
tairan2006 OP @misaka19000 拆分还要考虑方便删除旧数据,比如只给用户保留最近半年的数据…毕竟有的项目设备上千个
|
8
YouLMAO 2021-02-07 14:00:00 +08:00 via Android
物联网,opentsdb
|
9
est 2021-02-07 14:08:30 +08:00
看看 routing ?
|
10
Morriaty 2021-02-07 14:35:03 +08:00
再弄个 iot_hot 别名指向最近七天(具体时间看业务)不就行了吗,建议看下 es7 之后的 ILM 索引生命周期管理(冷热分离)
|
11
tairan2006 OP @Morriaty 需求是最新一条…有的设备可能好几天没数据(比如过年把设备断电了…)
|
12
tairan2006 OP @est 小厂,就一个副本…靠 routing 提高性能好像不太可行?
|
13
est 2021-02-07 16:29:32 +08:00
@tairan2006 看下上面说的那个 ILM 冷热分离。感觉有戏。
|
14
tairan2006 OP @est 这个我研究过 ,感觉最多用个 delete…
|
15
Morriaty 2021-02-07 17:26:51 +08:00
@tairan2006 #11 ilm 除了时间策略,还有 doc 数策略,超过多少条才触发 rollover
|
16
AS4694lAS4808 2021-02-07 17:37:48 +08:00
改成_cat/indices/info_env_info_1*?h=index&format=json&s=index:desc 这样呢?一年的索引名也就十多 KB
无脑方法,大神请无视 |
17
tairan2006 OP @Morriaty 嗯 物联数据其实还好 大部分采样周期是固定的,用时间没啥问题…
|
18
tairan2006 OP @AS4694lAS4808 我改成按月建 index 了,这样比较均衡。
|
19
AS4694lAS4808 2021-02-07 18:10:07 +08:00
@tairan2006 我公司用的 aws 双核 16G 的多个实例,每个索引几亿条 IOT 日志数据,查起来都挺快的。。其实第一种感觉可以放心的用
|
20
tairan2006 OP @AS4694lAS4808 那更好:-D
|
21
Anshay 2021-02-08 09:30:54 +08:00 via iPhone
这个业务需求,我的做法是根据时间拿到涉及到的索引传进去。因为是按天,不建议用别名。所有查询根据时间自动传入涉及索引。
我做的业务和贵司类似,踩过挺多坑。 |
22
strawberryBug 2021-02-08 11:46:11 +08:00
试试这种,创建索引的时候就倒序存储,这样倒序查询的时候就不会从最早的数据开始扫描。
PUT my-index-000001 { "settings": { "index": { "sort.field": "date", "sort.order": "desc" } } } 官网链接( https://www.elastic.co/guide/en/elasticsearch/reference/master/index-modules-index-sorting.html) |
23
lithium4010 2021-02-08 11:57:34 +08:00 via Android
够用的话越简单越好
|
24
tairan2006 OP @strawberryBug 这个我知道,和我想问的不冲突。这算是单个索引内的优化…
|