1
idontnowhat2say 149 天前
之前就 github 上搜 aiops 资料看的。看了感觉没什么用,很多公司基础的运维都做不好,上 aiops 就是为了 kpi ,专门做这个的岗位也少,还不如就专精 sre 。
|
2
RangerWolf 149 天前
我不是专业的运维,我是带研发团队跟运营团队的。我感觉 AIOps 里面,故障检测是一个非常有用的东西。而且最好不要让人去配置各种规则,真的配置不完,而且经常是宁愿多报不能漏报。
从另一个角度来看,把“异常点检测”的概念扩大一些,甚至不局限于运维领域,在很多运营领域里面也是通用的 我无法确定#1 的言论是否正确,但是我觉得 op 既然感兴趣,就各种渠道都打听打听、各种机会都试试看,不一定要 ops + AI ,各个细分领域都有运用 AI 的场景跟机会。 而且既然 op 本身就是专业的 SRE ,我相信你可以直接找各种机会试试看能不能 AIOps |
3
zhoudaiyu OP @RangerWolf 的确是,现在最难受的就是告警配阈值,然后业务变来变去,阈值也改来改去,弄错了就背锅吧
@idontnowhat2say 就像 2 楼说的,异常检测,还有根因分析,我觉得都是比较有用的,现在业务多变,数据多变,而且系统越来越复杂,传统运维配告警阈值越来越不好使了 |