V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
cmai
V2EX  ›  Kubernetes

K8S 中 Java 应用的 pod 发生 OOM,大家是如何保留 dump 文件并拿下来分析呢

  •  
  •   cmai · 2022-11-17 15:17:47 +08:00 · 1927 次点击
    这是一个创建于 498 天前的主题,其中的信息可能已经有所发展或是发生改变。
    7 条回复    2022-11-18 13:44:29 +08:00
    chendy
        1
    chendy  
       2022-11-17 15:21:54 +08:00   ❤️ 1
    dump 到某个 volume 里
    cmai
        2
    cmai  
    OP
       2022-11-17 17:23:50 +08:00
    @chendy 会不会多个应用出现互相覆盖 dump 文件的情况呢
    cmai
        3
    cmai  
    OP
       2022-11-17 17:28:12 +08:00
    或者 dump 到一半 pod 已经被杀死了
    mantou99
        4
    mantou99  
       2022-11-17 17:47:30 +08:00 via Android
    @cmai 会,kubernetes 的 resource limit 是管理集群分配资源的。OOM 了建议去测试环境找问题,毕竟 OOM 一般都不是突然就炸了,总有个过程
    swulling
        5
    swulling  
       2022-11-17 17:58:27 +08:00 via iPhone   ❤️ 2
    如果能稳定复现,可以在 prestop 阶段加 dump 命令。dump 到云盘或者 hostpath 。文件名可以用 hostname 拿到容器名称,加上时间戳就不会冲突

    之前参考过的一个例子
    https://gist.github.com/Pamir/79741ea098dcf473f61bcf45c3ff9b43
    swulling
        6
    swulling  
       2022-11-17 18:00:09 +08:00 via iPhone
    忘了说,这个需要配合一些 soft prevent oom 的方法。避免真的 oom 来不及 dump 。比如

    https://github.com/artsy/docker-preoomkiller
    cmai
        7
    cmai  
    OP
       2022-11-18 13:44:29 +08:00
    @swulling 多谢,我先了解一下
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2781 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 11:54 · PVG 19:54 · LAX 04:54 · JFK 07:54
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.