V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
yyysuo
V2EX  ›  问与答

关于 RAC 所在服务器偶发性 ping 丢包的问题,请教各位大佬。

  •  
  •   yyysuo · 273 天前 · 458 次点击
    这是一个创建于 273 天前的主题,其中的信息可能已经有所发展或是发生改变。
    数据库 RAC
    2 节点,2 台物理机
    内存 192GB
    redhat 6.9

    应用 HA:
    2 节点,2 台物理机
    内存 192GB
    redhat 7.5

    现象:去年突然发现应用运行极缓慢,经排查是数据库的 2 个节点之间互 ping 丢包 50%以上,应用 ping 数据库 2 个节点丢包也在 50%以上,重启数据库节点网络服务后,问题立马解决。
    上周五又突然出现了此问题,重启数据库节点网络服务后,问题又解决了。

    排查:
    OS 日志无异常
    应用日志无异常。
    数据库不会查。
    问题发生时,4 台物理机,cpu 、内存均无压力。

    求问各位大佬,这种情况,应该往哪个方向排查?
    8 条回复    2023-07-31 00:12:35 +08:00
    RatioPattern
        1
    RatioPattern  
       273 天前
    交换机
    we6100
        2
    we6100  
       273 天前 via iPhone
    Ping 的话,最好不要是 vip 而且物理 ip ,也可以出问题的时候关一个节点试一下,是不是 Rac 的问题还是硬件问题
    yyysuo
        3
    yyysuo  
    OP
       273 天前
    @RatioPattern 现在的状态是系统受到监控的,不能随便停,有没有哪边的日志,或者一种技术手段,能够确认到出问题的环节?
    yyysuo
        4
    yyysuo  
    OP
       273 天前
    @we6100 忘记说另外一个情况了,把数据库关了依然是丢包的状态,重启一下网络立即就好,好上一年自己突然就坏了。
    we6100
        5
    we6100  
       273 天前 via iPhone
    @yyysuo 数据库只是 Rac 的一个资源,很有可能是 rac 有问题
    yyysuo
        6
    yyysuo  
    OP
       273 天前
    @we6100 可是我用的操作系统自己的 ping 呀,rac 不了解,会影响到系统的 ping 吗。
    RatioPattern
        7
    RatioPattern  
       272 天前
    @yyysuo 交换机支持 SNMP 的话可以用 SNMP 看下设备占用
    RatioPattern
        8
    RatioPattern  
       272 天前
    感觉可能网络风暴
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2791 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 15:18 · PVG 23:18 · LAX 08:18 · JFK 11:18
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.